Damit Acrolinx Ihren Web-Content bewerten kann, muss es prüfbaren Text auf Ihrer Website identifizieren. Dazu verwendet Acrolinx einen Crawler mit dem User-Agent „Acrolinx-bot“. Acrolinx-bot durchsucht einmal pro Woche automatisch alle Domains in Ihrer Bibliothek. Dies wird als „Weekly Run“ bezeichnet. Das Update beginnt freitags um 00h00m00s Eastern Time (Nordamerika).
Acrolinx-bot greift für die Dauer eines Crawlvorgangs bis zu 10 Mal pro Sekunde auf Ihre Website zu. Dabei fordert er Informationen über alle internen Seiten an, auf die er Zugriffsrechte hat, mit einer Tiefe von 15 Seiten. Die „Tiefe“ bezieht sich in diesem Fall auf die Klicks von der Startseite aus. Folgende Seiten können enthalten sein:
-
HTML-Seiten in der Site-Struktur für Ihre Domains
-
HTML-Seiten in Subdomains
-
Seiten mit einem HTTP-Fehlerstatus (z. B. 404)
Wenn Acrolinx-bot innerhalb einer bestimmten Tiefe keine neuen Links findet oder alle Seiten innerhalb der eingestellten Crawltiefe gecrawlt hat, wird der Crawlvorgang beendet.
Einige Organisationen verweigern Crawlern den Zugang zu ihren Websites. Wenn Sie feststellen, dass Acrolinx-bot Ihre Website nicht crawlen kann, bitten Sie Ihr IT-Team, Acrolinx-bot in die Zulassungsliste des Unternehmens aufzunehmen.
Hinweis
In einigen Fällen wird Ihre IT-Abteilung die mit dem Crawler verbundene IP-Adresse anfordern. Wenden Sie sich für diese Informationen bitte an den Acrolinx Support.