Wenn Sie mit den Besonderheiten des Web-Crawling vertraut sind, können Sie Ihr Crawling mit den erweiterten Crawl-Einstellungen in Content Cube anpassen. Diese sind nützlich, wenn Sie nur bestimmte Teile Ihrer Website verfolgen wollen. Es ist auch eine gute Ressource, wenn Acrolinx während eines Crawlvorgangs auf Schwierigkeiten stößt.
So fügen Sie erweiterte Crawl-Einstellungen hinzu:
-
Gehen Sie zu Reporting > Content Cube settings > Web crawling.
-
Für eine neue Domain oder Subdomain klicken Sie auf Add new domain.
-
Für eine bestehende Domain oder Subdomain klicken Sie auf Edit crawl settings neben dem Domain-Namen.
-
-
Wählen Sie die Einstellungen aus, die Sie auf Ihren Crawl anwenden möchten:
Konfiguration
Beschreibung
Never crawl URLs with query parameters
Schaltet die Option zur Angabe von Abfrageparametern aus. Standardmäßig aktiviert.
Only crawl URLs with these query parameters
Geben Sie die Abfrageparameter an, die der Acrolinx-Bot crawlen soll.
Never crawl URLs with these query parameters
Geben Sie die Abfrageparameter an, die der Acrolinx-Bot ignorieren soll.
Respect
nofollow
tagsDer Acrolinx-Bot ignoriert
nofollow
-Direktiven und crawlt diese Seiten.Respect
noindex
tagsDer Acrolinx-Bot ignoriert
noindex
-Direktiven und crawlt diese Seiten.Follow alternates
Der Acrolinx-Bot crawlt alle Links, die als „alternate“ aufgeführt sind.
Turn on AJAX crawling
Der Acrolinx-Bot crawlt AJAX-Anwendungen.
Follow canonicals
Der Acrolinx-Bot crawlt alle URLs, die in kanonischen Tags erwähnt werden.
Turn on JavaScript crawling
Der Acrolinx-Bot crawlt JavaScript-gerenderte Inhalte.
Follow HTTP redirects (3xx)
Der Acrolinx-Bot crawlt jede Seite in der Weiterleitungskette einer Seite.
Turn on mobile crawling
Der Acrolinx-Bot identifiziert sich als mobiles Gerät.
Anmerkung
Der Acrolinx-Bot identifiziert sich standardmäßig als Desktop-Gerät.
Follow links on error pages (4xx and 5xx)
Der Acrolinx-Bot crawlt alle Links auf 4xx- und 5xx-Fehlerseiten.
Crawl behind sign-in
Geben Sie die Anmeldedaten für die HTTP-Basisauthentifizierung für eine passwortgeschützte Website an, die der Acrolinx-Bot crawlen soll.
Custom request headers
Geben Sie alle Authentifizierungs-Header an, die der Acrolinx-Bot für den Zugriff auf Ihren Content benötigt.
-
Klicken Sie auf Save, um das Crawling zu starten.