Um Web-Inhalte mit dem Content Analyzer zu prüfen, geben Sie die zu prüfenden URLs ein und passen einige Konfigurationen an. Hier beschreiben wir diese Konfigurationen sowie häufige Anwendungsfälle. Sie zeigen Ihnen, wie Sie den Content Analyzer zur Prüfung von Web-Content einsetzen können.
Konfiguration |
Beschreibung |
---|---|
Ungefähre Seitenanzahl |
Diese Konfiguration definiert, wie viele Seiten der Content Analyzer ungefähr importiert, bevor die Suche gestoppt wird. |
Maximale Linktiefe |
Die Linktiefe ist die Anzahl an Verknüpfungen, die zwischen jeder URL und einer Webseite liegen. Wenn Sie z. B. 0 eingeben, prüft der Content Analyzer nur die eingegebene Seite. Wenn Sie 1 eingeben, folgt der Content Analyzer der eingegebenen Seite und allen Seiten, die dort verlinkt sind. AchtungWenn bei einer URL eine Weiterleitung zu einer anderen Adresse vorliegt, wird diese Weiterleitung als eine Ebene in der Linktiefe behandelt. Wenn z. B. die Startadresse eine Weiterleitung zu einer anderen Adresse ist und Sie eine Linktiefe von 1 konfiguriert haben, interpretiert der Content Analyzer die Weiterleitung als eine Ebene und folgt keinen weiteren Verknüpfungen. |
Seiten erlauben |
Sie können genau definieren, welche Seiten beim Durchsuchen der ausgewählten Website eingeschlossen werden sollen. Geben Sie die Stichwörter ohne Leerzeichen vor und hinter dem Wort ein. Trennen Sie die Keywords mit dem Symbol Wenn Sie z. B. alle Kontakt- und Event-Seiten einschließen möchten, geben Sie Folgendes ein: Beispiel contact|events TippBeachten Sie: „Seiten erlauben“ funktioniert am besten, wenn die Website das Crawlen aller Verzeichnisse erlaubt. Manche Websites erlauben kein Crawlen von Subdomains. Diese Seiten kann der Content Analyzer dann nicht laden. |
Sie können genau definieren, welche Seiten beim Durchsuchen der ausgewählten Website ausgeschlossen werden sollen. |
Sie können genau definieren, welche Seiten beim Durchsuchen der ausgewählten Website ausgeschlossen werden sollen. AchtungSeiten, die ausgeschlossen werden, haben Vorrang vor Seiten, die erlaubt sind. |
Angenommen, Sie möchten ca. 20 Seiten einer Website prüfen.
In diesem Fall gehen Sie so vor:
-
Geben Sie eine URL in das URL-Listenfeld ein, z. B. „https://www.acrolinx.com/“.
-
Im Feld Ungefähre Seitenanzahl wählen Sie 20 aus.
Sie können als maximale Linktiefe auch eine bestimmte Zahl festlegen, um die Suche auf eine Anzahl von Links zu beschränken. Beachten Sie: Bei einer maximalen Linktiefe von 0 ignoriert der Content Analyzer alle Links und durchsucht ausschließlich die angegebene URL.
Hinweis
Die ungefähre Seitenanzahl ist nur eine Schätzung. Das heißt, die Ergebnisse weichen von der angegebenen Zahl ab.
Wenn Sie nur bestimmte Seiten einer Website prüfen möchten – z. B. 5 Seiten auf „https://www.acrolinx.com/“ –, gehen Sie so vor:
So prüfen Sie nur bestimmte Seiten einer Website:
-
Geben Sie die 5 URLs in das URL-Listenfeld ein.
-
Im Feld Ungefähre Seitenanzahl wählen Sie 0 aus.
Diese Einstellung stellt sicher, dass 1 Seite pro URL zurückgegeben wird.
-
Im Feld Maximale Linktiefe wählen Sie 0 aus
Diese Einstellung verhindert, dass der Content Analyzer Links auf jeder Seite folgt.
Hinweis
Der Content Analyzer ignoriert Duplikate, tote Links (404) oder unerreichbare Links, ohne eine Fehlermeldung anzuzeigen. Das heißt, die Ergebnisliste entspricht nicht unbedingt der Anzahl der angegebenen URLs.
Angenommen, Sie möchten nur URLs mit einem bestimmten Ausdruck prüfen. Sie sind z. B. nur am Acrolinx-Blog interessiert.
Achtung
Der Ausdruck sollte in der URL und nicht im Domänennamen stehen.
So finden Sie die entsprechenden Seiten:
-
Geben Sie im URL-Listenfeld „https://www.acrolinx.com/“ ein.
-
Im Feld Seiten erlauben geben Sie „blog“ ein.
-
Setzen Sie die ungefähre Seitenanzahl auf 0 (außer Sie möchten die Ergebnisse einschränken).
Wenn Sie eine Webseite, deren URL das Wort „blog“ enthält, nicht in die Prüfung einbeziehen wollen, geben Sie das Wort „blog“ im Feld Seiten ausschließen ein. Der Content Analyzer lädt dann alle Seiten der Website, deren URL nicht das Wort „blog“ enthält.
Tipp
„Seiten erlauben“ funktioniert am besten, wenn die Website das Crawlen aller Verzeichnisse erlaubt. Manche Websites erlauben kein Crawlen von Subdomains. Diese Seiten kann der Content Analyzer dann nicht laden.