Wenn Sie Content zu einer Sammlung hinzufügen, visualisiert Acrolinx jede Content-Seite mit einer detaillierten Content-Karte. Auf jeder Karte sehen Sie einen Seitentitel und den entsprechenden Acrolinx Score. In manchen Fällen werden Ihre Seitentitel auf Ihren Content-Karten jedoch nicht korrekt angezeigt. Zum Beispiel könnte ein Titel als „Unknown“ aufgeführt sein.
Um sicherzustellen, dass der bevorzugte Seitentitel auf jeder Karte erscheint, können Sie in der Admin Console eine benutzerdefinierte Extraktion festlegen.
Acrolinx scannt standardmäßig nach den Tags h1
, h2
und title
. Wenn Sie feststellen, dass die Standardeinstellungen nicht die richtigen Seitentitel extrahieren, können Sie für verschiedene Teile Ihrer Website benutzerdefinierte XPath-basierte Extraktionseinstellungen definieren.
Dies tun Sie unter Title Extraction > Set Title Extraction. Alle benutzerdefinierten Einstellungen, die Sie vornehmen, setzen die Standardeinstellungen außer Kraft.
So stellen Sie die benutzerdefinierte Titelextraktion in Content Cube ein:
-
Gehen Sie zu Profile and settings > Admin Console > Advanced.
-
Fügen Sie unter Title Extraction > Set Title Extraction Ihre bevorzugten Titelextraktionseinstellungen zu den folgenden Spalten hinzu:
Spalte
Beschreibung
Priority
Auf jeder Seite beginnt Content Cube mit den Einstellungen in der ersten Zeile der Titelextraktionstabelle. Es wendet den ersten XPath an, dessen URL-Muster mit der URL der Seite übereinstimmt. Spezifischere Einstellungen müssen in der Tabelle weiter oben stehen als allgemeinere Einstellungen.
ID
Eindeutiger interner Bezeichner für jede Extraktionseinstellung.
URL Pattern
Regulärer Ausdruck, der auf die URL der Seite angewendet wird. Bei einer Übereinstimmung wird die zugehörige XPath-Titelquelle für die Seite ausgewertet.
Title Source
Ein XPath-Ausdruck, der einen oder mehrere Knoten auf der Seite auflöst (z. B.
title
oderh1
). Wenn eine Liste von Knoten aufgelöst wird, wird der erste Knoten verwendet, der nicht leeren Text enthält.Wenn Sie mehrere Extraktionen hinzufügen möchten, klicken Sie für jede neue Einstellung auf Add New.
Anmerkung
In den meisten Fällen sind die Extraktionseinstellungen wahrscheinlich recht einfach. Zum Beispiel:
-
Verwende das erste Titelelement:
//title
-
Wenn „h1“ nicht funktioniert, verwende „title“:
//h1 | //title
-
-
Optional: Testen Sie Ihre Titelextraktion.
-
Klicken Sie auf Save.
Bevor Sie Ihre Einstellungen für die Titelextraktion speichern, können Sie sie testen. Dies können Sie auf der Registerkarte Test Title Extraction tun.
So testen Sie Ihre Extraktionseinstellungen:
-
Gehen Sie zu Admin Console > Advanced > Title Extraction.
-
Öffnen Sie die Registerkarte Test Title Extraction. Dort sehen Sie die folgenden Spalten:
Spalte
Beschreibung
Page URL
URL für die Seite, deren Titel Sie extrahieren möchten.
Outer HTML
Um den HTML-Code von mit Javascript gerenderten Apps zu erfassen, müssen Sie die Seite mit den Entwicklertools ansehen und den HTML-Code von dort kopieren:
-
Öffnen Sie die Seite, die Sie testen möchten, in Google Chrome.
-
Klicken Sie mit der rechten Maustaste auf eine beliebige Stelle der geöffneten Seite.
-
Klicken Sie im Pop-up-Menü auf Untersuchen. Klicken Sie dann mit der rechten Maustaste auf das
html
-Element, das Ihren Titel enthält. Wählen Sie Kopieren > outerHTML kopieren.
Extracted Title
Titel, der auf der Grundlage Ihrer Einstellungen aus dem outerHTML extrahiert wird.
Mapping ID
Gibt an, welche Regel zur Extraktion des Titels angewendet wurde. Sie kann:
-
mit einer ID in der Registerkarte Set Title Extraction übereinstimmen oder
-
ein „Fallback“ sein, was bedeutet, dass die Standardextraktion angewendet wird.
-
-
Fügen Sie die URL der Seite, von der Sie den Titel extrahieren möchten, in die Spalte Page URL ein.
-
Fügen Sie einen Ausschnitt aus dem outerHTML der Seite in die Spalte Outer HTML ein.
-
Klicken Sie auf Run.
Nachdem Sie auf Run geklickt haben, sehen Sie einen Titel und eine Mapping ID in den Spalten Extracted Title und Mapping ID. Zum Beispiel: