Datenanalysen sind nur dann sinnvoll, wenn Ihre Daten korrekt sind. Dies gilt insbesondere, wenn Sie benutzerdefinierte Felder haben. Benutzerdefinierte Felder werden jedoch nicht immer richtig ausgefüllt. Sie können Acrolinx so konfigurieren, dass es Daten aus Ihrem Dokument extrahiert und Ihre benutzerdefinierten Felder automatisch ausfüllt. Ganz ohne menschliches Zutun.
Angenommen, Sie haben benutzerdefinierte Felder für „Product“ und „Department“, die für jedes zu prüfende Dokument ausgefüllt werden müssen. Sie können Acrolinx so konfigurieren, dass diese Felder bei einer Prüfung automatisch ausgefüllt werden. Diese Funktion ist nur in strukturierten Dokumenten verfügbar. Ein geeignetes Dokument ist z. B. ein XML-Dokument, das im Kopfbereich die Attribute „Product“ und „Department“ aufweist. In diesem Fall würden Sie XPath-Ausdrücke für Ihre benutzerdefinierten Felder schreiben, damit Acrolinx weiß, wo die relevanten Daten zu finden sind.
Um automatisches Datenmapping zu konfigurieren, folgen Sie diesen Hauptschritten:
Wie in der Einleitung erwähnt, können Sie Daten für benutzerdefinierte Felder wie „Product“ und „Department“ aus Ihren Dokumenten extrahieren. Diese Funktion ist nur für Felder auf Dokumentebene verfügbar, da die Daten auf Dokumentebene für andere Feldtypen nicht besonders nützlich sind. Bevor Sie mit dem Erfassen von Daten beginnen, stellen Sie sicher, dass Ihre Felder auf Dokumentebene so konfiguriert sind, dass sie diese Daten empfangen.
So konfigurieren Sie benutzerdefinierte Felder, dass sie Daten aus Ihrem Content empfangen:
-
Navigieren Sie zu Analytics > Administration > Benutzerdefinierte Felder. Wählen Sie die Registerkarte DOKUMENTE aus.
-
Wählen Sie in der Spalte Eingabetyp für jedes relevante Feld die Option Aus Content aus.
-
-
Das Feld ist noch nicht vorhanden? Klicken Sie auf FELD HINZUFÜGEN. Wählen Sie als Eingabetyp Aus Content aus.
-
Nachdem Sie Ihre Felder eingerichtet haben, können Sie für den nächsten Schritt zum Abschnitt Content-Profile übergehen.
-
Öffnen Sie das Content-Profil für Ihren gewünschten Dokumenttyp.
Sie können z. B. Daten aus HTML-Meta-Tags extrahieren. Angenommen, Sie haben bereits ein Content-Profil für HTML-Dateien mit dem Namen „Published HTML“. Öffnen Sie das Content-Profil. Wählen Sie die Registerkarte DOKUMENTINFORMATION aus. Hier sollten Sie die Felder sehen, die Sie im vorherigen Schritt konfiguriert haben. Wenn Sie z. B. die Felder „Product“ und „Department“ konfiguriert haben, sollten sie nun auf der Registerkarte DOKUMENTINFORMATION erscheinen.
-
Geben Sie im Feld „Ort“ einen XPath ein, der definiert, wo Ihre Daten zu finden sind.
Angenommen, Sie möchten den Produktnamen aus dem folgenden Meta-Tag extrahieren.
<meta name="Product.Name" content="Widget Detection API">
In diesem Fall würden Sie den folgenden XPath eingeben.
//meta[@name="Product.Name"]/@content
Ihre Änderungen werden sofort wirksam.
Die folgende Tabelle enthält weitere XPaths für verschiedene Dateiformate.
Dokumenttyp |
Ziel-Content |
Entsprechender XPath |
---|---|---|
DITA |
Der Titel des Topics im folgenden Codeblock. <!DOCTYPE topic PUBLIC "-//OASIS//DTD DITA Topic//EN" "topic.dtd"> <topic id="topic_hdx_w2s_2p"> <title>git: Distributed and Shared Access to Content</title> |
/topic/title |
HTML |
Der Dokumentname im folgenden Codeblock. <meta name="Product.Version" content="Version 6.2.173"> <meta name="Document.Name" content="Widget Detection API Developer's Guide"> <meta name="Document.Id" content="192893721"> <meta name="Date.Created" content="2019/2/1, 16:08 (GMT)"> |
//meta[@name="Document.Name"]/@content |
Sie haben Ihr benutzerdefiniertes Feld eingerichtet. Nun sollten Sie schauen, ob es funktioniert!
So testen Sie Ihre Datenmapping-Konfiguration:
-
Prüfen Sie ein Dokument, das dem Content-Profil entspricht.
Wenn Sie z. B. gerade das Content-Profil „Published HTML“ bearbeitet haben, bietet sich eine auf Ihrer Website veröffentlichte HTML-Datei an.
Öffnen Sie nach der Prüfung die Scorecard. Überprüfen Sie, ob das angezeigte Content-Profil dasjenige ist, das Sie gerade aktualisiert haben.
-
Öffnen Sie das Dashboard. Navigieren Sie zu Analytics > Scorecard-Archiv.
-
Wählen Sie im Dashboard für das Scorecard-Archiv Ihre field:value-Kombination im Feldfilter aus.
Angenommen, Sie haben ein Dokument mit folgendem Meta-Tag geprüft:
<meta name="Product.Name" content="My Test Product">
Sie möchten nachsehen, ob Acrolinx den Wert „My Test Product“ korrekt extrahiert hat. In diesem Fall würden Sie im Feldfilter nach „Product: My Test Product“ suchen.
Der folgende Screenshot zeigt, wie der Feldfilter aussieht, wenn Daten erfolgreich aus diesem Meta-Tag extrahiert wurden:
Wenn Sie auf den Filterwert klicken, sollten Sie die Scorecard für die gerade geprüfte Datei sehen. Das bedeutet, dass Ihre Daten korrekt extrahiert werden. Acrolinx erkennt automatisch den Produktnamen aus den Metadaten im Dokument.
Wenn Ihre Ergebnisse anders als erwartet sind, prüfen Sie die Extraktionseinstellungen im Content-Profil. Acrolinx kann keine Daten aus Elementen extrahieren, die ausgeschlossen oder ignoriert sind.