Die Namen der Elemente, die Sie extrahieren möchten, sind nicht immer sofort ersichtlich. Wir haben die häufigsten Szenarien aufgeführt.
Sie definieren in Ihrem Content-Profil für Word unter Extraktion, wie Acrolinx Elemente extrahieren soll.
-
-
Titel
-
Fett, kursiv und unterstrichen
-
Textfarbe
-
Texthervorhebung
-
Hoch- oder tiefgestellte Zeichen
-
Sie können Titel und Inhalte mit einem bestimmten Stil extrahieren. Dazu gehören Überschriften, typografische Hervorhebungen, Textfarbe, farbige Hervorhebungen, hochgestellte Schrift und benutzerdefinierte Stile.
Titel
So schließen Sie einen Titel aus:
-
Geben Sie unter Elementname
Title
ein. -
Wählen Sie im Filtermodus leer aus.
Um einen bestimmten Titelstil zu extrahieren, verwenden Sie das Attribut Elementname.
So schließen Sie z. B. „Heading 1“ aus:
-
Geben Sie unter Elementname
* name=”heading 1”
ein. -
Wählen Sie im Filtermodus leer aus.
Fett, kursiv und unterstrichen
Sie können b
, i
und u
nutzen, um fett gesetzten, kursiven und unterstrichenen Text auszuschließen.
Folgen Sie diesen Schritten:
-
Geben Sie unter Elementname
b
,i
oderu
ein. -
Wählen Sie im Filtermodus leer aus.
Textfarbe
Sie können jeden beliebigen RGB-Wert für die Extraktion auswählen.
So schließen Sie eine Textfarbe aus:
-
Geben Sie unter Elementname
color val=RGB
ein. Für Rot wäre es zum Beispiel:color val=FF0000
-
Wählen Sie im Filtermodus leer aus.
Texthervorhebung
Sie können die folgenden Farben für die Texthervorhebung extrahieren: black, blue, cyan, darkBlue, darkCyan, darkGray, darkGreen, darkMagenta, darkRed, darkYellow, green, lightGray, magenta, red und white.
So schließen Sie eine Hervorhebung aus:
-
Geben Sie unter Elementname
highlight val=
gefolgt von der entsprechenden Farbe ein. Für Gelb wäre das z. B.:highlight val=yellow
-
Wählen Sie im Filtermodus leer aus.
Hoch- oder tiefgestellte Zeichen
So extrahieren Sie hoch- oder tiefgestellte Zeichen:
-
Geben Sie unter Elementname
vertAlign val=superscript
odervertAlign val=subscript
ein. -
Wählen Sie im Filtermodus leer aus.
Warnung
Beachten Sie, dass das Extrahieren der Schriftart nur funktioniert, wenn Acrolinx die entsprechenden Informationen im Inhalt finden kann. Word stellt keine Informationen zur Standardschrift über den Inhalt bereit. Deshalb kann Acrolinx keine Informationen zu Ihrer eingestellten Standardschrift extrahieren. Microsoft legt Calibri als Standardschrift fest.
Um bestimmte Schriftarten zu extrahieren, müssen Sie den Elementnamen rFonts
und das Attribut für die jeweilige Schriftartengruppe verwenden:
-
ascii
(ASCII Font) -
cs
(Complex Script Font) -
hAnsi
(High ANSI Font) -
eastAsia
(East Asian Font)
Um eine Schriftart zu extrahieren, müssen Sie jede Schriftartengruppe angeben.
So schließen Sie z. B. Content mit der Schriftart „Courier New“ aus:
-
Geben Sie unter Elementname folgende Elementnamen und Attribute ein:
rFonts ascii=”Courier New”
rFonts cs=”Courier New”
rFonts hAnsi=”Courier New”
rFonts eastAsia=”Courier New”
-
Wählen Sie im Filtermodus leer aus.
Auf Kommentare können Sie durch mehrere Elementnamen verweisen. Dazu zählen:
-
comments
-
comment
-
noProof
(alle Inhalte, die Word nicht prüft)
Wenn Sie Ihre Extraktion auf Startelement: ausschließen setzen, prüft Acrolinx Ihre Kommentare nicht standardmäßig. Sie müssen sie dann explizit einbeziehen.
So beziehen Sie Kommentare ein:
-
Geben Sie unter Elementname
comment
ein. -
Wählen Sie im Filtermodus einschließen aus.
Für die Extraktion eines Inhaltsverzeichnisses gibt es keinen perfekten Weg. Sie haben aber folgende Optionen:
Sie können noProof
verwenden. Dies betrifft allerdings alle noProof-Inhalte, nicht nur Ihr Inhaltsverzeichnis.
Sie können das Inhaltsverzeichnis z. B. anhand seines Stils extrahieren. Die gebräuchlichsten Stile für ein Inhaltsverzeichnis sind „toc 1“ und „toc 2“.
So schließen Sie ein Inhaltsverzeichnis über sein Stilattribut aus:
-
Geben Sie unter Elementname
* name=”toc 1”
ein. -
Wählen Sie im Filtermodus leer aus.
Wenn Sie Ihre Extraktion auf Startelement: ausschließen setzen, prüft Acrolinx Ihre Kopf- und Fußzeilen nicht standardmäßig. Sie müssen sie dann explizit einbeziehen.
Dies sind die benötigten Elementnamen:
-
Kopfzeilen (Headers):
hdr
-
Fußzeilen (Footers):
ftr
So beziehen Sie Kopfzeilen ein:
-
Geben Sie unter Elementname
hdr
ein. -
Wählen Sie im Filtermodus einschließen aus.
So beziehen Sie Fußzeilen ein:
-
Geben Sie unter Elementname
ftr
ein. -
Wählen Sie im Filtermodus einschließen aus.