Was ist Annotation?

Annotation im Bereich der Künstlichen Intelligenz und des Machine Learning umfasst die Kategorisierung und das labeln von Datensätzen zur Verarbeitung durch eine Maschine beziehungsweise ein Neuronales Netz. Es gibt zahlreiche Varianten, die sich aus der Natur der zur Verfügung stehenden Datensätze ergeben.

Wofür ist die Annotation wichtig?

Damit ein neuronales Netz oder ein Machine Learning-Modell valide Entscheidungen treffen kann, muss es zuvor mithilfe von großen Datensätzen trainiert worden sein. Bei diesen Datensätzen wiederum muss zuvor sichergestellt werden, dass sie a) für den zu trainierenden Bereich valide Informationen enthalten und b) überhaupt maschinell erfassbar sind.

Damit beispielsweise eine Neuronales Netz bei der Erkennung und Unterscheidung von Tumoren im menschlichen Körper als Unterstützung oder als Selektierer eingesetzt werden kann, muss es die Erkennung anhand hunderter oder tausender echter Röntgen- MRT- oder CT-Aufnahmen erlernen. Dazu muss dem System allerdings vorab bekannt sein, wann es bei einer Einordnung richtig lag, und wann nicht.

Daher müssen jene Datensätze vorab unabhängig geprüft worden sein. Hierbei kommen oft Menschen ins Spiel, welche die Daten per Hand in verschiedene Kategorien sortieren und mit Schlüsselwörtern versehen.

Welche Formen der Annotation gibt es?

Text

Am verbreitetsten ist jene von Text. Hierbei lassen sich einige Unterkategorien identifizieren. So gibt es die emotional fokussierte Kategorisierung, bei der es darum geht, Text hinsichtlich enthaltener oder indirekt kommunizierter Einstellungen, Meinungen und Gefühle zu kategorisieren. So könnten Machine Learning Systeme beispielsweise auf die Filterung profaner Sprache oder jugendgefährdender Inhalte trainiert werden.

Des Weiteren gibt es Einteilungsvorgänge hinsichtlich der Absicht eines Textes. Dabei betrifft es die Frage, welches Ziel ein Kommunikator mit seinem Kommunikat verfolgt. Bei der Mensch-Maschine-Kommunikation tritt hier besonders der für Menschen leicht zu identifizierende Subtext in den Vordergrund, der allerdings für Computersysteme oft schwer herauszufiltern ist, weshalb eine Erstellung von Trainingsdaten mit menschlicher Hilfe meist unabdingbar ist.

Semantische Annotation hingegen beschreibt die Bedeutung eines Textinhaltes detaillierter, sodass Neuronale Netze Inhalte besser differenzieren lernen. Ein Anwendungsbereich wäre dann die computergestützte Suche in Online-Shops, sodass Kunden bereist mit Umschreibungen von Artikeln, deren genaue Bezeichnung sie nicht kennen, Vorschläge erhalten.

Audiodaten

Neben textbasierten Inhalten spielt auch die Kategorisierung von Audiodaten eine Rolle. Zeitstempel oder Transkriptionen, Intonations-Einordnungen oder die Identifikation von Sprache, Dialekt und demografischen Merkmalen können so zu Trainingsdaten führen, die ohne Annotation für maschinelles Lernen unzugänglich wären.

Bilder

Ein weiterer Bereich ist die Einstufung von Bildern: nicht nur für computergestützte Fahrassistenten ist die Erkennung von Personen, Straßenschildern oder Hindernissen unabdingbar. Auch in der Robotik ist Gesichtserkennung oder Gefahreneinschätzung von Bedeutung. Die Bild-Annotation verhilft hier durch das Versehen mit Schlüsselwörtern, Bildbeschreibungen und Ähnlichem zu brauchbaren Trainings-Datensätzen.

Video

Eine Art Unterkategorie der Bild- ist die Video-Annotation, die zusätzlich noch einen temporalen Aspekt beinhaltet: sich bewegende Objekte in Sicht zu behalten, Pixelbereiche als Objekte zu erkennen und die Objekte in Kategorien einzuordnen, hierfür ist die menschengestützte Datenverarbeitung von Videomaterial unabdingbar, wobei mitunter Bild-für-Bild vorgegangen wird, Bereiche von Interesse markiert und im Zeitverlauf nachverfolgt werden.