Natural Language Processing (NLP): Natürliche Sprache für Maschinen

von Michaela Tiedemann | 16. Juni 2020 | Grundlagen

Die natürliche, gesprochene Sprache des Menschen ist der direkteste und einfachste Weg zur Kommunikation und zum Austausch zwischen Menschen. Wenn wir mit Maschinen kommunizieren wollen, brauchen wir technische Hilfsinstrumente wie Mäuse, Trackpads, Tastaturen oder ähnliches. Eine Alternative dazu bietet Natural Language Processing.

Neben unserer natürlichen Sprache haben wir Programmiersprachen und Codes entwickelt. Programmiersprachen sind zwar auch Sprachen, aber im Gegensatz zur natürlichen Sprache, sind sie den meisten Menschen nicht geläufig und nicht intuitiv verständlich. Aus diesem Grund stand schon sehr früh in der Geschichte der Entwicklung von Schnittstellen zwischen Menschen und Maschinen die natürliche Sprache im Fokus. Daraus entwickelte sich ein ganzer Forschungs- und Entwicklungsbereich: Natural Language Processing – oder kurz: NLP.

Inhaltsverzeichnis

Was ist Natural Language Processing?

Natural Language Processing – oder kurz: NLP – ist als Fach zwischen der klassischen Linguistik und Computerwissenschaften anzusiedeln. Fachwissen aus beiden Bereichen musste zusammenkommen, um wesentliche Fortschritte zu erzielen. Denn einerseits ist es notwendig, die formale Struktur der natürlichen Sprachen zu verstehen und andererseits ist diese Funktionsweise auf technische Systeme zu übertragen. An vielen Universitäten gibt es inzwischen darum dafür einen eigenständigen Fachbereich: die Computerlinguistik.

NLP baut damit auf einem Sprachverständnis auf, das Sprache in mehrere Ebenen unterteilt. Wobei die Analyse der natürlichen Sprache immer von der kleinsten, „bedeutungsunterscheidenden“ Einheit ausgeht. Aus dem Vergleich dieser Einheiten entsteht nach und nach ein logisches System, das eine natürliche Sprache beschreibt. Die zwei Wörter „Haus“ und „Maus“ entscheiden sich sprachlogisch betrachtet durch die Phoneme „H“ und „M“. Diese beiden können damit eine bedeutungsunterscheidende Funktion übernehmen.

Differenzierungen wie diese lassen sich auf allen möglichen Sprachebenen durchführen, bis sich schließlich immer größere Zusammenhänge ergeben. Bedeutungsunterscheidende Funktion haben die folgenden strukturellen sprachlichen Elemente:

Einzelne Laute Buchstaben als kleinste sprachliche Einheit („Haus“ vs. „Maus“)
Segmentanalyse zur Erkennung von Wörtern („ichgehenachhause“ vs. „ich|gehe|nach|hause“)
Morphologische Analyse zur Erkennung der Endungen („fragen“ vs. „fragten“)
Syntaktische Analyse von Sätzen und Satzstrukturen („Er versprach, mir jedes Jahr ein neues Auto zu kaufen.“ vs. „Er versprach mir, jedes Jahr ein neues Auto zu kaufen.)
Semantische Analyse der Bedeutung („Golf = Sportart“ vs. „Golf = Auto“)
Dialogische Analyse von Kommunikation (Sender – Botschaft – Intention – Empfänger)

Natural Language Processing geht nun von einem einfachen Zusammenhang aus. Wenn es gelingt, zunächst ein Verständnis der kleinsten sprachlichen Strukturen aufzubauen, können nach und nach immer komplexere Zusammenhänge verstanden werden. Damit also Maschinen bzw. Programme komplexe sprachliche Strukturen verstehen können, müssen sie zunächst – ähnlich wie ein Kind – die einfachen sprachlichen Strukturen verstehen lernen.

Was ist Natural Language Processing — © [at]

Natural Language Processing und Künstliche Intelligenz

Wenn es um lernfähige Programme geht, bewegen wir uns im Bereich der Künstlichen Intelligenz. Wesentliche Fortschritte im Bereich Natural Language Processing wurden entsprechend auch erst erzielt, als der Einsatz von Künstlicher Intelligenz einen gewissen Reifegrad erreicht hatte. Dazu trugen vor allem Künstliche Neuronale Netze und Machine Learning Methoden wie Deep Learning bei. Sehr komplexe Sachverhalte, wie sie die natürliche Sprache des Menschen bereithält, wird so für Maschinen verständlich.

Alle wichtigen Konzepte und Begriffe rund um das Thema Künstliche Intelligenz klären wir in unserem Blog-Artikel zu KI.

Dabei sind vor allem Lernmethoden wie Transfer Learning interessant, da diese es ermöglichen, nicht immer bei null anfangen zu müssen. Das heißt: Sind einmal die Grundlagen der Sprache verstanden, können bestimmte Lösungen darauf aufbauen. Dass es bei Natural Language Processing jedoch nicht ausschließlich um Sprachverständnis geht, machte Google spätestens mit der Präsentation des Google Assistent – „Google Duplex“ – bei der I/O 2018 deutlich. Auch die natürliche Sprachausgabe gehört zum Ziel der Mensch-Maschine-Kommunikation.

Video: Natural Language Processing in der Praxis: Google Duplex kann die natürliche Sprache nicht nur verstehen, sondern auch selbst verwenden.

Die Anwendungsbereiche von NLP sind vielseitig

Das Spektrum an möglichen Anwendungsbereichen ist immens. Es übersteigt die zunächst erwähnte Mensch-Maschine-Kommunikation. Denn auf dem Weg zu einem immer besseren Sprachverständnis eröffneten sich zahlreiche Anwendungsgebiete, in denen Natural Language Processing ebenfalls neue Perspektiven verschaffte.

Chatbots und digitale Assistenten
Intelligente Textverarbeitung (Autokorrektur, Umwandlung von Sprache in Text)
Text Mining zur intelligenten Auswertung von Textdaten
Übersetzungsprogramme
Generierung von Sprache (Sprachausgabe)
Sprache als Interaktionsmedium zur Steuerung von Maschinen

Darüber hinaus öffnet Natural Language Processing zahlreiche Anwendungsbereiche für Anwender ohne spezielle Kenntnisse etwa von Programmiersprachen oder auch für Menschen mit Behinderung, indem beispielsweise Fertigungsmaschinen via Spracheingabe gesteuert werden können. Insofern spielt NLP auch bei der Transformation der Arbeitswelt eine gewichtige Rolle.

Die Zeit von NLP bricht gerade erst an

Wenn man sich die immensen Fortschritte ansieht, die in den letzten Jahren bei der Entwicklung von digitalen Assistenten gemacht wurde, wird klar, dass wir hier gerade erst am Anfang einer Entwicklung stehen. Der Status quo zeichnet sich oft durch frustrierende Momente aus. Viele Spracheingaben können von Assistenten wie Siri oder Alexa noch nicht ausreichend verstanden werden. Der Funktionsumfang ist im Moment auf eine bestimmte Reihe von Anwendungen beschränkt, die gut beherrscht werden. Diese Insellösungen lassen sich aber zunehmend in größere Zusammenhänge intelligent integrieren.

Insbesondere Entwicklungen wie Google Duplex zeigen, was in Zukunft mithilfe von Natural Language Processing möglich sein wird. Genau aus diesem Grund ist es entscheidend, insbesondere den Einsatz und die Entwicklung von Künstlicher Intelligenz in Deutschland zu fördern. Denn die maschinelle Verarbeitung der natürlichen Sprache wird nicht nur immer besser. Die enorme Bandbreite an Anwendungen wird erst in Zukunft richtig erschlossen werden können. Darum ist es wichtig, auf einem so vielversprechenden Gebiet wie NLP den Anschluss nicht zu verlieren.

Autor:innen

Michaela Tiedemann

Michaela Tiedemann ist seit den jungen Startup Tagen der Alexander Thamm GmbH mit im Team. Sie hat die Entwicklung vom schnelllebigen, spontanen Startup hin zum erfolgreichen Unternehmen aktiv mitgestaltet. Mit der Gründung einer eigenen Familie begann für Michaela Tiedemann dann parallel dazu ein ganz neues Kapitel. Den Job an den Nagel zu hängen, kam für die frisch gebackene Mutter aber nicht in Frage. Stattdessen entwickelte sie eine Strategie, wie sie ihre Stelle als Chief Marketing Officer mit ihrer Rolle als Mutter in Einklang bringen kann.