Long Short-Term Memory (LSTM)

Was ist ein Long Short-Term Memory?

Ein Long Short-Term Memory (LSTM) ist ein langes Kurzzeitgedächtnis in der Künstlichen Intelligenz. So wird beim Training von künstlichen Neuronalen Netzen ein Verfahren des Fehlersignalabstiegs verwendet.

Vergleichbar ist dies mit der Suche eines Bergsteigers der nach dem tiefsten Tal sucht. Sollten mehrere vertiefende Schichten vorhanden sein, so wird dies zu kurz greifen, wenn der vergessliche Bergsteiger so beim Abstieg in dem ersten besten Tal landet und damit sein Dorf in einem tieferen Tal nicht mehr finden kann. Mit einem LSTM-Verfahren kann aber dieses Problem ganz einfach gelöst werden.

Es gibt LSTM-Zellen mit drei Torsorten für eine bessere Erinnerung. Mit einem Eingangstor (Input Gate), einem Merk- und Vergesstor (Forget Gate) und mit einem Ausgangstor (Output Gate) ist LSTM so ausgestattet, dass Erinnerungen an frühere Erfahrungen möglich sind. Das Kurzzeitgedächtnis hält lange an und das prinzipielle Verhalten des Netzes ist in den Gewichten kodiert. Solche Neuronalen Netze, die mit vielen Schichten ausgestattet sind, sind wirklich extrem lernfähig. Long Short-Term Memory kann dafür sorgen, dass solche mehrschichtigen Netze hervorragend funktionieren. Mit dieser Technik wurde ein Durchbruch in der Künstlichen Intelligenz ermöglicht.

Wozu dienen LSTM-Netzwerke?

Besonders geeignet sind LSTM-Netzwerke, um zu klassifizieren, zu verarbeiten und um Vorhersagen auf der Basis von Zeitreihendaten vorzunehmen. LSTM ist anwendbar bei Aufgaben wie der Erkennung von handgeschriebenen Texten und bei Spracherkennung. Auch genutzt werden kann diese Technik bei Anomalie-Erkennung im Netzwerkverkehr oder bei Intrusion-Detection-Systemen.

Welchen Nutzen haben Long Short-Term Memory?

LSTM ist eine Methodik aus dem Bereich Künstlicher Intelligenz. Neuronale Netzwerke funktionieren mit LSTM und sie beschreiben einen ganz speziellen Funktionsblock von rekurrenten neuronalen Netzen mit einer Art „langem Kurzzeitgedächtnis“. Die Neuronalen Netze werden durch LSTM wesentlich leistungsfähiger.

Mit Long Short-Term Memory entsteht ein Kurzzeitgedächtnis, das lange anhält und es ermöglicht, dass Rekurrente Neuronale Netzwerke (RNN) in der Lage sind, sich an bestimmte Langzeit-Abhängigkeiten und an frühere Erfahrungen zu erinnern. So soll bei jeder Aufgabe und bei jedem Problem nicht von vorne begonnen werden. Bereits erworbenes Wissen soll genutzt werden und auf gemachte Erfahrungen können RNN zurückgreifen.

Was macht Long Short-Term Memory so besonders?

LSTM sind ganz einfach Weiterentwicklungen von Rekurrenten Neuronalen Netzwerken. Was LSTM besonders auszeichnet ist die Eigenschaft, vergangene Informationen in bestimmten sequenziellen Daten zu selektieren. Damit besteht die Möglichkeit, dass aus Trainingsdaten gelernt werden kann, welche Informationen aus der früheren Vergangenheit für den aktuellen Output genutzt werden können und welche Informationen ganz einfach vergessen werden können.

Solch eine Fähigkeit ist das Ergebnis von jahrelanger Forschung und Entwicklung. Mithilfe von Backpropagation werden die künstlichen Neuronalen Netze trainiert und LSTM ermöglicht es, sich zurechtzufinden. Der Einsatz von LSTM lohnt sich aufgrund des großen Einsatzpotentials für viele Unternehmen.

Data Navigator Newsletter