Erklärt: So funktioniert Unsupervised Machine Learning

Intelligente Programme, die sich selbst Spielregeln beibringen, sind beeindruckend. Die Methode, die hinter dieser Fähigkeit steckt, ist Unsupervised Machine Learning.

Unsupervised Machine Learning hilft – Es gibt bestimmte Aufgaben, die für Programmierer enorme Herausforderungen darstellen. Soll beispielsweise ein Programm geschrieben werden, das den optimalen Bewegungsablauf für Roboter steuert, stehen theoretisch unzählige Möglichkeiten zur Verfügung. Aber welche bringt die optimale Lösung?

Mit herkömmlichen Programmiersprachen wie Python ist es fast unmöglich, so komplexe Aufgaben wie das autonome Bewegen von Robotern oder Autos zu programmieren. Dies ist eine ideale Aufgabe für Unsupervised Machine Learning – manchmal auch Unsupervised Learning oder kurz UL genannt. UL ist neben dem Supervised Machine Learning eine der aktuell wichtigsten Methoden aus dem Bereich der Künstlichen Intelligenz.

Linktipp: In unseren Überblick-Artikeln zu KI (Künstlicher Intelligenz) und Machine Learning erklären wir die Grundsätze und einzelne Methoden genauer.

Was ist Unsupervised Machine Learning?

Unsupervised Machine Learning lässt sich zunächst in Abgrenzung zu Supervised Machine Learning definieren. Während beim Supervised Learning am Beginn klar ist, wie das Ergebnis in etwa aussehen soll – etwa ob eine E-Mail-Nachricht als Spam oder Nicht-Spam gelabelt wird – so steht das Ergebnis von Unsupervised Machine Learning nicht von Anfang an fest.

Ein anschauliches Beispiel bietet das folgende Video, das zeigt wie eine AI versucht, sich selbst beizubringen, was „Laufen“ ist. Sie macht dies, ohne vorab irgendwelche Informationen darüber bekommen zu haben, wie Menschen tatsächlich auf zwei Beinen laufen:

Der Einfachheit halber kann man sich den Unterschied zwischen Supervised und Unsupervised Learning auch wie einen Lernvorgang mit und ohne Lehrer vorstellen. Aber ist es überhaupt möglich, etwas Nützliches zu lernen, wenn kein „Lehrer“ vorhanden ist? Die Frage lässt sich zumindest im Hinblick auf Machine Learning eindeutig mit ‚Ja‘ beantworten.

Ein Künstliches Neuronales Netz darf beispielsweise mit einer gegebenen Menge von Eingaben „spielen“, um mögliche Zusammenhänge, Muster oder Ähnlichkeiten in einem vorgegebenen Bestand nicht-gelabelter Daten zu entdecken.

LinktippSie möchten alles über die Einsatzpotenziale und Möglichkeiten von UL wissen? Sichern Sie sich einen Platz in  unserer Unsupervised Machine Learning Schulung.

Wie vollzieht sich also der Lernvorgang, wenn es keine Trainingsbeispiele gibt? Die Künstlichen Neuronalen Netze bekommen ein System, mit dem sie ‚Bestrafung‘ und ‚Belohnung‘ unterscheiden können. Wenn Sie die Spielregeln eines Spieles erlernen sollen, wäre der Verlust eines Spiels gleichbedeutend mit Bestrafung und der Gewinn mit Belohnung.

Während des Lernvorgangs stellen die Künstlich Neuronalen Netze die Gewichte der einzelnen Knotenpunkte im Netz so ein, dass Bestrafungen in Zukunft vermieden werden. Nach und nach können sie so Strategien entwickeln, um sowohl Spielregeln als auch Gewinnstrategien zu lernen. Die Anwendungsgebiete für diese Form des Lernens sind sehr weit und erstrecken sich über die Bereiche:

  • Wirtschaft
  • Forschung
  • Spiele

Einer der bekannten Erfolge von Unsupervised Machine Learning kommt aus dem letzten Bereich. Googles AlphaGo war aufgrund dieser Methode dazu in der Lage, sich selbst das Go-Spiel beizubringen, ohne dass ihm vorab das Regelwerk des Spiels erklärt wurde.

Auch wenn sie hier getrennt dargestellt sind: Unsupervised Machine Learning ist keine Methode, die ausschließlich zum Einsatz kommen muss. Sogenannte „Hidden Layers“ können mit Unsupervised Learning vortrainiert werden, um anschließend daran ein klassisches überwachtes Netz anzuschließen. (Quelle: https://www.datasciencecentral.com/profiles/blogs/machine-learning-summarized-in-one-picture

Unsupervised Learning am Beispiel des Clustering

Eine Unterkategorie von Unsupervised Machine Learning ist das sogenannte „Clustering“, das manchmal auch „Clusterverfahren“ genannt wird. Beim Clustering wird das Ziel verfolgt, Daten ohne bestimmte Attribute nach bestimmten Kriterien zu gruppieren. Dies ist beispielsweise im Marketing relevant, wenn es um die Segmentierung von Kunden geht.

Auch im Bereich Text-Mining und Data-Mining zählt das Clusterverfahren zu einer der meist genutzten Methoden. Aus einer großen Menge von Textdaten können Datensätze mit ähnlichem Content zusammengefasst werden – etwa alle Lieferscheine zu einer bestimmten Produktgruppe oder bei der genetischen Forschung, wenn es um Zusammenhänge von Merkmalen in Gendaten geht.

Auch wenn das Prinzip von #UnsupervisedMachineLearning sehr abstrakt ist, verfolgt es doch sehr konkrete Zwecke wie beispielsweise die Segmentierung von Kunden im #Marketing. Klick um zu Tweeten

Unsupervised vs. Semi-Supervised Learning vs. Supervised Learning

Die anfänglich getroffene Unterscheidung zwischen Supervised Machine Learning und Unsupervised Machine Learning dient zwar dem besseren Verständnis, ist aber in der Praxis nicht ausreichend. Zwar lässt sich vereinfachend sagen, dass es beim Supervised Machine Learning in der Regel um die Vorhersage eines bestimmten Labels wie „krank“ / „gesund“, „Spam“ / „Nicht-Spam“ oder „defekt“ / „funktionierend“ geht.

Oft sind die Probleme in der Praxis aber komplexer und die Lösungen fallen gerade zwischen die beiden Methoden. Je nach Anwendungsfall kann es daher sinnvoll sein, beide Methoden miteinander zu kombinieren. In diesem Zuge hat sich eine weitere Begrifflichkeit eingebürgert: Die Methode des „Semi-Supervised“ Learning.

Beim Semi-Supervised Learning können nur einige wenige Trainingsdaten ein Label haben, während der überwiegende Teil ungelabelt ist. Je nach Datenqualität kann es auch vorkommen, dass manchmal die Daten bzw. die dazugehörigen Labels unvollständig sind. Die ersten Ergebnisse bei der Datenanalyse werden dann „geschätzt“ beziehungsweise „gut geraten“. Erst wenn auf diese Weise die Lücken gefüllt wurden, kann auf Basis dieser Ergebnisse der Algorithmus verbessert werden.

Konkrete Einsatzbereiche von Unsupervised Machine Learning

Wie bereits erwähnt, erlangte Unsupervised Machine Learning im Rahmen der Errungenschaften von AlphaGo erstmals Berühmtheit. Das selbständige Erlernen von Spielregeln von so komplexen Spielen wie Go oder Poker gilt als Test für ähnlich komplexe Szenarien in der Wirtschaft wie beispielsweise beim Börsenhandel.

Auch bei komplexen Bildanalysen wie bei der Erkennung von Emotionen (Affective Computing) oder Video-Analysen kann Unsupervised Machine Learning seine Stärken ausspielen, da die Fragestellungen explorativen Charakter haben.

Mit #Unsupervised #MachineLearning ist dank des explorativen Vorgehens möglich, in Bereichen wie #Genetik #Robotics oder #Spielen zu völlig neuartigen Lösungen zu gelangen. Klick um zu Tweeten

Das zukünftige Potenzial von Unsupervised Machine Learning

Auch wenn Unsupervised Machine Learning aktuell nicht so weit verbreitet ist wie Supervised Machine Learning, ist die Methode nicht weniger bedeutend. Insbesondere weil Machine Learning ganz allgemein zu einem der entscheidenden Faktoren für Innovation und Wachstum wird, gewinnen auch die Methoden wie Supervised und Unsupervised Machine Learning an Bedeutung.

Eine Schwierigkeit beim Einsatz von UL ist die Beurteilung der Ergebnisse. Die Analyseergebnisse lauten nicht einfach „krank“ oder „gesund“. Gerade weil die Ausgabewerte aber nicht von Anfang feststehen, eignet sich Unsupervised Machine Learning ideal für Erkundungen und Datenexplorationen.

Insbesondere im Hinblick auf die Entwicklung von KI gilt Unsupervised Machine Learning sogar als großer Hoffnungsträger. Vor allem die Fähigkeit, dass Algorithmen durch den Einsatz von Unsupervised Machine Learning selbständig Regeln und Muster erkennen können, macht sie zu einem überaus interessanten Instrument bei der Entwicklung von KI und bei der Anwendung in der Praxis.

 

Sie wollen einen konzentrierten Einblick in eine der aktuellen Schlüsseltechnologien erhalten?
Melden Sie sich hier für unsere eintägige Schulung zum Thema Unsupervised Machine Learning an.

Jetzt Schulung buchen
 

Tags

top