So funktioniert Unsupervised Machine Learning

Intelligente Programme, die sich selbst Spielregeln beibringen, sind beeindruckend. Die Methode, die hinter dieser Fähigkeit steckt, ist Unsupervised Machine Learning.

Unsupervised Machine Learning hilft – Es gibt bestimmte Aufgaben, die für Programmierer enorme Herausforderungen darstellen. Soll beispielsweise ein Programm geschrieben werden, das den optimalen Bewegungsablauf für Roboter steuert, stehen theoretisch unzählige Möglichkeiten zur Verfügung. Aber welche bringt die optimale Lösung?

Mit herkömmlichen Programmiersprachen wie Python ist es fast unmöglich, so komplexe Aufgaben wie das autonome Bewegen von Robotern oder Autos zu programmieren. Dies ist eine ideale Aufgabe für Unsupervised Machine Learning – manchmal auch Unsupervised Learning oder kurz UL genannt. UL ist neben dem Supervised Machine Learning eine der aktuell wichtigsten Methoden aus dem Bereich der Künstlichen Intelligenz.

In unseren Artikel zu „Was ist Künstlicher Intelligenz“ erklären wir die Grundsätze und einzelne Methoden genauer.

Was ist Unsupervised Machine Learning?

Unsupervised Machine Learning lässt sich zunächst in Abgrenzung zu Supervised Machine Learning definieren. Während beim Supervised Learning am Beginn klar ist, wie das Ergebnis in etwa aussehen soll – etwa ob eine E-Mail-Nachricht als Spam oder Nicht-Spam gelabelt wird – so steht das Ergebnis von Unsupervised Machine Learning nicht von Anfang an fest.

Ein anschauliches Beispiel bietet das folgende Video, das zeigt wie eine AI versucht, sich selbst beizubringen, was „Laufen“ ist. Sie macht dies, ohne vorab irgendwelche Informationen darüber bekommen zu haben, wie Menschen tatsächlich auf zwei Beinen laufen:

Der Einfachheit halber kann man sich den Unterschied zwischen Supervised und Unsupervised Learning auch wie einen Lernvorgang mit und ohne Lehrer vorstellen. Aber ist es überhaupt möglich, etwas Nützliches zu lernen, wenn kein „Lehrer“ vorhanden ist? Die Frage lässt sich zumindest im Hinblick auf Machine Learning eindeutig mit ‚Ja‘ beantworten.

Ein Künstliches Neuronales Netz darf beispielsweise mit einer gegebenen Menge von Eingaben „spielen“, um mögliche Zusammenhänge, Muster oder Ähnlichkeiten in einem vorgegebenen Bestand nicht-gelabelter Daten zu entdecken.

LinktippSie möchten alles über die Einsatzpotenziale und Möglichkeiten von UL wissen? Sichern Sie sich einen Platz in  unserer Unsupervised Machine Learning Schulung.

Wie vollzieht sich also der Lernvorgang, wenn es keine Trainingsbeispiele gibt? Die Künstlichen Neuronalen Netze bekommen ein System, mit dem sie ‚Bestrafung‘ und ‚Belohnung‘ unterscheiden können. Wenn Sie die Spielregeln eines Spieles erlernen sollen, wäre der Verlust eines Spiels gleichbedeutend mit Bestrafung und der Gewinn mit Belohnung.

Während des Lernvorgangs stellen die Künstlich Neuronalen Netze die Gewichte der einzelnen Knotenpunkte im Netz so ein, dass Bestrafungen in Zukunft vermieden werden. Nach und nach können sie so Strategien entwickeln, um sowohl Spielregeln als auch Gewinnstrategien zu lernen. Die Anwendungsgebiete für diese Form des Lernens sind sehr weit und erstrecken sich über die Bereiche:

  • Wirtschaft
  • Forschung
  • Spiele

Einer der bekannten Erfolge von Unsupervised Machine Learning kommt aus dem letzten Bereich. Googles AlphaGo war aufgrund dieser Methode dazu in der Lage, sich selbst das Go-Spiel beizubringen, ohne dass ihm vorab das Regelwerk des Spiels erklärt wurde.

Auch wenn sie hier in der Grafik getrennt dargestellt sind: Unsupervised Machine Learning ist keine Methode, die ausschließlich zum Einsatz kommen muss. Sogenannte „Hidden Layers“ können mit Unsupervised Learning vortrainiert werden, um anschließend daran ein klassisches überwachtes Netz anzuschließen.

Die Grundlage für Unsupervised Machine Learning

Künstliche Neuronale Netze und Deep Learning Algorithmen sind die derzeit bekanntesten Varianten von Unsupervised Machine Learning Methoden und bilden somit die Grundlage. Sie basieren auf der Imitation der Funktionsweise menschlicher Nervenzellen.

vereinfachte Darstellung einer menschlichen Nervenzelle
Vereinfachte Darstellung einer menschlichen Nervenzelle. Das Neuron verarbeitet im Zellkern den Input in Form eines Signals, das interpretiert bzw. weitergegeben wird.
Künstliches Neuronales Netz
Analog zur Funktionsweise der Nervenzelle verarbeitet ein Künstliches Neuronales Netz ein Input-Signal, das nach bestimmten Regeln verarbeitet wird.

Auch wenn das „atomare“ Grundprinzip von Künstlichen Neuronalen Netzen (KNN) sehr einfach ist, eignen sie sich hervorragend dazu, sehr komplexe Aufgaben zu bewältigen. Jeder Knotenpunkt in einem KNN verhält sich nach einer bestimmten Regel bzw. lässt sich darauf trainieren.

Das abgebildete Beispiel zeigt ein KNN mit zwei sogenannten Hidden Layers, die sich zwischen Input- und Output-Layer befinden. Der Begriff Deep Learning kommt daher, dass diese Hidden Layers eine sehr große „Tiefe“ erhalten können, sprich: ihre Zahl sehr hoch werden kann.

Unsupervised Learning am Beispiel des Clustering

Eine Unterkategorie von Unsupervised Machine Learning ist das sogenannte „Clustering“, das manchmal auch „Clusterverfahren“ genannt wird. Beim Clustering wird das Ziel verfolgt, Daten ohne bestimmte Attribute nach bestimmten Kriterien zu gruppieren. Dies ist beispielsweise im Marketing relevant, wenn es um die Segmentierung von Kunden geht.

Auch im Bereich Text-Mining und Data-Mining zählt das Clusterverfahren zu einer der meist genutzten Methoden. Aus einer großen Menge von Textdaten können Datensätze mit ähnlichem Content zusammengefasst werden – etwa alle Lieferscheine zu einer bestimmten Produktgruppe oder bei der genetischen Forschung, wenn es um Zusammenhänge von Merkmalen in Gendaten geht. Auch in den Bereichen Web Mining, wissenschaftliche Fragestellungen, Bildverarbeitung und Mustererkennung wird Clustering angewandt.

Semantisches Clustering
Beispiele für eine semantische Zuordnung nach einem Clustering Verfahren.
Semantische Zuordnung im Machine Learning
Beispiele für eine semantische Zuordnung nach einem Clustering Verfahren (oben) und unterschiedliche Formen von Clustern (unten).

Wenn es um die mathematischen Modelle geht, die beim Unsupervised Learning angewandt werden, gibt es vier wichtige Kategorien, in die Clustering Verfahren üblicherweise aufgeteilt werden:

  1. Partitionierende Verfahren wie K-Means, K-Medoid, K-Mode oder K-Median
  2. Wahrscheinlichkeitsbasierte Verfahren zur Modellierung von Cluster durch Wahrscheinlichkeitsverteilungen
  3. Dichtebasierte VerfahrenAlgorithmen mit Daten-Dichte und Distanzfunktionen wie DBSCAN oder SNN
  4. Hierarchische Verfahren ­– hierarchischen Partitionierung mit agglomerativen und divisiven Algorithmen

Partitionierende Verfahren am Beispiel von K-Means

Eine sehr beliebte Methode unter den Unsupervised Machine Learning Methoden sind Partitionierende Verfahren. Bei einem solchen Verfahren handelt es sich um einen heuristischen Ansatz. Das bedeutet, dass nicht ein exaktes Ergebnis gesucht wird, das nur als „richtig“ oder „falsch“ bewertet werden kann. Vielmehr geht es um einen Prozess bzw. eine Funktion, bei dem bzw. der das beste Ergebnis annäherungsweise erreicht wird.

Das Ziel besteht darin, die vorhandenen Daten in „k“ verschiedene Cluster zu sortieren. Dabei wird im ersten Schritt eine zufällige Anzahl an Clustern herangezogen, um zu sehen, wie ein mögliches Ergebnis aussieht.

Verlgiech gute versus schlechte Cluster
Die Beispiele zeigen, wie man gute von schlechten Clustern unterscheiden kann, indem man den Abstand der einzelnen Punkte misst und addiert.

Die K-Means-Methode beruht auf einem festen Ablauf in zwei Schritten, die so lange wiederholt werden, bis sich ein stabiler Zustand einstellt:

K-Means-Methode im Machine Learning
K-Means-Methode im Machine Learning

Wahrscheinlichkeitsbasierte Verfahren haben ebenfalls das Ziel, Datenpunkte zu clustern, gehen aber von der Wahrscheinlichkeit aus, mit der ein bestimmtes Objekt einem bestimmten Cluster zugehört. Auch diese Methode zeichnet sich durch einen iterativen Ansatz aus, bei dem jeder Versuch eine Annäherung an die beste Lösung darstellt.

Wahrscheinlichkeitsbasierte Verfahren im Machine Learning
Grundidee der Modellierung von Cluster durch Wahrscheinlichkeitsverteilungen.

Dichtebasierte Verfahren

Da Cluster sich nicht nur nach ihrer Form und Größe unterscheiden lassen, sondern auch nach ihrer Dichte, können Dichtebasierte Verfahren in manchen Fällen zu besseren Ergebnissen führen.

Der entscheidende Vorteil beim Density-based Clustering besteht darin, dass sogenanntes „Rauschen“ herausgefiltert werden kann. Beispielsweise kann es Datenobjekte geben, die zu keinem bestimmten Cluster gehören. Diese können im Rahmen des Dichtebasierten Verfahren herausgefiltert werden.

Dichtebasierte Verfahren im Machine Learning
Über die Daten-Dichte können signifikante Cluster gebildet werden, die ungewöhnliche Formen haben oder die ein bestimmtes „Rauschen“ herausfiltern können.

Hierarchische Verfahren

Nicht zuletzt gibt es Fälle, in denen Hierarchische Verfahren zum Ziel führen. Diese Methode wird immer dann angewendet, wenn es keine globalen Kategorien gibt, nach denen sich Daten clustern lassen. Dabei lassen sich Daten dennoch nach bestimmten Parametern clustern, die hierarchischen Prinzipien folgen und sich nach Größe oder Dichte staffeln lassen:

Hierarchische Verfahren im Machine Learning

Unsupervised vs. Semi-Supervised Learning vs. Supervised Learning

Die anfänglich getroffene Unterscheidung zwischen Supervised Machine Learning und Unsupervised Machine Learning dient zwar dem besseren Verständnis, ist aber in der Praxis nicht ausreichend. Zwar lässt sich vereinfachend sagen, dass es beim Supervised Machine Learning in der Regel um die Vorhersage eines bestimmten Labels wie „krank“ / „gesund“, „Spam“ / „Nicht-Spam“ oder „defekt“ / „funktionierend“ geht.

Oft sind die Probleme in der Praxis aber komplexer und die Lösungen fallen gerade zwischen die beiden Methoden. Je nach Anwendungsfall kann es daher sinnvoll sein, beide Methoden miteinander zu kombinieren. In diesem Zuge hat sich eine weitere Begrifflichkeit eingebürgert: Die Methode des „Semi-Supervised“ Learning.

Beim Semi-Supervised Learning können nur einige wenige Trainingsdaten ein Label haben, während der überwiegende Teil ungelabelt ist. Je nach Datenqualität kann es auch vorkommen, dass manchmal die Daten bzw. die dazugehörigen Labels unvollständig sind. Die ersten Ergebnisse bei der Datenanalyse werden dann „geschätzt“ beziehungsweise „gut geraten“. Erst wenn auf diese Weise die Lücken gefüllt wurden, kann auf Basis dieser Ergebnisse der Algorithmus verbessert werden.

Konkrete Einsatzbereiche von Unsupervised Machine Learning

Wie bereits erwähnt, erlangte Unsupervised Machine Learning im Rahmen der Errungenschaften von AlphaGo erstmals Berühmtheit. Das selbständige Erlernen von Spielregeln von so komplexen Spielen wie Go oder Poker gilt als Test für ähnlich komplexe Szenarien in der Wirtschaft wie beispielsweise beim Börsenhandel.

Auch wenn viele der hier vorgestellten Machine Learning Methoden sehr abstrakt sind, erfüllen sie in der Praxis sehr konkrete Ziele. Sei es bei der Betrugserkennung (Fraud Detection), der Erkennung und Verhinderung von Kundenabwanderung (Churn Prediction Model) oder der optimalen Planung von Wartungsterminen für Maschinen und Fahrzeuge (Predictive Maintenance bzw. Präventive Wartung).

Auch bei komplexen Bildanalysen wie bei der Erkennung von Emotionen (Affective Computing) oder Video-Analysen kann Unsupervised Machine Learning seine Stärken ausspielen, da die Fragestellungen explorativen Charakter haben.

Die große Herausforderung besteht darin, die richtige Methode für den richtigen Anwendungsfall auszuwählen. Dazu gehört zum einen Erfahrung und zum anderen das entsprechende Fachwissen. Darum vermitteln wir in unserer Unsupervised Machine Learning Schulung detailliertes Fachwissen, das bei der Identifikation der jeweils  relevanten Machine Learning Methoden für einen bestimmten Use Case eine entscheidende Rolle spielt.

Das zukünftige Potenzial von Unsupervised Machine Learning

Auch wenn Unsupervised Machine Learning aktuell nicht so weit verbreitet ist wie Supervised Machine Learning, ist die Methode nicht weniger bedeutend. Insbesondere weil Machine Learning ganz allgemein zu einem der entscheidenden Faktoren für Innovation und Wachstum wird, gewinnen auch die Methoden wie Supervised und Unsupervised Machine Learning an Bedeutung.

Eine Schwierigkeit beim Einsatz von UL ist die Beurteilung der Ergebnisse. Die Analyseergebnisse lauten nicht einfach „krank“ oder „gesund“. Gerade weil die Ausgabewerte aber nicht von Anfang feststehen, eignet sich Unsupervised Machine Learning ideal für Erkundungen und Datenexplorationen.

Insbesondere im Hinblick auf die Entwicklung von KI gilt Unsupervised Machine Learning sogar als großer Hoffnungsträger. Vor allem die Fähigkeit, dass Algorithmen durch den Einsatz von Unsupervised Machine Learning selbständig Regeln und Muster erkennen können, macht sie zu einem überaus interessanten Instrument bei der Entwicklung von KI und bei der Anwendung in der Praxis.

Tags

top