Supervised Machine Learning – So funktioniert „Überwachtes Maschinelles Lernen“.

Supervised Machine Learning ist eine der am weitesten verbreiteten Formen von Machine Learning.

Was verbirgt sich hinter Supervised Machine Learning? Bislang war es einfach, generelle Unterschiede zwischen Menschen und Maschinen festzumachen. Menschen können aus Erfahrung oder anhand von Beispielen lernen, während Maschinen in der Regel „nur“ Anweisungen, sprich: Programmen folgen. Die Frage lautet daher: Können auch Maschinen aus Erfahrung oder anhand von einzelnen Beispielen lernen? Die Antwort auf diese Frage lautet: Ja. Und da kommt Supervised Machine Learning ins Spiel. „Erfahrungen“ liegen im Falle von Computern in Form von Daten beziehungsweise Data Sets vor.

Machine Learning ist eines der derzeit wichtigsten Teilgebiete der Künstlichen Intelligenz. Dabei gibt es mehrere Methoden, die Maschinen ermöglichen zu lernen. Supervised Machine Learning ist eine der am weitesten verbreiteten Formen von Machine Learning. Diese Lernmethode spielte bereits am Anfang der Entwicklung Künstlich Neuronaler Netzwerke eine wichtige Rolle.

Linktipp: Hier erklären wir die Grundlagen von Machine Learning anhand eines Sieges im Poker.

Machine Learning in aller Kürze

Eine kurze und leicht vereinfachende Definition von Machine Learning lautet: Machine Learning oder Maschinelles Lernen wird der KI-Teilbereich genannt, bei dem lernfähige Systeme Regeln erlernen. Sie sind in diesem Sinne das Gegenteil von herkömmlicher Software, bei der Regelsysteme von Programmierern so geschrieben werden, dass sie in vorher bestimmten Situationen bestimmte Aufgaben bewältigen können. Systeme, die auf Machine Learning basieren, sind also lernfähig. Das heißt, indem sie „trainiert“ werden, werden sie immer besser.

Schulungstipp: Sie sind an Supervised Machine Learning interessiert? Sicher Sie sich einen Platz in einer unserer nächsten Supervised Machine Learning Schulungen.

Der Vorteil von lernenden Algorithmen liegt auf der Hand. Dank Machine Learning lassen sich intelligente Systeme entwickeln, die sich exakt an ihre Aufgabe anpassen. Sie sind damit keine Standardsoftware, sondern hochspezialisierte Werkzeuge für individuelle Aufgaben. Dabei ist ihr Grundprinzip immer gleich. Ein bestimmter Datensatz (Input X) durchläuft einen vorab trainierten Algorithmus und am Ende steht das Ergebnis (Output Y). Die folgende Grafik gibt einen Überblick über die unterschiedlichen Methoden, um lernfähige Machine-Learning-Algorithmen zu trainieren.

Machine Learning unterteilt sich nicht nur in Supervised Learning und Unsupervised Learning. Je nach Anwendungsfall muss die Art der Hypothesen-Bildung wie Klassifikationsproblem, Regression-Problem oder Decision Tree ausgewählt werden. (Quelle: https://www.datasciencecentral.com/profiles/blogs/machine-learning-summarized-in-one-picture)

So funktioniert Supervised Machine Learning

Lernende Algorithmen versuchen typischerweise Vorhersagen oder Aussagen zu treffen. Eine dieser typischen Aufgaben lautet beispielsweise: Handelt es sich bei einer E-Mail um Spam oder nicht? Eine etwas komplexere Fragestellung wäre, den idealen Verkaufspreis für bestimmte Waren in Abhängigkeit von mehreren Faktoren zu berechnen. Während der Trainingsphase versucht ein intelligenter Algorithmus sich dem richtigen Ergebnis anzunähern.

Ob eine Vorhersage wirklich richtig ist, erfährt ein Algorithmus in der Lernphase dadurch, dass ein Trainer ihm sagt, ob das Ergebnis richtig oder falsch ist. Das Prinzip von Supervised Machine Learning basiert also auf dem Feedback über eine Fehlerfunktion.

Dem Algorithmus wird mitgeteilt, ob und inwieweit er sich mit seinem Trainingsergebnis dem angestrebten Ziel angenähert hat. Diese Information wird in der Folge direkt dazu verwendet, interne Parameter anzupassen, um eine neuen Versuch zu unternehmen. Mit anderen Worten basiert Supervised Machine Learning auf dem Trial-and-Error-Prinzip.

Verschiedene Annäherungsversuche an die richtige Lösung während der Trainingsphase: Funktionen können zu einfach sein („Underfitting“, links) oder zu genau („Overfitting“, rechts). Die mittlere Funktion beschreibt eine Kurve, die in den meisten Fällen zu korrekten Ergebnissen führt. (Quelle: https://tomrobertshaw.net/2015/12/introduction-to-machine-learning-with-naive-bayes/)

Der Ausgangspunkt für die Trainingsphasen sind sogenannte „Labeled Data Sets“. Bei dem E-Mail-Beispiel wären die beiden Labels „Spam“ oder „Nicht-Spam“. Es handelt sich dabei also um eindeutige Trainingsbeispiele, die zunächst bestimmt werden. Dieser Schritt ist insofern wichtig, weil sich beim Supervised Machine Learning an dieser Stelle entscheidet, welche Art der Hypothesenbildung der Data Scientist auswählt.

Konkret verläuft das Training mit Feedback so, dass während der Trainingsphase zunächst einem Künstlichen Netzwerk Eingabedaten präsentiert werden. Der „Trainer“ beurteilt im Anschluss den Output nach Richtigkeit und gibt dem Netz ein Feedback, ob das Ergebnis richtig ist oder nicht. Das Netzwerk lernt nach dem Prinzip von Bestrafung bzw. Lob und Anpassung.

Linktipp: In diesem Blog-Artikel erklären wir die Zusammenhänge von Künstlichen Neuronalen Netzwerken und Machine Learning.

Nachdem ein lernender Algorithmus einmal trainiert ist, können neue Data Sets verwendet werden, um anhand der erlernten Regeln einen Output zu erhalten. Ist ein Machine-Learning-Algorithmus beispielsweise erst einmal darauf trainiert, handschriftliche Eingaben zu verstehen, kann er jede beliebige neu eingegebene Buchstabenfolge erkennen.

Die Einsatzbereiche von Supervised Machine Learning

Es gibt ein großes Spektrum von unterschiedlichsten Einsatzbereichen, bei denen Supervised Machine Learning verwendet werden kann. Eine wichtige Voraussetzung, die zu Beginn erfüllt sein muss, ist, dass ausreichend Trainingsdaten vorhanden sein müssen. In der Regel eignet sich Supervised Machine Learning für alle Formen Klassifikationsaufgaben sowie für Vorhersagen bzw. Prognosen:

  • Medizinische Diagnose­verfahren wie bei der Diagnose von Krebs
  • Erkennung von Kreditkartenbetrug oder E-Mail-Spamnachrichten
  • Aktienmarkt­analysen und -prognosen des zukünftigen Kursverlaufs
  • Klassifikation von Früchten nach der Ernte oder bei der Sortierung von Lebensmitteln oder Werkteilen nach Qualitätsstufen
  • Sprach- und Texterkennung beispielsweise bei Chatbots
  • Lernen von Verkehrsregeln für das autonome Fahren
#SupervisedMachineLearning zählt zu den verbreitetsten und aktuell wichtigsten #MachineLearning Methoden. Entsprechend breit gefächert sind die konkreten Einsatzbereiche. Klick um zu Tweeten

Warum Lernfähigkeit den wesentlichen Unterschied macht

Die Lernfähigkeit von intelligenten Algorithmen geht weit über die Trainingsphase hinaus. Dank Supervised Machine Learning sind Algorithmen dazu in der Lage, einmal erlernte Regeln immer weiter zu verbessern, wenn sie das entsprechende Feedback bekommen.

Zudem können sie einmal erlernte Regeln auf neue Fälle bzw. unstrukturierte Daten anwenden. Ist ein Algorithmus einmal darauf trainiert, die gesprochene Sprache zu verstehen, ist es möglich, ihn in der Folge so anzupassen, dass er auch einen oder mehrere Dialekte verstehen kann.

Große Datenmengen (Big Data) sind von Vorteil, wenn es darum geht, Use Cases in Unternehmen für lernende Algorithmen zu finden. Nicht zuletzt aus diesem Grund, avancierte Supervised Machine Learning zu einer der wichtigsten Methoden im Bereich Machine Learning.

Sie möchten sich einen Überblick über die Einsatzmöglichkeiten von Supervised Machine Learning schaffen? Melden Sie sich hier für eine unserer nächsten Supervised Machine Learning Schulungen an.

Mehr dazu

Tags

top