Machine Learning – Der ultimative Ratgeber

von | 31. März 2020 | Grundlagen

Künstliche Intelligenz und maschinelles Lernen sind längst keine Randerscheinungen mehr, sondern in den letzten Jahren voll und ganz im Mainstream angekommen. Waren selbstlernende Systeme noch vor wenigen Jahren ein mehr oder weniger auf Forschungseinrichtungen und Technologieunternehmen beschränktes Thema, ist maschinelles Lernen heute in vielen Alltagsanwendungen angekommen. 
 
Spracherkennung auf Mobiltelefonen, Übersetzungsprogramme im Internet, Spam-Filter für Computer sowie Gesichtserkennung bei Fotos und Videos sind nur einige wenige Beispiele für Technologien, die heutzutage auf selbstlernenden Systemen basieren.  
 
Aber auch in vielen Industrien werden Produkte und Prozesse längst unter Anwendung von maschinellem Lernen neu gestaltet und optimiert. Dazu zählen beispielsweise die Optimierung von Lieferketten, die vorausschauende Wartung, ein für Kunden individualisiertes Online-Marketing oder ein automatisiertes Energiemanagement. Einen besonderen Schwerpunkt bilden dabei fertigende Betriebe, Maschinenbauer und Unternehmen, die bereits auf die vernetzte Produktion umgestellt haben wie etwa die Automotive-Industrie. 
 
Alle Branchen, die über große Datenvolumina verfügen, sind prädestiniert für den Einsatz maschinell lernender Systeme. Dazu zählen besonders Banken und Versicherungen, das Gesundheitswesen und Fertigungsunternehmen. Auf Basis von maschinellem Lernen lässt sich in diesen und weiteren Branchen die Effizienz steigern, die Kundenbedürfnisse besser befriedigen, schnellere Entscheidungen herbeiführen und unterm Strich die Geschäftsergebnisse verbessern. 

1. Was ist Machine Learning? 

Machine Learning (deutsch „Maschinelles Lernen“) ist ein Teilbereich der künstlichen Intelligenz und ein Oberbegriff für die künstliche Generierung von Wissen aus Erfahrung. Beim maschinellen Lernen erlernt ein künstliches System aus Beispielen Regeln, die es nach Beendigung dieser Lernphase verallgemeinern kann.

Machine Learning
Die Abbildung zeigt, wo der Begriff Machine Learning im Buzzword-Dschungel eingebettet ist.

Systeme, die auf Maschinellem Lernen basieren, sind lernfähig. Dabei lernen sie nicht einfach nur Beispiele auswendig, sondern sind in der Lage, Muster und Gesetzmäßigkeiten in Daten zu erkennen. Auf Basis von Maschinellem Lernen lassen sich Zusammenhänge erkennen, Rückschlüsse ziehen und Vorhersagen treffen.

Als Beispiel ist hier das Thema Gesichtserkennung zu nennen. Machine Learning macht dies möglich, weil Algorithmen zunächst anhand von Millionen von Bilddaten darauf trainiert wurden, diejenigen Strukturen in den Datenmassen zu erkennen, die ein Gesicht definieren.

Machine Learning Methoden
Hier ist beispielhaft visualisiert, wie ein Algorithmus anhand von Bilddaten als Input lernt, Gesichter zu erkennen.

Vor diesem Hintergrund ist der große Vorteil eines maschinell lernfähigen Systems die Fähigkeit, sehr große Datenmengen bewältigen zu können. Auf dieser Grundlage lassen sich durch Machine Learning hochkomplexe Fragestellungen analysieren und hochspezialisierte Systeme für individuelle Aufgaben entwickeln. 

Ausgangspunkt für viele Unternehmen sind große, bislang ungenutzte Datenmengen und insbesondere Maschinendaten. Dass Machine Learning Methoden eine solche Relevanz haben, hat einen bestimmten Grund. Viele Unternehmen bemerken aktuell, dass sie eine enorme Mengen Daten erzeugen und diese entsprechend verwalten müssen. 

Im Machine Learning unterscheidet man zwischen vier Arten:  

  • Unsupervised Learning
  • Supervised Machine Learning 
  • Semi-Supervised Learning 
  • Reinforcement Learning 

Der wesentliche Unterschied besteht dabei im Lernvorgang.

2. Unsupervised Machine Learning

Unsupervised Learning wird hingegen dann benötigt, wenn in unzusammenhängenden Daten-Sets implizite Zusammenhänge erkannt werden sollen. Eine typische Aufgabe für Unsupervised Learning besteht darin, Objekte auf Fotos zu erkennen (Bilderkennung). Unter Verwendung eines neuronalen Netzwerks können Bilddaten nach Mustern und Ähnlichkeiten untersucht werden. 

Auch hier unterscheidet sich der maschinelle Lernvorgang von der „menschlichen“ Herangehensweise. Der Algorithmus zerlegt die Bilder in kleinste Bestandteile und sucht nach den grundlegenden Bestandteilen. In diesem Fall gilt: Je mehr Trainingsdaten vorliegen, desto besser wird die Erkennungsrate. 

Eine große Herausforderung ist es beispielsweise, ein und dasselbe Gesicht auch dann wiederzuerkennen, wenn es aus unterschiedlichen Perspektiven gezeigt wird. Das Problem ist, dass ein Programm kein räumliches Vorstellungsvermögen hat. Darum gelingt diese Aufgabe nur, wenn die Fähigkeit anhand vieler verschiedener Ansichten von Gesichtern vorab trainiert wurde. Dies nennt man auch Affective Computing.

In unserem Blogartikel zu Unsupervised Learning erfahren Sie mehr über die Charakteristiken und Funktionsweisen.

3. Supervised Machine Learning  

Supervised Learning wird überall dort eingesetzt, wo es bereits Ergebnisse für einen bestimmten Zusammenhang oder für ein vorhandenes Trainings-Set gibt. Diese Erkenntnisse sollen dann auf andere Anwendungsfälle, zu denen noch keine Ergebnisse vorliegen, übertragen werden. Ein typischer Anwendungsfall wäre die Klassifizierung, wenn beispielsweise eine Sortiermaschine automatisch die Äpfel einer Ernte verschiedenen Güteklassen zuordnen soll. Die Ergebnisse werden beim Supervised Learning dazu verwendet, ein System anzulernen. 
 

Ein Lernalgorithmus des Systems versucht dabei, eine Hypothese zu finden, auf deren Basis möglichst zielsicher die im Voraus bekannten Resultate erzielt werden. Das System erhält je nach vorhergesagtem Ergebnis ein Feedback (Lob bei Richtigkeit bzw. Bestrafung bei Fehlern). Auf Grundlage dieser sich wiederholenden Feedbackschleifen wird das System seinen Lernalgorithmus ständig optimieren und sich im Laufe der Zeit immer weiter den feststehenden Ergebnissen annähern. Supervised Machine Learning basiert somit auf dem Trial-And-Error-Prinzip.

4. Semi-Supervised Learning 

Teilüberwachtes Lernen (englisch „Semi-Supervised Learning“) stellte eine Mischung aus Überwachtem und Unüberwachtem Lernen dar. Es wird im Wesentlichen für die gleichen Zwecke eingesetzt wie das Supervised Machine Learning. Im Gegensatz zum Überwachten Lernen sind beim Teilüberwachten Lernen jedoch nur für einen Teil der Basisdaten die dazugehörigen Ergebnisse bekannt. Um mit ausreichend großen Datensätzen arbeiten zu können, werden im Teilüberwachten Lernen deshalb auch Basisdaten verwendet, bei denen die Zielvariable noch nicht vorhanden ist. 
 
In der Regel arbeiten Systeme beim Teilüberwachten Lernen mit einem kleinen Bestand an Daten mit bekannter Zielvariable und einem großen Bestand an Daten ohne bekannte Zielvariable. Hintergrund dafür ist, dass die Beschaffung von Datensätzen mit bekannter Zielvariable in der Praxis nicht selten mit einem sehr hohen Aufwand verbunden und folglich sehr kostenintensiv ist. Teilüberwachtes Lernen bietet sich somit an, wenn eine große Menge an Datensätzen zu wirtschaftlich vertretbaren Kosten analysiert werden soll. Ein sehr häufiger Anwendungsfall von Semi-Supervised Learning ist die Identifikation von Gesichtern auf Videoaufnahmen.

5. Reinforcement Learning 

Das Reinforcement Learning (auch „Bestärkendes Lernen“) ist ein Teilbereich des maschinellen Lernens, bei dem ein System selbständig eine Strategie erlernt, um erhaltene Belohnungen zu maximieren. Dabei wird dem System nicht vorgezeigt, welche Aktion in welcher Situation die beste ist, sondern es erhält zu festgelegten Zeitpunkten eine positive oder negative Belohnung (Lob oder Bestrafung). Auf Grundlage dieses Belohnungsfeedbacks lernt das System mit der Zeit, eine langfristig nutzenmaximierende Strategie auszuführen. 
 
Der Begriff des bestärkenden Lernens ist der Psychologie entlehnt und versucht das Lernverhalten in der Natur nachzubilden. Auch Kinder von Menschen und Tieren lernen auf Basis eines Belohnungssystems die für sie richtigen Entscheidungsstrategien. 
 
In Angrenzung zum Überwachten und Unüberwachten Lernen werden für das bestärkende Lernen vorab keine Daten benötigt. Das System bringt sich auf Basis der Simulationsumgebung in vielen Testdurchläufen selbst die ideale Strategie bei. 
 
Reinforcement Learning ist die Grundlage für Formen der künstlichen Intelligenz, die ohne menschliches Vorwissen komplexe Steuerungsproblematiken lösen kann. Verglichen mit konventionellen Lösungsansätzen lassen sich solche Aufgaben durch KI auf Basis von Reinforcement Learning wesentlich schneller, effizienter und im Idealfall sogar optimal lösen. 
 
Viele KI-Forscher sehen im bestärkenden Lernen eine vielversprechende Methode zur Erreichung einer generellen künstlichen Intelligenz. Reinforcement Learning ermöglicht es jeder Maschine, ähnlich wie ein Mensch beliebige, noch unbekannte intellektuelle Aufgaben erfolgreich zu bewältigen. 

6. Machine Learning Methoden

Beim Unsupervised Machine Learning ist der erwartete Output am Anfang des Lernvorgangs nicht bekannt. Dieser ergebnisoffene Ansatz ist also explorativer Natur. Der Lernvorgang vollzieht sich dadurch, dass der Algorithmus versucht, Daten in einer bestimmten Art und Weise zu clustern, also zu gruppieren, oder Anomalien zu identifizieren. 

Obwohl es eine große Anzahl an Machine Learning Methoden und Aufgaben gibt, die in eine dieser beiden Kategorien von Algorithmen fallen, lässt sich doch ein kleines Set von Standards herausstellen. 

Im Fall von Supervised Machine Learning gehören Classification und Regression zu den Standard-Methoden; im Fall von Unsupervised Machine Learning sind Clustering und Frequent Patterns häufig eingesetzte Methoden.

Classification und Regression 

Um die Bedeutung der Machine Learning Methoden wie Classification und Regression richtig zu erfassen, ist es wichtig sich vor Augen zu halten, dass diese die Grundelemente dessen darstellen, was unter den Begriff der KünstlichenIntelligenz gefasst wird. 

Die mathematischen bzw. statistischen Verfahren helfen intelligenten Systemen dabei, das Ordnen von Dingen und Ereignissen zu lernen. Sie machen dies selbstverständlich nicht bewusst, sondern wie in diesem Fall mit der Hilfe von Data Scientists, die die Lernvorgänge überwachen. Wie dies im Fall von unüberwachten Lernvorgängen funktioniert, erfahren Sie in unserem Blogartikel zu Unsupervised Machine Learning Methoden.  

Es gibt nicht den einen Algorithmus beziehungsweise Verfahren, um alle Classification-Aufgaben zu lösen. Es gibt vielmehr eine große Vielfalt an Unter- und Sonderformen. Viele von ihnen haben einen Ursprung in der Mathematik bzw. Statistik. 

Lineare Classification 

Die Lineare Classification – manchmal auch als „Linear Classifier“ bezeichnet – zielt darauf ab, eine ganz bestimmte, lineare Funktion zu bestimmen. Diese Funktion beschreibt eine Grenze, die Daten in zwei Klassen unterteilt: 

Koordinatensystem für Daten
Beschreibung: Die Daten aus der Tabelle werden in ein Koordinatensystem übertragen, wo eine lineare Funktion sie in zwei Klassen aufteilt.

Was sich zunächst nach einer sehr einfachen Methode anhört, findet in zahlreichen und teilweise komplexen Variationen Anwendung. Zu den beliebtesten Linear Classifiers zählen Support Vector Machines. Diese werden angewandt, um Daten in einem Vektorraum in zwei unterschiedliche Klassen zu unterteilen. Die „Kunst“ bei der linearen Klassifikation besteht darin, den Linear Classifier so optimal wie möglich zu definieren.

lineare Klassifikation
Bei der Linearen Klassifikation muss ein optimaler Verlauf für den Linear Classifier gefunden werden.

Nearest Neighbour oder die NN-Classification

Die Nächste-Nachbarn (NN) Klassifikation beziehungsweise der Nearest Neighbour Classifier ist eine einfache Methode mit dem Ziel, ähnliche Objekte zu identifizieren. In der Trainingsphase wird ein Algorithmus darauf trainiert, die Ähnlichkeit zwischen verschiedenen Trainingsobjekten zu finden. 

q, NN(q) = „dog“
In diesem Fall ist der Nächste Nachbar des Objekts q, NN(q) = „dog“.

Der Bayes Classifier 

Eine Form von Classification ist der sogenannte Bayes Classifier. Dabei handelt es sich um einen wahrscheinlichkeitsbasierten Ansatz, der auf den Satz von Bayes zurückgeht – ein mathematisches Theorem des britischen Mathematikers Thomas Bayes. Der Bayes Classifier wird oft zur Bestimmung von Kostenmaß oder Risiken genutzt. 

Ausgangsbasis sind auch hier vorhandene Trainingsdaten. Diese Datensätze sind nach einer bestimmten Wahrscheinlichkeit ihrer Zugehörigkeit in bestimmte Klassen sortiert. Je mehr Daten beim Training zur Verfügung stehen, desto präziser erfolgt die Klassifizierung. Ein Beispiel aus der Praxis kann verdeutlichen, wie mit Classification ein konkreter Nutzen entstehen kann.

Credit Scoring: Das leistet Classification in der Praxis

Für einen unserer Kunden aus dem Banking-Bereich entwickelten wir mit der Hilfe eines Classification-Algorithmus ein Scoring-System zur besseren Beurteilung des Ausfallsrisikos bei der Kreditvergabe (Credit Scoring). Es ging um kleine Notfall-Kredite zwischen 100 und 200 Euro. Da die meisten Kunden Einträge bei der Schufa hatten, musste ein alternatives Bewertungssystem entwickelt werden. 

m die Ausfallwahrscheinlichkeit zu ermitteln, nutzten wir Daten aus der persönlichen Kredithistorie und Transaktionen und auch von Social-Media-Aktivitäten. So konnten wir die Kunden nach bestimmten Kriterien in Gruppen klassifizieren, die Aussagekraft über die Zahlungsmoral beziehungsweise die Rückzahlwahrscheinlichkeit zuließ. 

Decision Trees oder Entscheidungsbäume helfen 

Eine weitere wichtige Sonderform zur Klassifikation von Daten sind Entscheidungsbäume, bzw. Decision Trees. Dabei nimmt das trainierte Machine Learning Modell eine Baumstruktur an. Dieses Modell ist besonders intuitiv verständlich, so dass die Classification anhand von leicht nachvollziehbaren Kriterien erfolgt. 

In der Praxis werden oft mehrere Decision Trees in Kombination miteinander angewandt, um die Genauigkeit der Entscheidungen zu erhöhen. In diesem Zusammenhang wird dann auch von Forest gesprochen.

Decision Tree
Ein einfaches Beispiel für einen Decision Tree zeigt hier die Risikobewertung im Bereich Versicherungen.

Regression

Regressions-Aufgaben wirken auf den ersten Blick sehr ähnlich zu den Klassifikationsaufgaben, dienen aber doch zur Beantwortung anders gelagerter Fragestellungen. Das lässt sich einfach an einem konkreten Beispiel erläutern. Verspätungen bei der Bahn oder im Flugverkehr sind an der Tagesordnung und darum ist es wichtig zu wissen, wie wahrscheinlich diese sind. 

So lassen sich Flüge in zwei Klassen „a“ und „b“ aufteilen – „a“ sind die verspäteten und „b“ die nicht verspäteten Flüge. Ein Classification-Model würde darauf trainiert, vorherzusagen, wie wahrscheinlich ein bestimmter Flug mit Verspätung ankommt. Als Grundlage für die Classification können dabei beispielsweise die vorherrschenden Windbedingungen herangezogen werden. 

Bei einem Regressions-Model wird im Gegensatz dazu vielmehr ein Zusammenhang zwischen Input und Output hergestellt. Eine Fragestellung für ein Regressions-Modell könnte lauten: Welche Anzahl an Minuten wird ein Flug bei bestimmten Windbedingungen wahrscheinlich Verspätung haben?

7. Wie funktioniert Machine Learning in der Praxis? 

Anwendungsfall 1: Nachfrageprognose zur Lageroptimierung 

In Zeiten, in denen die Lieferketten der Weltwirtschaft auf just-in-time Basis funktionieren, ist die korrekte Prognose der Nachfrage zur Optimierung der Lagerhaltung für die meisten Unternehmen eine Voraussetzung für das eigene wirtschaftliche Überleben. Unternehmen, die nicht in der Lage sind, ihre Lagerhaltung zu optimieren, sehen sich mit hohen Zusatzkosten konfrontiert, die einen massiven Wettbewerbsnachteil darstellen. 
 
Ein typischer Anwendungsfall einer solchen Nachfrageprognose zur Lageroptimierung auf Basis von maschinellem Lernen ist ein international agierender Händler von Ersatzteilen für Baumaschinen. Die Zielsetzung für so einen Ersatzteilhändler ist die bedarfsgerechte Bestückung seiner Läger, um seine Kosten zu optimieren, gleichzeitig jedoch eine optimale kurzfristige Versorgung seiner Kunden sicherzustellen.

Datenaufbereitung im Machine Learning


 
Als Datengrundlage für einen derartigen Anwendungsfall maschinellen Lernens können firmeninterne Daten zu den historischen Nachfragemengen nach bestimmten Produkten an unterschiedlichen Standorten herangezogen werden. Diese internen Daten lassen sich mit weiteren externen Daten kombinieren, die großen Einfluss auf die allgemeine Bautätigkeit haben (wie beispielsweise die Wirtschaftslage und die Wettersituation). 
 
Mithilfe von maschinellem Lernen lässt sich die konkrete Nachfrage nach bestimmten Produkten an verschiedenen Standorten mit hoher Genauigkeit vorhersagen. Im Ergebnis kann die Teileverfügbarkeit des Händlers verbessert und der Lagerumschlag erhöht werden, was wiederum eine Reduktion der Kosten bei gleichzeitiger Erhöhung der Umsätze zur Folge hat.

Anwendungsfall 2: Diagnose in Kraftwerken

Energieerzeuger sind in der Praxis häufig mit komplexen Fragestellungen in Bezug auf die Energieproduktion und –verteilung konfrontiert. Eine permanente Herausforderung besteht darin, alle Prozesse in Kraftwerken perfekt zu verstehen und dementsprechend ideal zu steuern. 

Ein typisches Beispiel für die Prozessoptimierung in Kraftwerken ist die Vermeidung von Dampfüberhitzung in einem Dampfkraftwerk, die zu Ruß- und Ascheablagerungen führt und die Wärmeübertragung beeinträchtigt.

Lernsystem zur Diagnose in Kraftwerken

Über maschinelles Lernen können Lernalgorithmen definiert werden, die den Zusammenhang zwischen der Aktivität der Rußbläser und der Auswirkungen auf die Überhitzungsstufen verstehen helfen. Auf Grundlage dieses Verständnisses kann im Anschluss ein intelligentes System zur automatischen Steuerung der Einspritzkühlung installiert werden.

Anwendungsfall 3: Reduktion der Risikofragen bei Versicherungen

Maschinelles Lernen bietet besonders im Hinblick auf die in allen Branchen schnell voranschreitende datengetriebene Digitalisierung ungeahntes Optimierungspotenzial. Die Versicherungsbranche zählt aufgrund der hohen Verfügbarkeit valider Daten zu denjenigen Industrien, in denen mit maschinellem Lernen die größten Verbesserungen möglich sind. 

Ein typisches Beispiel für die Prozessoptimierung bei Versicherungen ist die Vereinfachung der Antragstellung für Neukunden. Zu lange und komplexe Antragsformulare für Versicherungen schrecken viele Kunden vom Abschluss einer neuen Versicherung ab.  

Gleichzeitig haben Versicherungen ein hohes Interesse daran, möglichst viele risikorelevante Informationen über ihre Kunden in Erfahrung zu bringen. Maschinelles Lernen ermöglicht, das Beste aus beiden Welten miteinander zu verbinden – weniger Fragen im Versicherungsantrag bei gleichzeitig gleichbleibender Risikoprognose für die Versicherung. 

Im konkreten Fall kann maschinelles Lernen Risikofragen durch die automatische Auswertung von Daten externer Anbieter ersetzen. Ein Algorithmus ist in der Lage, einen Katalog aus Tausenden Merkmalen zu analysieren und die geeigneten Merkmale zum Ersatz von Risikofragen zu identifizieren. So kann es gelingen, die Zahl der Risikofragen im Versicherungsantrag massiv zu reduzieren, ohne die Prognosegüte für die Versicherung negativ zu beeinträchtigen. 

Autor:innen

[at] REDAKTION

Unsere AT Redaktion besteht aus verschiedenen Mitarbeitern, die mit größter Sorgfalt und nach Bestem Wissen und Gewissen die entsprechenden Blogartikel ausarbeiten. Unsere Experten aus dem jeweiligen Fachgebiet versorgen Sie regelmäßig mit aktuellen Beiträgen aus dem Data Science und AI Bereich. Wir wünschen viel Freude beim Lesen.

0 Kommentare