Die Bandbreite der Aufgaben, die eine Maschine lernen kann, ist sehr groß. Im Allgemeinen unterscheiden wir zwischen drei verschiedenen Arten, wie eine Maschine diese Aufgaben lernen kann: Supervised Learning, Unsupervised Learning und Reinforcement Learning. Im Wesentlichen unterscheiden sich die drei Lerntypen in zwei Aspekten: 

  • Die Art und Existenz der sogenannten Zielvariablen
  • Die Art und Weise, wie die Modelle trainiert werden 

Das Reinforcement Learning ist die dritte große Art, auf die eine Maschine lernen kann. Das Ziel des Reinforcement Learning ist es, ein Modell in einer bestimmten Umgebung optimale Entscheidungen treffen zu lassen. Zum Beispiel würde ein Reinforcement-Learning-Algorithmus für autonomes Fahren darauf abzielen, Entscheidungen zu treffen, die sicherstellen, dass der gesamte Verkehr sicher ist und reibungslos fließt. Anders als beim überwachten und unüberwachten Lernen, bei dem wir vorhandene Daten verwenden, wird das Modell beim Reinforcement Learning in eine Umgebung gesetzt, die es selbst erkunden und dabei Daten erzeugen soll. Dies kann mit einer Simulation verglichen werden. 

Reinforcement Learning zieht in der Machine Learning-Gemeinschaft zunehmend Aufmerksamkeit auf sich. Im Gegensatz zu anderen Arten des Lernens ist es nicht auf die Verfügbarkeit von vorhandenen Daten angewiesen, da es seine eigenen Daten durch Simulationen generiert und daher in einer Vielzahl von unterschiedlichen Situationen eingesetzt werden kann. Während sich das Reinforcement Learning noch im Forschungsstadium befindet, können wir erwarten, dass es bei bahnbrechenden Entwicklungen in der Entwicklung von KI zum Einsatz kommt. 

Die Hauptidee des Reinforcement Learning ist es, einen (Software-)Agenten in eine Umgebung zu setzen, in der er Aktionen ausführen kann, um für sich selbst den bestmöglichen Effekt zu maximieren.