AT_Logo

Machine Learning Modell

Ein Modell ist die Wiedergabe irgendeines Aspekts aus der echten Welt. Gute Modelle sind sparsam, fokussieren sich also auf die Teile, die relevant sind. Bei Machine Learning spiegeln Modelle auch immer einen Aspekt aus der richtigen Welt wieder. Um genauer zu sein, versuchen sie normalerweise eine bestimmte Zielvariable durch die Nutzung von Inputvariablen hervorzusagen oder zu bestimmen.

Eine Machine Learning Modell besteht aus mathematischen Funktionen (also einem Set von Regeln), die zugrundeliegende Verbindung zwischen der Zielvariable und der Inputvariable wiedergeben sollen. Machine Learning Modelle werden durch sog. Modelltraining entwickelt.

Es gibt unterschiedliche Modellklassen im Bereich des Machine Learning, die sich darin unterscheiden, wie sie die echte Welt wiedergeben. Abhängig vom zugrundeliegenden Problem eignen sich manche Modellklassen für bestimmte Prozesse besser als andere. 

Machine Learning Modelle sind der Kern der überwiegenden Mehrheit der heutigen KI-Systeme. 

Machine Learning Modelle werden durch einen als Modelltraining bezeichneten Prozess entwickelt. Während des Modelltrainings versorgen wir ein Machine Learning Modell mit bestehenden Daten, aus denen das Modell die relevanten Zusammenhänge zwischen unabhängigen und Outputvariablen identifizieren und zeigen kann.

In unserem Größen-Gewichts-Beispiel wurde das Modell mithilfe eines Datensatzes von einigen Dutzend Personen trainiert. Wenn wir ein Modell trainieren wollen, müssen wir uns für eine Modellklasse entscheiden. Es gibt unterschiedliche Modellklassen beim Machine Learning; zum Beispiel lineare Modelle, baumbasierte Modelle und neurale Netze.

Diese Modellklassen unterscheiden sich darin, wie sie die echte Welt wiedergeben. Daher eignen sich bestimmte Modellklassen besonders für bestimmte Probleme. Zum Beispiel versuchen neurale Netze die Struktur des menschlichen Gehirns widerzuspiegeln, um Prozesse der echten Welt zu reflektieren und eigenen sich besonders gut für Computer Vision und Probleme natürlicher Sprachen. 

Data Navigator Newsletter