Um überwachtes Machine Learning anzuwenden, benötigen wir gelabelte Daten. Das Ziel von überwachten Machine Learning-Algorithmen ist es, ein Modell zu erstellen, das eine Zielvariable so genau wie möglich bestimmt oder vorhersagt. Innerhalb des überwachten Machine Learning unterscheiden wir zwischen Regressions- und Klassifikationsproblemen, die sich durch die Form der Zielvariablen unterscheiden: 

  • Regressionsprobleme: Die Zielvariable ist numerisch. Beispiele für numerische Zielvariablen sind die Anzahl der verkauften Produkte und die Wahrscheinlichkeit, dass ein Webseitenbesucher auf einen Link klickt.
  • Klassifikationsprobleme: Die Zielvariable ist kategorisch. Beispiele für kategoriale Zielvariablen sind „Enthält eine E-Mail Spam, ja oder nein?“ und „Welche Farbe hat die Ampel gerade, rot, gelb oder grün?“.