Para aplicar el aprendizaje automático supervisado, necesitamos datos etiquetados. El objetivo de los algoritmos de aprendizaje automático supervisado es crear un modelo que determine o prediga una variable objetivo con la mayor precisión posible. Dentro del aprendizaje automático supervisado, distinguimos entre problemas de regresión y clasificación, que difieren en la forma de la variable objetivo:
- Problemas de regresión: La variable objetivo es numérica. Ejemplos de variables objetivo numéricas son el número de productos vendidos y la probabilidad de que un visitante de un sitio web haga clic en un enlace.
- Problemas de clasificación: La variable objetivo es categórica. Ejemplos de variables objetivo categóricas son "¿Contiene spam un correo electrónico, sí o no?" y "¿De qué color es el semáforo ahora mismo, rojo, amarillo o verde?".