¿Qué son las máquinas de vectores soporte?

Las máquinas de vectores soporte (SVM) son algoritmos basados en un procedimiento matemático que se utilizan para clasificar o regresionar objetos. Estos objetos se representan mediante puntos de datos. Para la clasificación, se forman vectores de soporte paralelos por determinados pares de puntos, que dan nombre al método. Los vectores soporte con mayor distancia separan las clases entre sí.

¿Dónde deben clasificarse las máquinas de vectores soporte?

Una sección del Inteligencia artificial es el aprendizaje automático, que se encuentra en Aprendizaje supervisado y el aprendizaje no supervisado. Las SVM pertenecen a los algoritmos de aprendizaje supervisado, que se basan en un conjunto de datos de entrenamiento que ya contiene la clasificación correcta de los puntos de datos.

Este Algoritmos están especializados en clasificar previamente determinados objetos con el conjunto de datos de entrenamiento en la fase de aprendizaje. En la fase de aplicación posterior, los algoritmos pueden clasificar objetos desconocidos. En función de la precisión requerida de los resultados, la fase de aprendizaje puede repetirse tantas veces como se desee con más datos de entrenamiento para aumentar la proporción de objetos clasificados correctamente.

¿Cómo funcionan las máquinas de vectores soporte?

Las SVM pasan por los siguientes pasos en la fase de aprendizaje: Los datos de entrenamiento se dividen en función de la clasificación. Para ambas clases, se identifican las posiciones de los puntos de datos y se realiza la división en puntos que están en el borde de una clase y puntos que están rodeados por otros puntos de la misma clase. Ahora se encuentran los dos puntos de borde de las clases que tienen la menor distancia entre sí y se traza una línea recta entre ellos.

Por el centro de esta recta se traza una perpendicular inclinada alrededor del punto de intersección, de forma que divida correctamente las dos clases. Se forma la máxima distancia posible entre la perpendicular inclinada y todos los demás puntos límite de ambas clases. Este plano se denomina hiperplano. Los vectores soporte son las paralelas del hiperplano que se trazan a través de los puntos de borde con la menor distancia.

¿Cómo se utilizan las SVM?

Las SVM se utilizan para clasificar grandes cantidades de datos. Dado que este procedimiento puede desarrollar una elevada demanda computacional, pueden definirse las denominadas variables de holgura para mejorar el rendimiento. Éstas también sirven para evitar el sobreajuste y permitir puntos de datos únicos clasificados incorrectamente.
Es posible realizar clasificaciones no lineales además de lineales.

Las SVM para la clasificación no lineal se amplían con el método del núcleo, que puede producir resultados considerando más dimensiones. Para ello, los datos de entrenamiento se transfieren a un espacio de mayor dimensión hasta que se puede formar un hiperplano lineal. Cuando éste se transfiere a la dimensión original, se convierte en un plano no lineal que puede clasificar objetos correctamente.