¿Qué es la GPT-3?

GPT-3 (Generative Pretrained Transformer 3) es un módulo de lenguaje de tercera generación desarrollado por OpenAI se desarrolló y se basó en Procesamiento del lenguaje natural (PLN)-modelos. Es el modelo predecesor de GPT-4.

La empresa, cofundada por el consejero delegado de Tesla, Elon Musk, se dedica al desarrollo de Soluciones de código abierto en el ámbito de inteligencia artificial y se ha fijado el objetivo de averiguar sus ventajas para la humanidad. Para los fundadores, así como para algunos científicos, existe el peligro de que la inteligencia humana sea superada o sustituida por la inteligencia artificial.

En comparación con sus predecesoras GPT-1 y GPT-2, la versión actual, que se introdujo en mayo de 2020, ha logrado varias mejoras. La primera versión, GPT-1, era un modelo de PLN que, a diferencia del estado anterior de la técnica, no tenía que entrenarse específicamente para una tarea concreta, sino que solo requería muy pocos ejemplos para obtener un resultado de habla de alta calidad. El personal de OpenAI siguió desarrollando este modelo ampliando el conjunto de datos que lo sustentaba, añadiendo más parámetros y creando así GPT-2.

Este módulo lingüístico también tiene capacidad para entender instrucciones como tales, por ejemplo, para traducir textos automáticamente mediante instrucciones de texto. Mientras que GPT-1 y GPT-2 están disponibles gratuitamente como software de código abierto, con el modelo de lenguaje GPT-3 se llevó a cabo una comercialización del producto. OpenAI argumenta esta medida alegando que distribuir libremente la nueva versión supone un riesgo demasiado grande de propagación de información errónea y spam o de redacción fraudulenta de artículos académicos debido a su gran rendimiento.

¿Cómo funciona el modelo lingüístico?

En comparación con su predecesora, la tercera versión tiene en cuenta cien veces más parámetros y utiliza cinco conjuntos de datos (Common Crawl, WebText2, Books1, Books2 y Wikipedia), mientras que GPT-1 (Book Corpus) y GPT-2 (WebText) sólo utilizan uno cada una. Conjunto de datos de entrenamiento accesos.

La idea básica de muchos módulos lingüísticos a la hora de generar textos es utilizar modelos estadísticos para predecir las siguientes palabras de un texto, de modo que éste tenga sentido gramatical y lingüístico. El software de IA GPT-3 no trabaja con palabras o letras, sino con los llamados tokens. Básicamente, se trata de una secuencia de caracteres que van juntos. De este modo, la IA del habla GPT-3 consigue introducir varianza en la salida del habla, lo que sería más difícil de representar considerando palabras enteras.

El módulo de lenguaje aplica los siguientes modelos (denominados motores) para el análisis y la generación de textos: Davinci, Curie, Babbage y Ada. Cada uno de ellos ofrece ventajas e inconvenientes para determinados ámbitos de aplicación. Mientras que Davinci es adecuado para el análisis de textos complejos, Curie lo es para el uso de un chatbot de servicios. El usuario especifica éste y otros parámetros para determinar el resultado. Tales parámetros son, por ejemplo, la creatividad del texto de salida, así como su longitud.

La IA lingüística GPT-3 se desarrolló para el idioma inglés y actualmente sólo puede desarrollar todo su potencial en este idioma, aunque ofrece opciones de traducción.

¿En qué software se utiliza GPT-3?

Básicamente GPT-3 puede utilizarse actualmente a través de la interfaz API y el pago correspondiente. Microsoft, por su parte, se ha asegurado la licencia exclusiva del código fuente de GPT-3 para integrar el módulo lingüístico en sus propios productos y seguir desarrollándolo. Por ejemplo, Microsoft Azure OpenAI combina la IA de voz con los servicios de Microsoft de seguridad, gestión de acceso y capacidad de escalado. Se dice que esta solución global interesa especialmente a las empresas.

Además, es posible GPT-3 por ejemplo también en Chatbots para que el software ayude a mantener conversaciones y ofrezca asistencia. El ejemplo más conocido del uso en chatbots es el servicio propiedad de Microsoft ChatGPT. Además, también se utiliza en el desarrollo de juegos para crear diálogos y argumentos automáticos en juegos de ordenador. Gracias a la parametrización del motor, también se pueden crear e implementar textos completos de marketing, páginas de aterrizaje o boletines informativos, por ejemplo, a partir de una pequeña cantidad de información.