¿Qué es ChatGPT?

ChatGPT describe una Chatbotque se basa en inteligencia artificial puede interactuar con la gente. Los chatbots son básicamente capaces de establecer una comunicación entre un humano y una máquina.

ChatGPT fue publicado por su desarrollador OpenAI en noviembre de 2022 y se considera el sucesor de los modelos InstructGPT. OpenAI es una empresa estadounidense que investiga la inteligencia artificial y cuenta con el apoyo de Elon Musk y Microsoft, entre otros. La organización sin ánimo de lucro, fundada en 2015, también publicó los módulos de lenguaje GPT-2 y GPT-2, entre otros. GPT-3 y el programa DALL-E y su sucesor, DALL-E 2, que son capaces de Aprendizaje automático para crear imágenes a partir de descripciones de texto.

¿Cómo funciona el modelo lingüístico?

Mientras que ChatGPT se comercializa como un modelo hermano del ya mencionado InstructGPT, el algoritmo se basa en un Modelo de GPT-3, concretamente la serie GPT-3.5. En la última versión, ChatGPT utiliza la iteración del modelo GPT-4.

El modelo lingüístico utiliza lo que se conoce como "aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF)", según el cual las bases del modelo se sientan mediante aprendizaje supervisado (aprendizaje supervisado). Para ello formadores humanos utilizado para Datos de formación asumiendo el papel tanto del usuario como del asistente de IA.

En el segundo paso, colaboraron en la creación de modelos de recompensa para el aprendizaje por refuerzo (aprendizaje por refuerzo) del modelo evaluando las respuestas generadas por los formadores. Sobre esta base, el Modelos de recompensa mediante la optimización de políticas proximales refinarse.

Acceso en línea

ChatGPT puede descargarse actualmente de la página Sitio web de OpenAI se puede llamar y utilizar. Tras el registro mediante una cuenta OpenAI y el inicio de sesión con éxito, el modelo puede ser actualmente gratuito limitado o Cobrable sin restricciones ser utilizado.

OpenAI espera recibir comentarios de los usuarios en esta fase, así como pruebas de los puntos fuertes y débiles de la herramienta. Los acuerdos de usuario dejan claro que el modelo lingüístico no puede utilizarse con fines que vulneren los derechos de las personas a descubrir el código fuente, desarrollar otros modelos a gran escala que compitan con OpenAI o declarar que los datos de salida son generados por humanos cuando no lo son.

El modelo lingüístico está diseñado para comunicarse con los usuarios en formato de diálogo. También debe ser capaz de responder correctamente a las preguntas de seguimiento dentro de una conversación. Esto es posible porque ChatGPT stateful es y es Le recuerda las indicaciones anterioresDe este modo, el usuario puede referirse a él y el modelo lingüístico lo entiende.

ChatGPT también debe ser capaz de rechazar solicitudes inapropiadas e ilegales y rechazar respuestas. Limitaciones de la función afirma la empresa al señalar que el chatbot genera a veces respuestas plausibles pero erróneas y sin sentido. Las causas de este comportamiento se discuten y justifican con el hecho de que durante el aprendizaje por refuerzo no hay una fuente de verdad, en el aprendizaje supervisado el conocimiento del formador humano es decisivo, y una política de respuestas conservadora o más cautelosa lleva a que las preguntas queden sin respuesta aunque el sistema podría responderlas correctamente. Además, ligeros cambios en la entrada pueden provocar un cambio en la respuesta de salida o, en el caso de consultas ambiguas, el modelo intenta adivinar y responder a la pregunta prevista en lugar de hacer una consulta.

ChatGPT suele proporcionar respuestas muy extensas, ya que éstas han sido preferidas por los formadores y, por tanto, se recompensan más. Aunque el modelo lingüístico está entrenado para evitar peticiones inapropiadas, esto no se puede evitar del todo.