¿Qué es la generación de lenguaje natural?

La generación de lenguaje natural o generación de texto es la producción automática de lenguaje natural por parte de una máquina. NLG es una forma especial de inteligencia artificial. Un proceso de generación utiliza diferentes modelos de descripción y términos técnicos bajo diferentes métodos y perspectivas. Los enunciados deben estar libres de contradicciones. Según una propuesta de Ehud Reiter, puede utilizarse una arquitectura compuesta por un planificador de textos y un planificador de frases, así como un realizador de superficies por defecto.

La teoría de las estructuras retóricas se utiliza para las relaciones del discurso. Un texto es coherente si puede representarse de forma coherente mediante un árbol de relaciones retóricas y unidades textuales elementales. Existen relaciones entre las cláusulas principales y subordinadas y, por tanto, los nexos de unión:

  • CAUSA
  • RESULTADO
  • ELABORACIÓN
  • CONTRASTE
  • SECUENCIA
  • LISTA
  • CONCESIÓN
  • y más

Según M. Hess, la generación requiere dos componentes. Un componente estratégico determina lo que se va a decir. Así tienen lugar la selección de la información, la selección del contenido y la planificación del alcance. Para este componente se utilizan estrategias de búsqueda y planificación de inteligencia artificial. También existe el componente táctico. En este componente se determina cómo debe decirse algo. Así se planifica la forma lingüística. Aquí se utiliza una gramática adaptada al aspecto generativo.

Ulrich Gaudenz Müller desarrolló un sistema de generación de textos llamado SARA (Satz-Random-Generator) junto con el germanista y lingüista informático Raimund Drewek. El requisito previo para la generación es que la información esté disponible de forma formal, lingüística informática y pueda extraerse, por ejemplo, de bases de datos o representaciones del conocimiento. Hay ámbitos de aplicación en el periodismo robótico, los chatbots y el marketing de contenidos.

¿Cuáles son los campos de aplicación de la generación de lenguaje natural?

La Generación de Lenguaje Natural (NLG) puede utilizarse allí donde sea necesario generar datos estructurados, por ejemplo en el comercio electrónico o en la bolsa. También puede utilizarse en informes deportivos, comerciales y meteorológicos. El objetivo es crear textos de fácil lectura.

¿Qué tecnologías se emplean para el NLG?

"Big Data" puede incluirse en la creación de textos. De este modo, se pueden presentar hechos e interpretar cifras en detalle. El resultado puede transmitirse a un CMS. El popular lenguaje de programación Python puede utilizarse para generar, traducir y editar textos. Aprendizaje profundo a utilizar.

¿Cuáles son los niveles de NLG?

Hay análisis de contenido, comprensión de datos, estructuración de documentos, composición de frases y estructuración gramatical y presentación del lenguaje. En el análisis de contenido, los datos se filtran para determinar qué debe incluirse en el contenido. En la comprensión de datos, éstos se interpretan, a menudo con ayuda del aprendizaje automático. La estructuración del documento se planifica con el documento y se selecciona una estructura narrativa.