La Generación de Lenguaje Natural (GLN o NLG por sus siglas en inglés) se puede entender como un subcampo del Procesamiento del Lenguaje Natural (PLN) donde la diferencia es el enfoque sobre el lenguaje, la GLN consiste en crear de forma automatizada texto con el fin de comunicarse. Este texto puede tener diversas aplicaciones cómo, la generación de informes, por ejemplo, para la generación de noticias o informes del clima, la traducción entre idiomas, los sistemas de diálogo, como los Chatbots y asistentes personales, la generación de historias, el mejor ejemplo es el videojuego Dungeon AI, que genera una historia de acuerdo a los parámetros dados por el usuario, como género literario, ambiente, protagonista, etcétera, la generación de poesía, la generación de texto con humor, etc. En este trabajo se presenta el caso particular de la generación de poesía en español, es una tarea que combina diversas ramas del conocimiento, como son la Inteligencia Artificial, la Lingüística, la Literatura, la Semántica, la Gramática, y la Creatividad Computacional, entre otras. Se decidió por el idioma español debido a que existen menos trabajos que en lenguajes más populares como el inglés o el chino. Se usaron modelos de redes neuronales recurrentes, que son generalmente empleados para tareas del PLN. También se utilizaron los modelos de redes neuronales de mayor potencia en la actualidad conocidos como Transformers, para tratar el problema y mostrar el potencial del uso de estos modelos masivos. Entre las aportaciones de este trabajo está la creación de una base de datos desde cero de más de 10 mil poemas en español, exclusivamente desarrollada para el problema. También el desarrollo de modelos de Redes neuronales, usando Long Short Term Memory (LSTM) y Gated Recurrent Unit (GRU), uso de Embeddings como Word2Vec para la codificación del lenguaje y por ´último, el entrenamiento y uso de un modelo Transformer, en este caso se usó GPT-2, siendo la primera vez que se usa este tipo de modelos para la tarea de generación de poesía en español.
Des relations
Dans l'ensemble administratif: |
|
Descriptions
Nom d'attribut | Valeurs |
Creador |
|
Contributeurs |
|
Tema |
|
Editor |
|
Idioma |
|
Identificador |
|
Mot-clé |
|
Año de publicación |
|
Tipo de Recurso |
|
Derechos |
|
División académica |
|
Línea académica |
|
Licencia |
|