Poetas para la IA: los modelos de lenguaje quieren calidad literaria

  • Aumenta la demanda de profesionales de la escritura creativa entre las compañías del sector
  • Las capacidades creativas de los modelos son limitadas, especialmente en idiomas distintos al inglés

Los grandes modelos de lenguaje impulsados por inteligencia artificial ya no se conforman con generar textos correctos, rigurosos y completos. Ahora aspiran también a producir resultados que gocen de cierta calidad literaria o refinamiento creativo. Así se deduce, al menos, de las ofertas de empleo de compañías del sector, en las que los poetas y otros profesionales de la literatura y las humanidades están figurando en lugares cada vez más prominentes

Así se recoge en un reportaje publicado en la página web Rest of World, especializada en información del sector tecnológico, en el que se señala que compañias como Scale AI y Appen, que trabajan en etiquetado y entrenamiento de datos para los gigantes del sector (OpenAI, Microsoft, Google, Meta…), están buscando reforzar sus equipos con poetas, novelistas, dramaturgos y escritores con altos grados de formación. Una característica de estas ofertas es que no buscan solo profesionales angloparlantes, sino personas que dominen otras lenguas como el hindú o el japonés o que conozcan idiomas con reducida presencia en la red.

Estos profesionales trabajan en la escritura de relatos que alimenten los modelos de lenguaje

Las tareas para las que estos profesionales se demandan son la escritura de relatos cortos que alimenten los modelos de generación de lenguaje y la revisión de los resultados de los mismos para evaluar su calidad literaria. Un portavoz de Appen citado en el reportaje de Rest of World señala que la demanda de colaboradores literarios en las empresas de IA, tanto en inglés como en otros idiomas, se ha incrementado significativamente desde finales de 2022.
“Cuando contratamos a colaboradores de este tipo”, señala el portavoz de la compañía, “identificamos el tipo de habilidades requeridas para desarrollar entrenamiento de datos de alta calidad para un uso y un cliente concretos”, y añade que los escritores tienen una experiencia singular que permite a Appen desarrollar adiestramiento para usos creativos de la IA como pueden ser la poesía, las letras de canciones o la narración.

Prestigio y ventaja competitiva

El perfeccionamiento de este tipo de capacidades en los grandes modelos de lenguaje consigue dos objetivos: prestigio para el sistema de IA y una ventaja competitiva para la compañía que lo desarrolla. Con referencia al primero, el reportaje cita a Dan Brown, Profesor de la Universidad de Waterloo especializado en creatividad conceptual, que dice: “Una cosa es poder replicar en francés el estilo de los titulares de los tabloides. Pero si el producto puede imitar con fidelidad el estilo de Victor Hugo, se consigue una clase diferente de credibilidad. Replicar las formas del lenguaje clásico es una manera de parecer prestigioso”.

El objetivo de la ventaja competitiva se refiere al hecho de que, a la vista de la gran competencia que existe en el campo de la IA generativa, ser el primero en ofrecer cierto servicio o capacidad -en este caso, la de generar lenguaje creativo o literario en determinada lengua- puede resultar muy beneficioso.  

El problema a la hora de conseguir este tipo de resultados es que los modelos de lenguaje están adiestrados para imitar, no para crear 

El problema de base a la hora de conseguir este tipo de resultados es que los modelos de lenguaje están adiestrados para imitar, no para crear o ser innovadores. En un reportaje publicado en el diario El País el pasado mes de marzo titulado “Chat GPT contra la poesía: ¿puede escribir versos la inteligencia artificial?”, los especialistas Guillermo Marco y Julio Gonzalo, investigadores de la UNED, abordaban este tema diciendo que los modelos de lenguaje “antes están hechos para imitar que para ser originales. Aprenden a decir lo menos sorprendente". 
Marco ponía el ejemplo de que si le pides a ChatGPT que complete la frase “El cielo es…”, de las 50.000 palabras que ha aprendido, siempre escogerá azul, porque es la más probable.
Dan Brown abunda en la misma idea en el reportaje de Rest of World cuando dice que para los seres humanos escribir poesía de calidad es muy difícil, y que además los poetas someten sus obras a un largo proceso de revisión y corrección, algo para lo que los modelos de lenguaje no están entrenados. “Incluso ahora, después de que la revolución de los modelos de lenguaje ha empezado, estas máquinas no están hechas para lo novedoso”. 

Noticias Relacionadas

El reportaje señala asimismo que hay evidencia de que los desarrolladores de los modelos de lenguaje los han entrenado, en lo que a escritura literaria se refiere, apoyándose en fuentes de datos fácilmente accesibles y aprovechables, y entre ellas se cita Project Gutenberg, una base de datos abierta que contiene decenas de miles de obras literarias cuyos derechos han pasado a ser de dominio público. 

La cuestión es que, como sucede con la mayoría de la información contenida en internet y de la que se han alimentado estos modelos, estas bases de datos están mayoritariamente en inglés; de ahí la necesidad de alimentarlos con poesía y escritura literaria en otros idiomas a la que ahora las compañías de adiestramiento y etiquetado de datos quieren dar respuesta contratando a literatos.

Abrir Formulario