Formulario de búsqueda

Diseñando diálogos con la Inteligencia Artificial

Compartir en:

Diseñando diálogos con la Inteligencia Artificial

  • El IV VoiceXMeetUp se ha centrado en el diseño de diálogos y conversaciones con la Inteligencia Artificial
  • Han participado desarrolladores de Google y Amazon, diseñadores y lingüistas computacionales

¿Qué pasa cuando los diálogos que diseñamos para la Inteligencia Artificial se enfrentan a los usuarios?

A esta pregunta se ha tratado de dar respuesta en el IV VoiceXMeetUp, un evento sobre tendencias en el entorno de la voz que organizan Sngular, Mahou San-Miguel y PS21 y del que Reason Why es Media Partner Oficial.

Los lingüistas computacionales son un perfil clave en el diseño de diálogos

El objetivo de este IV encuentro ha sido el de compartir con la comunidad del MeetUp cómo se diseñan/crean/implementan/prueban/refinan diálogos entre personas e IA. Así, el trasfondo de esta jornada se podría resumir en "qué pasa cuando mis usuarios no se relacionan con mi sistema con formularios y botones que yo he diseñado".

Para encontrar algunas respuestas y descubrir que no estamos condenados al caos - que podemos entender qué dicen y qué quieren los usuarios - en este encuentro se ha celebrado una mesa redonda con lingüistas computacionales, moderados por Natalia Marín, Directora de Contenidos de Reason Why.

La razón de ser del lingüista computacional hoy en día en el desarrollo de conversaciones para la Inteligencia Artificial no es otra más que aportar comprensión y entendimiento sobre cuáles son las propiedades del lenguaje, para que a los desarrolladores les resulte más sencillo diseñar estos diálogos.

TTS es la tecnología que se encarga de pasar el texto a voz

Y es que un lingüista puede dar apoyo en cualquiera de las fases de desarrollo en las que los ingenieros trabajan para que la conversación humano-máquina sea una realidad. Camino Moraleda, UX Lead en Samsung España, las mencionaba precisamente durante su ponencia para aclarar qué significan las siglas de cada fase:

  • ASR (Automatic Speech Recognition): la tecnología que se encarga de pasar la voz a texto
  • NLU (Natural Language Understanding): lo que permite que el asistente virtual aprenda y entienda las diferentes maneras de dirigirnos a él
  • NLG (Natural Languge Generation): generación de los diálogos
  • TTS (Text to Speech): la tecnología que se encarga de pasar el texto a voz

Volviendo a la mesa redonda con lingüistas, “revisar, corregir, adaptar textos al español y detectar erratas” son algunas de las tareas que desarrollan estos profesionales durante el diseño de diálogos, tal y como ha explicado Leticia Martín-Fuentes, lingüista computacional de Adecco para Google. “Ahora somos bastante más imprescindibles”, ha añadido.

Y es que una profesión que, a priori, no tenía vigencia en la era digital, se ha revalorizado. “Estamos en un momento muy importante porque por fin en la empresa tecnológica se está hablando de perfiles de humanidades”, ha recalcado Luca de Filippis, lingüista computacional que está en el equipo de Sngular.

El usuario ya no se conforma con pulsar un botón, quiere disfrutar del proceso y ser protagonista

La realidad es que “el usuario ya no se conforma con pulsar un botón, sino que quiere disfrutar del proceso y ser protagonista”, ha comentado Luca, “así que nosotros podemos aportar creatividad para llegar al público”.

Perfiles técnicos y perfiles de humanidades ahora van más de la mano que nunca pero, ¿se entienden, se llevan bien? “Nosotros hacemos el trabajo sucio que los ingenieros no quieren hacer porque se aburren”, ha reconocido Juan Fernández, lingüista computacional que está en el equipo de Samsung. “En general nos llevamos bien, aunque tenemos mentes totalmente opuestas. La clave está en que los equipos sean diversos y multidisciplinares para que podamos aprender los unos de los otros”, ha añadido Leticia.

Una muestra de este trabajo en equipo tan importante la hemos presenciado en el propio evento, cuando Jorge del Casar, Google Developer Expert en Web Technologies & Assistant, nos ha puesto un ejemplo de cómo crear una Action on Google desde cero hasta probarla en un dispositivo físico y ha cometido una errata a la hora de titular el proyecto. Precisamente en este punto, cuando un programador está “picando” código para convertir texto en voz y viceversa, es cuando más falta hacen los lingüistas, para controlar que todo esté bien escrito y funcione.

En cualquier caso, la demo que ha realizado Jorge creando su Action en menos de media hora, y en directo, ha sido muy valorada por los asistentes y ha demostrado que es posible diseñar diálogos con la Inteligencia Artificial de una manera ágil.

¿Cómo se prepara un lingüista computacional hoy en día?

La autoformación puede ser una de las maneras en las que un lingüista computacional se prepare para este escenario en el que participe en el diseño de conversaciones con Inteligencia Artificial. Así es como lo ha hecho Leticia Martín-Fuentes, lingüista computacional de Adecco para Google, quien también ha sido curiosa e inquieta a la hora de formarse y ha aprendido incluso programación. “No es necesario saber programar, pero sí es importante entender código como cuando estudiamos un idioma y adquirimos comprensión lectora”, ha recomendado.

¿El Excel es el peor enemigo de un lingüista computacional?

Y es que las herramientas de trabajo son las que son, tal y como ha dicho Luca, quien ha reconocido que el Excel es su peor enemigo: “Hay tareas tediosas que requieren mucha lógica”, pero recoger todas las opciones de conversación en reglas y patrones, pese a ser un trabajo duro que requiere de mucha conversación, “te hace fuerte”.

En este sentido Jesús Martín, VUI & UX designer for Alexa at Amazon, ha planteado en su ponencia qué cosas están bien y qué cosas están mal en cuanto a diseño de conversaciones, qué cosas faltaría plantear para que funcionara y qué palabras concretas deberíamos usar.

Algunos datos sobre el estado actual de los asistentes virtuales

Antes de entrar en el terreno de la voz y ponernos a desarrollar conversaciones, debemos analizar cuál es el estado actual de la penetración de asistentes virtuales en el mundo. Los datos los ha presentado Camino Moraleda, UX Lead en Samsung España a partir de la fuente Voicebot:

  • Habrá 8.000 millones de asistentes a nivel global en 2023
  • El uso de asistentes se triplicará en los próximos años
  • España está aún en una fase temprana, con penetración entre los early adopters
  • Un 58% de usuarios en EEUU han probado el asistente virtual de su smartphone
  • Un 23% de usuarios de EEUU tienen un altavoz inteligente
  • Los que tienen un speaker lo usan diariamente, mientras que el uso del asistente en smartphones es más esporádico
  • El 82% de los usuarios de EEUU usan el asistente mientras conducen
  • Al 52% de los usuarios les preocupa su privacidad cuando usan asistentes digitales

En este contexto, Camino considera que los retos y barreras que se nos presentan son apasionantes:

¿Qué va a pasar en 4 años?

Durante la mesa de debate con los lingüistas computacionales se ha puesto la mirada en el medio plazo para comentar cómo van a ser estas conversaciones con la Inteligencia Artificial, por ejemplo, en 2025. “Los asistentes virtuales están aún muy verdes y ahí es donde veremos crecer todo esto”, ha comentado Juan Fernández, lingüista computacional que está en el equipo de Samsung.

Uno de los retos que vienen a futuro, como ha planteado Leticia Martín-Fuentes, lingüista computacional de Adecco para Google, son las conversaciones largas entre máquinas y humanos, con cambios de tema o incluso “memoria”. Así lo ha explicado también Alejandro Delgado, Arquitecto Ejecutivo en la Unidad de IBM Cloud de IBM España, durante su ponencia.

Por su parte, Luca de Filippis, lingüista computacional que está en el equipo de Sngular, ha alertado que nos debemos poner las pilas para la revolución que se avecina y que se produce “cada vez en periodos de tiempo más cortos”. De hecho, en un medio plazo no usaremos solo estas conversaciones con asistentes para saber dónde podemos comprar el pan, sino que veremos aplicaciones en otros sectores como el de la Salud. Así que a todos ellos, lingüistas, ingenieros, desarrolladores y diseñadores, les espera un apasionante futuro por delante :-)