Formulario de búsqueda


3..2..1.. Reflexionando sobre las tecnologías de voz

Compartir en:

3..2..1.. Reflexionando sobre las tecnologías de voz

  • VoiceXLab es un punto de encuentro de referencia para reflexionar sobre los usos y aplicaciones de la voz
  • En el primer encuentro se ha debatido sobre el diseño de voces y cómo los medios pueden hacer uso de ellas

Los asistentes virtuales se están “comoditizando”. Todos llevamos uno en el bolsillo a día de hoy. Pero en torno a la voz hay aún mucho desconocimiento y algunos vacíos. Por eso nace VoiceXLab, un punto de encuentro de referencia para crear, diseñar e implementar experiencias de interacción entre personas e inteligencias artificiales, a través de la voz que han promovido desde Sngular y la consultora creativa PS21.

El primero de estos encuentros se ha titulado Fundamentos de la Voz y el Diálogo y ha sido el pistoletazo de salida a una serie de eventos y actividades que se vendrán sucediendo y que desde Reason Why apoyaremos como Media Partner oficial.

Para romper el hielo y ponernos en contexto en este primer VoiceXMeetUp, dese Sngular nos ofrecían un adelanto de los datos que presentarán en marzo con su estudio sobre Marketplaces de Voz.

  • El 55% de los hogares en Estados Unidos tendrán smart speakers en 2022
  • El 50% de las búsquedas se harán por voz en 2020
  • Los sectores más atractivos para entrar en soportes de audio son salud, finanzas, e-commerce, atención al cliente y automoción. Son los que más ingresos va a atraer en este campo
  • Salud es el más atractivo en este momento, dado que resulta muy útil para los médicos
  • Automoción es el que más va a crecer hasta 2025 debido a la penetración de los asistentes integrados en los coches

Laura Ruiz, del departamento de Innovación en Sngular, nos cuenta cuál es la situación actual respecto a la relación de los usuarios con los asistentes virtuales:

La realidad del negocio no se corresponde con la realidad del mercado. Por ejemplo, algunos usuarios en España tienen altavoces inteligentes para escuchar música, podcast, hacer búsquedas rápidas... Así que todo esto está empezando, y es el caldo de cultivo para que se generen ingresos en los sectores que veíamos más arriba.

Un 40% de los usuarios no emplean tecnologías de voz porque no les resultan útiles

Además, a día de hoy todavía hay poco engagement con los altavoces. Por ejemplo, de los 40.000 skills de Alexa en Estados Unidos, el 62% no están valoradas y el 95% de las valoradas tienen menos de 9 reviews. Es decir, estamos viviendo algo parecido a lo que ocurrió con el boom de las apps. Por no mencionar que hay un relevante 40% de los usuarios que no recurren a tecnologías de voz porque no les resultan útiles...

Ahí está una de las claves: las barreras de entrada son bajas y ahora mismo es relativante sencillo programar en los altavoces inteligentes. Por eso hay muchas empresas con presencia en altavoces inteligentes que no están ofreciendo utilidad a sus targets. Pporque el hecho de que sea fácil hacelro, no quiere decir que lo sea hacerlo bien. El hecho de que conversemos regularmente no nos hace idóneos para diseñar conversaciones.

Hablando de conversaciones, una de las ponentes en este primer VoiceXMeetUp ha sido Alyssa Ciccarello, Coach de Voz, que nos ha recordado que "todos tenemos siempre una historia que contar", personal, profesional o artística. Y ella ayuda a las personas a contar mejor esas historias.

"La voz es como un puente entre el que habla y las personas que escuchan"

En este sentido, Alyssa ha invitado a todos los asistentes a reflexionar un poco. Porque la voz se usa para mover a los demás, generar un impacto e influir en la audiencia que nos escucha. Es como un puente entre el que habla y las personas que están escuchando. Y cada uno somos expertos en el uso de una voz, que es la nuestra. Pero pensemos: ¿qué pasaría si un extraterrestre viniera y nos preguntara cómo hacemos para gestionar nuestra voz?

Sabemos algunos aspectos, conocemos la teoría, pero quizá no vemos todo lo que ocurre para que la voz se termine proyectando y sea una realidad. "Todo comienza con un impulso, un pensamiento que brota y sentimos la necesidad de comunicarlo”, nos ha recordado Alyssa. 

Y, a partir de ahí, surgen todas las complejidades que tiene el habla; como los acentos, las entonaciones que le damos a lo que decimos en función de cómo nos sentimos... De forma que vamos aprendiendo a modular nuestra entonación y a ajustar nuestras palabras en función del contexto y las circunstancias. Incluso algunos humanos, como los actores, van más allá y se embarcan en la búsqueda de la neutralidad para comunicar, sin acento.

"Es algo que me resulta extraño porque al final del día todos venimos de alguna parte, todos tenemos un acento...", comenta Alyssa. Y es que el habla es algo cultural, no debemos olvidarnos de eso. Y en este momento de nuestra existencia como especia, hay que tenerlo en cuenta más que nunca a la hora de diseñar voces para enganchar con aquellos que nos van a escuchar.

Entonces, ¿qué pasa cuando lo que hay al otro lado no es una persona, sino un altavoz? ¿Cómo vamos a hacer que nuestras conversaciones sean efectivas si ya no se trata de la comunicación entre humanos? ¿Qué pasa cuando lo que hay al otro lado siempre nos responde en el mismo tono, con el mismo acento, de forma que no sirve de nada que adaptemos nuestras conversaciones?

La inteligencia artificial ahora está tratando de replicar la voz humana, los sonidos que nosotros generamos, para acercarse a las emociones. La pregunta es ¿debería un asistente sonar como un humano? Está claro que tecnológicamente puede pero, ¿debe? Ahí es dónde debe estar el debate hoy, según Alyssa. Y aprovechando su ponencia, le hemos preguntado nosotros: ¿Hacia dónde crees que evolucionará el paradigma de la voz en el medio plazo? Esta ha sido su respuesta:

Por su parte, Óscar Gómez (Socio Director de Qwerty Comunicación), nos ha contado, "sin ánimo de pontificar", algunas ideas de teorías de la comunicación que se pueden aplicar hoy en día a nuestra relación con los altavoces inteligentes.

Y lo ha hecho planteando un juego a los asistentes: "¿Quién dijo esta frase que os muestro a continuación?"

La hegemonía se mueve en la tensión entre el núcleo irradiador y la seducción de los sectores aliados laterales. Afirmación-apertura.

Después de leer la frase con entonaciones varias (retransmisión de fútbol, poema de amor, cuento infantil, noticia, anuncio...), Óscar desvela el misterio:

"Ni él mismo sabía lo que quería decir cuando trató de explicarlo", comenta Óscar entre risas. Pero, precisamente por eso, lo que consigue es generar un debate en torno a qué significado tiene en realidad el texto. Es decir: es un mensaje que genera notoriedad, característica fundamental en la comunicación de masas.

Otro ejemplo que nos plantea es el del programa de TV Digital "Between Two Ferns" en el que el presentador presiona al invitado hasta que este no puede más y pulsa el botón rojo que hay en el centro de la mesa para detener la entrevista. Por su plató han pasado estrellas de la talla de Bruce Willis, que no respondió a ninguna de las preguntas; o Justin Bieber, que se levantó a pegar al entrevistador... Incluso la Casa Blanca pidió que entrevistaran a Obama. ¿El motivo? Poder explicar a la audiencia su sistema de salud público (Obamacare). Es decir, aquí el contexto y el receptor del mensaje son clave para su transmisión.

Así, en un nuevo paradigma en el que los medios de comunicación se están adaptando a la audiencia con ediciones en papel ya obsoletas, otras que se reinventan, muros de pago digitales..., se vuelve cada vez más importante tomar conciencia de los caminos que se están abriendo en lo que respecta al consumo de información.

No tiene sentido seguir programando contenidos por bloques en los medios

La audiencia está cambiando y consume la información cuándo y cómo quiere. Así que no tiene sentido seguir programando contenidos por bloques, porque la gestión de los tiempos es totalmente diferente hoy en día. En este sentido, los formatos de audio se posicionan como una alternativa para llegar a esos momentos de consumo de la audiencia: en el coche, haciendo deporte, en la cocina...

Estamos ante lo que Óscar define como "la oportunidad de la conciencia". Con la interacción por voz nos estamos dando cuenta de lo que viene al mismo tiempo que llega, de manera que estamos pudiendo adaptarnos con cierto margen. ¿Qué pueden hacer las marcas en este contexto? Se lo preguntamos a Óscar aprovechando su ponencia:

 

Por cierto, si quieres estar al día sobre todo lo relacionado con las tecnologías de voz, puedes unirte a este grupo en Slack >> voicelab.slack.com

Y hablando de voz... quizá te interese escuchar nuestro podcast 80/20 sobre Marketing y Economía Digital :-)

Noticias relacionadas