Cuando Amazon lanzó el asistente virtual Alexa hace nueve años, su capacidad de decodificar órdenes de voz para programar un temporizador o reproducir una canción parecía casi mágica. Hoy, la barra de las habilidades impresionantes de los modelos de lenguaje es mucho más alta, gracias a ChatGPT de OpenAI. Así que Amazon renueva su asistente de voz aprovechando la tecnología que hay detrás de la nueva ola de chatbots capaces de entablar conversaciones extraordinariamente realistas.
Amazon anunció la actualización de Alexa en un evento celebrado en su segunda sede en Arlington, Virginia (EE UU). El asistente responderá a preguntas mucho más complejas y mantendrá conversaciones más fluidas y abiertas, eliminando la necesidad de que los usuarios digan “Alexa…” a cada momento.
Alexa renovada con inteligencia artificial
Dentro de unas semanas, los usuarios que digan algo como “Alexa, vamos a chatear”, tendrán acceso al nuevo y más hábil asistente de voz de la compañía. Amazon lo denomina “preestreno”, porque las nuevas capacidades siguen siendo un trabajo en curso.
Las demostraciones realizadas sobre el escenario este miércoles presumieron a Alexa con una personalidad más simulada, perceptible en su entonación y en los intentos por hacer bromas. En los videos presentados, las personas le pedían que escribiera poemas sobre un tema en particular, que aportara ideas para una cita por la noche y que generara una historia sobre la gelatina. Los dispositivos equipados con cámaras, como el Echo Show, intentarán detectar el momento en que una persona espera que Alexa continúe la conversación y en el que esta terminó.
La nueva Alexa también modulará su propia voz para establecer una interacción más natural. “Si le pregunto a Alexa cómo van los Red Sox y acaban de perder, me responderá con un tono empático”, comenta Rohit Prasad, quien lidera el desarrollo de inteligencia artificial (IA) en Amazon y reside en Cambridge, Massachusetts.
Prasad explica que la mejora de las habilidades de lenguaje de Alexa requirió una gran labor de ingeniería, porque los grandes modelos que impulsan servicios como ChatGPT llegan a inventarse hechos, decir cosas sin sentido y ser sumamente inapropiados. “Especialmente teniendo en cuenta ciertas limitaciones de los modelos de lenguaje, se trata de un salto enorme”, destaca Prasad.
Justine Cassell, profesora de la Universidad Carnegie Mellon quien estudia la forma en que los humanos interactúan con los agentes de IA, opina que será fascinante ver cómo reacciona la gente ante un chatbot de voz capaz de ofrecer respuestas más elaboradas. “Los objetivos son estupendos y me entusiasma ver lo que hacen”, expresa.
Sin embargo, Cassell asegura que algunas de las cuestiones que promete Amazon, como responder al lenguaje corporal, siguen siendo un gran reto. “No existe una gramática del lenguaje corporal como la hay para el lenguaje hablado y escrito”, observa. Si Alexa interpreta mal la postura o los movimientos de alguien y contesta de forma incorrecta, la situación podría complicarse.
Cassell considera que, aunque Alexa adquiera más fluidez como ChatGPT, es poco probable que sus esfuerzos por imitar la personalidad y los sentimientos de las personas mediante características como la entonación igualen las capacidades humanas durante algún tiempo. Cabe esperar que la nueva Alexa responda a veces de forma forzada.
Alexa y el futuro de los asistentes de voz con IA
Amazon comparte que los usuarios podrán solicitar acceso a una prueba adicional de su nueva tecnología, en la que las capacidades renovadas de Alexa servirán para controlar otros dispositivos, incluidos algunos no fabricados por la empresa. Con el tiempo, tienen previsto añadir nuevas funciones al asistente virtual, entre las que posiblemente se incluya la capacidad de comentar y recomendar productos del amplio inventario de la compañía.
Si Alexa es capaz de responder a consultas más complejas evitando errores embarazosos, esto supondría una mejora más amplia y muy necesaria de las capacidades de los asistentes de voz.
Cuando Amazon lanzó Alexa en 2014, contribuyó a la creación de una nueva categoría de computación personal basada en la interacción por voz, dando lugar a predicciones que estimaban que dentro de poco las interfaces de voz dominarían el mercado. Alexa y Siri de Apple se beneficiaron de los avances en el aprendizaje automático que finalmente hicieron posible que los equipos reconocieran y reaccionaran de forma fiable a la voz de un usuario. Pero la complejidad del lenguaje ha limitado estos dispositivos a órdenes sencillas y los ha dejado incapaces de entablar algo que se parezca a una conversación real. Aun así, Amazon afirma que ha vendido más de 500 millones de dispositivos con Alexa en todo el mundo.
La aparición de los grandes modelos de lenguaje entrenados con enormes cantidades de texto por fin dio pie a algoritmos que permiten manejar diálogos más complejos. ChatGPT y otros chatbots han sorprendido tanto a los expertos como a la población por su flexibilidad y su verborrea, aunque son propensos a soltar declaraciones que resultan ser falsas, tendenciosas o incluso ofensivas.
Prasad declara que Amazon desarrolló un gran modelo de lenguaje nuevo y vanguardista para reforzar Alexa. Dice que la empresa perfeccionó este modelo orientándolo hacia frases apropiadas para una conversación vocal y que utiliza algoritmos adicionales que le ayudan a reconocer el lenguaje corporal y la entonación.
Uno de los mayores retos de Amazon sería la gestión de los sorprendentes fallos que conlleva la implementación de los grandes modelos de lenguaje. Cuando Microsoft añadió un chatbot de IA avanzada a su motor de búsqueda Bing, los usuarios no tardaron en notar algunos comportamientos extraños. “¿Es 100% perfecto? No”, asevera Prasad. “Por eso es una versión preliminar, porque tendrá errores ocasionales”.
Prasad sostiene que Amazon ya desarrolló medidas preventivas para evitar que Alexa se desvíe del camino. Añade que algunas de ellas tienen que ver con recordarle a la gente que están hablando con una máquina, e intentarán evitar que el asistente se comporte demasiado como una persona. Algunos usuarios de chatbots forman vínculos emocionales fuertes e incluso románticos con las personalidades simuladas con las que interactúan. Prasad agrega que Amazon está investigando los riesgos a largo plazo que derivarían de los nuevos avances en la inteligencia artificial.