Nieves Ábalos - IA Conversacional

Atrás

un smart speaker de Google Assistant.un smart speaker de Google Assistant.

Desde hace unos años, el concepto de chatbot o asistente aparece de manera recurrente, ya sea en medios de comunicación o en nuestro entorno laboral. ¿Quién no ha leído en el periódico cómo un chatbot te puede ayudar a planificar las vacaciones? O, ¿quién no ha estado en una reunión en la que el concepto chatbot ha aparecido como solución a todos los problemas?

Hasta hace unos cuantos de años, el entorno era diferente, las interfaces conversacionales estaban restringidas al mundo académico, a empresas con avatares frustrantes o a películas de ciencia ficción. En BEEVA Labs hemos trabajado con interfaces conversacionales desde hace años (nuestros primeros ejemplos son de 2014), y más recientemente con asistentes virtuales, probando los asistentes de Google y Amazon.

El objetivo de este post es aclarar el concepto de asistente virtual, y dar a conocer las características que debemos esperar de este tipo de interfaces conversacionales.

Aclarando términos#

Un asistente virtual es un agente que nos ayuda en algún proceso o tarea, e idealmente, sería capaz de ser proactivo y anticiparse a nuestras necesidades. Es el concepto de asistencia el que marca la diferencia dentro del resto de interfaces conversacionales, de una aplicación móvil o de una web tradicional. No todo chatbot es un asistente. A la mayoría de los chatbots los encontramos en aplicaciones de mensajería, les escribimos por texto o les damos información con otros elementos como tarjetas o botones. E incluso algunos son simplemente bots, autómatas que no entienden conversaciones, sino instrucciones o comandos para llevar a cabo sus tareas.

En este esquema podemos ver las relación que existe entre un asistente virtual y otros términos del ámbito de interfaces conversacionales, como chatbot o sistema de diálogo (el término más utilizado en el ámbito académico).

Relación entre interfaces conversacionales. Relación entre interfaces conversacionales.

Con un asistente virtual por lo general interactuamos por voz (Siri, Alexa), aunque algunos permiten también utilizar texto (Google Assistant) y otros métodos como imágenes (Bixby de Samsung).

Transacción y conversación#

Hablamos de un asistente transaccional refiriéndonos a que tiene la capacidad de realizar tareas o servicios por un usuario. Es decir, un asistente que nos pide un taxi o nos gestiona la lista de la compra.

Además, un asistente es conversacional cuando puede mantener una conversación que parece natural con el usuario: responder con expresiones de cortesía (hola, adiós, gracias), hablar sobre sí mismo y establecer, de alguna manera, vínculos sociales con el usuario.

Y es que la característica más importante de los asistentes virtuales debería ser ésta capacidad de conversar. Parece obvio, pero no lo es y no todos los asistentes la tienen. De hecho, es uno de los elementos que genera más frustración, ya que cuando usamos este tipo de interfaz, esperamos conversar como si lo hiciéramos con una persona. No somos transaccionales, somos seres sociales y conversacionales: expresamos emociones, hablamos de la vida y de nuestras preocupaciones.

Conversación: memoria y contexto#

Internamente, cualquier asistente virtual tiene que llevar a cabo una serie de tareas. Si el asistente utiliza voz, necesitará traducir los mensajes de voz a texto y viceversa (Reconocimiento de voz, Síntesis de voz). Si el asistente es de voz o texto, deberá comprender qué quiere el usuario (Comprensión del Lenguaje Natural), entender el estado actual del diálogo y actuar en consecuencia (Gestión de Diálogo), ya sea devolver información o ejecutar alguna función, y responder al usuario con cualquier tipo de feedback (Generación de Respuestas).

Arquitectura de una interfaz conversacional con voz y texto. Arquitectura de una interfaz conversacional con voz y texto.

Para que el asistente se comporte de una manera más inteligente, y que la conversación con el usuario sea más natural, tendremos que gestionar el diálogo, haciendo uso de memoria y entendiendo el contexto de los intercambios de información, de tal manera que nos permita asistir y adaptar la conversación a cada uno de nuestros usuarios.

Dispositivos#

Una de las razones del auge de los asistentes virtuales se debe a la aparición de “altavoces inteligentes” o “smart speakers”. Las grandes empresas tecnológicas como Apple, Google o Amazon siguen esta tendencia con sus asistentes virtuales con Siri, Google Assistant (en Google Home) o Alexa (en Amazon Echo) respectivamente. Además, muchos de estos asistentes habitan en nuestros smartphones, ya sea dentro del sistema operativo o como aplicación externa, e incluso en nuestra TV.

Ejemplos de dispositivos donde podemos encontrar asistentes virtuales. Ejemplos de dispositivos donde podemos encontrar asistentes virtuales.

Multimodalidad#

El concepto de multimodalidad hace referencia a la capacidad de recoger o dar información a través de diferentes entradas (audio, texto, gestos…). Por ejemplo, que las entradas provengan de distintos dispositivos: por voz “Aquí tienes los productos de tu última compra” y por pantalla nos muestra una serie de productos.

Servicios disponibles#

Muchos de estos asistentes comerciales vienen, por defecto, con servicios implementados que pueden variar según el dispositivo donde los utilices. Es el caso de Siri, que según el dispositivo cuenta con una serie de servicios u otros: en el altavoz puedes pedirle música; en la TV información sobre películas y otras aplicaciones; en el teléfono te ayuda a poner una alarma o pedirle que añada un recordatorio.

Pero si necesitamos otro tipo de servicios, la mayoría de los asistentes nos dan la opción de extender sus habilidades mediante kits de desarrollo: es el caso de Sirikit, Google Actions o Alexa Skills Kit.

Oye Siri, ¿y ahora qué?#

Hemos querido resumir las características que hacen diferente a un asistente virtual de otras interfaces conversacionales, entre otras la capacidad de asistencia y conversación. Si queremos construir servicios en forma de asistentes, podemos extender las capacidades de asistentes comerciales y aprovechar los dispositivos ya existentes. Pero, ¿qué pasa si no queremos utilizar estos asistentes para nuestros servicios, y queremos construir uno propio?

De todo esto hablaremos en próximos posts dentro de esta serie sobre asistentes virtuales.


Originally published at labs.beeva.com on September 1, 2017. BEEVA is now BBVA Technology.

Oye Siri, ¿qué es un asistente virtual?
https://nievesabalos.com/blog/oye-siri-que-es-un-asistente-virtual/
Author Nieves Ábalos Serrano
Published at 1 de septiembre de 2017