¿Qué es la IA Conversacional?

April 13, 2024 Nieves Ábalos

Imaginando a Alan Turing hablando con Alexa. Imagen generada por Nieves Ábalos con IA (Midjourney v6).

Your browser doesn't support HTML5 audio

¿Qué es la Inteligencia Artificial Conversacional? Nieves Ábalos

Audio generado con la voz clonada de Nieves desde Fonos, con tecnología de Monoceros Labs.

El paraguas de la IA Conversacional

La IA conversacional es el conjunto de tecnologías basadas en Inteligencia Artificial que nos permiten mantener un diálogo con cualquier ordenador. Es la tecnología de las conversaciones.

A menudo hacemos uso de la palabra IA Conversacional para referirnos a los asistentes virtuales o chatbots. El objetivo es construir sistemas con los que las personas podamos interactuar con la voz y/o escribiendo, a través de una conversación como si habláramos con una persona. Desde responder preguntas simples hasta hacer tareas más complicadas, la IA conversacional hace que la interacción con la tecnología sea más natural.

Dentro del paraguas de la IA conversacional, encontramos tecnologías como el procesamiento del lenguaje natural (NLP en inglés), que permite a las máquinas extraer el significado del lenguaje. También se emplean algoritmos de aprendizaje automático (ML) y arquitecturas de aprendizaje profundo (DL) para mejorar la capacidad de los sistemas de IA para comprender la intención de la persona con la que hablan, para decidir qué tipo de comportamiento es el más adecuado en cada punto de la conversación, y para generar respuestas en base a ciertos datos. Además, se utilizan tanto el reconocimiento de voz como la síntesis de habla para interactuar con las personas a través del habla.

Esquema que muestra la intersección del NLP, ML y DL dentro de la IA Conversacional. Fuente: elaboración propia.

¿Es nuevo el término?

La verdad es que aunque es un conjunto de tecnologías diversas, que han evolucionado mucho en la última década, y que ahora están en auge por la IA Generativa que se centra en modelos del lenguaje y chatbots como ChatGPT, el término “IA Conversacional” no es un concepto nuevo.

La IA Conversacional está fuertemente ligada al término “Inteligencia Artificial”, término acuñado por John McCarthy junto a otros investigadores como Minsky o Shannon en 1955 [1], pero la idea de máquinas que se comportan como personas conversando y pensando es anterior. Alan Turing, en 1950, publicó un artículo titulado "Computing Machinery and Intelligence"[2], donde exploró la posibilidad de crear máquinas pensantes.

Para Alan Turing, la conversación en lenguaje natural era la interfaz para validar ciertas capacidades inteligentes de las máquinas, como la capacidad de pensar. Su contribución más significativa fue el planteamiento del “Imitation Game”[2] o "Test de Turing", que propuso como método para determinar si una máquina podía "pensar". El test consiste en que una máquina mantenga una conversación indistinguible de una con un ser humano. Si la máquina lograba hacer pensar a su interlocutor que era una persona, Turing argumentaba que era razonable decir que la máquina estaba "pensando". Este enfoque simplificado le permitió a éste argumentar convincentemente que una "máquina pensante" era al menos plausible.

Estas contribuciones sentaron las bases para el concepto de IA conversacional y el debate sobre la posibilidad de máquinas que puedan pensar y comunicarse como personas.

ELIZA, el primer prototipo de chatbot

Joseph Weizenbaum jugó un papel importante en el desarrollo inicial de la inteligencia artificial, especialmente en el ámbito de la IA conversacional. Su contribución más relevante fue la creación de ELIZA [3], uno de los primeros “chatbots” o programas que trabajaban con el lenguaje natural.

Weizenbaum desarrolló ELIZA mientras trabajaba en el MIT, entre 1964 y 1966. ELIZA, que simulaba a un psicoterapeuta con escucha empática reflejando las afirmaciones del usuario y haciendo preguntas basadas en ellas, fue uno de los primeros programas capaces de usar técnicas para detectar palabras clave en la conversación y usarlas para mantener una conversación con personas.

Conversación con ELIZA y flujo de detección de palabras clave. Fuente: Weizenbaum (1966) [3]

ELIZA demostró cómo un programa relativamente simple, que utilizaba los conceptos mencionados previamente para realizar preguntas, podía crear la ilusión de entendimiento y empatía. De hecho, muchos usuarios atribuyeron cualidades humanas al programa, a pesar de su funcionamiento, y llevó a Weizenbaum a reflexionar sobre las implicaciones éticas de la IA y la relación humano-máquina en su libro "Computer Power and Human Reason" [4], donde expresó preocupaciones sobre su uso en áreas que requieren comprensión y empatía humana.

Su trabajo con ELIZA fue pionero en la IA conversacional y sigue siendo relevante en las discusiones actuales sobre los chatbots y asistentes virtuales. Sus reflexiones éticas han influido en el desarrollo responsable de la IA y en la consideración de sus implicaciones sociales y psicológicas.

La IA Conversacional ahora

La IA Conversacional ha recorrido un largo camino en la última década, transformando la forma en que interactuamos con la tecnología y redefiniendo los límites de lo posible en la comunicación humano-máquina.

En los últimos años, el desarrollo de la IA conversacional ha experimentado tres olas que han expandido tecnología y uso de chatbots, asistentes de voz y actualmente los modelos del lenguaje, con varias empresas destacándose en este campo. Estas olas también han hecho crecer y decrecer nuestras expectativas en ellos.

Esta tecnología está cambiando rápidamente nuestro mundo digital. Desde empresas tecnológicas líderes como Apple con Siri, que democratizó en 2009 a los asistentes virtuales de voz en nuestros teléfonos móviles, como Amazon que lanzó Alexa en 2015 haciendo que estos asistentes de voz se introdujeran en nuestras casas y nos ayudaran a controlar dispositivos, hasta los avances de los últimos años con OpenAI lanzando ChatGPT en noviembre de 2022, generando un impacto nunca visto en la percepción y uso masivo de IA conversacional llegando a 1 millón de usuarios en cinco días tras su lanzamiento, y sin olvidar el impacto de Antrophic, Google, Microsoft y Meta en la carrera de las aplicaciones y los grandes modelos del lenguaje.

Sin embargo, a medida que avanzamos, debemos mantener un equilibrio entre la innovación y la responsabilidad ética. El futuro de la IA Conversacional promete tener un gran potencial para mejorar la educación, la salud mental y la accesibilidad, pero también plantea retos importantes en términos de privacidad, seguridad y el impacto en las personas. A medida que esta tecnología continúa evolucionando, será clave trabajar en aprovechar su potencial mientras se mitigan sus riesgos.

El camino por delante promete ser la siguiente gran transformación de la sociedad en la que vivimos.

¿Te puedo ayudar en este tema? Además de mis servicios de consultoría en IA Conversacional, doy formación, charlas, y mentorías.

Referencias:

[1] McCarthy, J., Minsky, M. L., Rochester, N., Corporation, I. B. M., & Shannon, C. E. (1955). A PROPOSAL FOR THE DARTMOUTH SUMMER RESEARCH PROJECT ON ARTIFICIAL INTELLIGENCE. http://jmc.stanford.edu/articles/dartmouth.html

[2] Turing, A. M. (1950). Computing machinery and intelligence. Mind, LIX(236), 433-460. https://doi.org/10.1093/mind/LIX.236.433

[3] Weizenbaum, J. (1966). ELIZA—a computer program for the study of natural language communication between man and machine. Commun. ACM, 9(1), 36-45. https://doi.org/10.1145/365153.365168

[4] Weizenbaum, J. (1976). Computer power and human reason: From judgment to calculation. Freeman. https://archive.org/details/computerpowerhum0000weiz_v0i3

See this form in the original post

See this gallery in the original post