Un asistente virtual es un agente de software que ayuda a usuarios de sistemas computacionales, automatizando y realizando tareas con la mínima interacción hombre-máquina. La interacción que se da entre un asistente virtual y una persona, debe ser natural, una persona se comunica usando la voz y el asistente virtual lo procesa, interpreta y responde de la misma manera.
El término chatterbot, viene de la unión de dos vocablos ingleses: “chatter”, cuyo significado es “hablador”, y “bot”, que sirve como abreviatura de la palabra inglesa adoptada también por nuestro idioma, “robot”.[1]
A veces el término bot conversacional (en inglés: chatbot) se utiliza para referirse a los asistentes virtuales en general o específicamente a aquellos a los que se accede por chat en línea (o en algunos casos, programas de chat en línea que son para entretenimiento y no para propósitos útiles).
Hacia 2017, las capacidades y el uso de los asistentes virtuales se está expandiendo rápidamente, con nuevos productos entrando al mercado. Una encuesta en línea en mayo de 2017 encontró el más utilizado en los Estados Unidos fueron Siri de Apple (34%), Google Assistant (19%), Amazon Alexa (6%) y Microsoft Cortana (4%).[2] El uso de altavoces inteligentes alimentados por estos asistentes es radicalmente diferente; Apple ni siquiera anunció su altavoz inteligente hasta junio de 2017. El asistente virtual M de Facebook esperaba estar disponible para cientos de millones en Facebook Messenger en 2017. Apple y Google tienen grandes bases instaladas de usuarios en teléfonos inteligentes y Microsoft tiene una gran base instalada de computadoras personales basadas en Windows (donde trabaja Cortana, además de teléfonos y altavoces inteligentes); mientras que Alexa fue el primero en obtener la posibilidad de realizar pedidos de comercio electrónico en línea, desde Amazon.[3]
Un asistente personal inteligente es un agente tipo software que puede realizar tareas u ofrecer servicios a un individuo. Estas tareas o servicios están basados en datos de entrada de usuario, reconocimiento de ubicación y la habilidad de acceder a información de una variedad de recursos en línea (como al clima o al tráfico, noticias, precios de acciones, horario del usuario, precios al por menor, etc). Algunos ejemplos de asistentes personales son Siri de Apple, Braina, Google Assistant y Google Now de Google,, Amazon Echo de Amazon, Cortana de Microsoft, S Voice y Bixby de Samsung, Voice Mate, Silvia y Hidi de HTC y Celia de Huawei. Uno de los aspectos clave de un asistente personal inteligente es su habilidad para organizar y mantener información. Esto incluye el manejo de correos electrónicos, eventos en el calendario, archivos, lista a seguir, etc.[4]
De acuerdo con el inversor de capital de riesgo, Chi-Hua Chien,[5] de la firma Kleiner Perkins Caufield & Byers, ejemplos de tareas que pueden ser ejecutadas por inteligentes automatizados agentes personales[6] incluyen manejo de agenda (ejemplo: mandar una alerta a alguien que llegará tarde a su cena por un inconveniente de tráfico, actualización de horarios para ambas partes, y cambiar el horario de reservación del restaurante) y un manejador personal de salud (ejemplo: monitorear la ingesta diaria de calorías, el ritmo cardiaco y el régimen de ejercicio, después hacer recomendaciones y dar opciones para mejorar la salud).
La tecnología del asistente personal inteligente es permitida por la combinación de dispositivos móviles, interfaces de programación de aplicaciones (API), y la proliferación de aplicaciones móviles. Sin embargo, asistentes personales automatizados son diseñados para realizar tareas que solo son especificadas una vez a través de la voz del usuario mientras que los agentes personales inteligentes realizan tareas en curso (ejemplo: actualización en la agenda o calendario) de forma autónoma.
El asistente personal inteligente tiene sus orígenes en un proyecto de inteligencia militar artificial llamada CALO, por sus siglas en inglés "cognitive assistant that learns and organizes” que significa asistente cognitivo que aprende y organiza.[7] Adam Cheyer, un mánager del proyecto CALO, tomó a unas personas del SRI International del centro de inteligencia artificial y formó un equipo para empezar la creación de Siri. Éste fue el primer conocido asistente personal inteligente.
La primera herramienta que permitió ejecutar reconocimiento digital de voz fue IBM Shoebox, presentado al público general durante la Feria Mundial de Seattle de 1962, tras su lanzamiento inicial al mercado en 1961. Esta computadora temprana, desarrollada casi 20 años antes de la introducción del primer IBM Personal Computer en 1981, fue capaz de reconocer dieciséis palabras habladas y los dígitos del 0 a 9. El siguiente hito en el desarrollo de la tecnología de reconocimiento de voz se logró en la década de 1970 en la Universidad Carnegie Mellon en Pittsburgh, Pensilvania, con el apoyo sustantivo del Departamento de Defensa de los Estados Unidos y su agencia DARPA. Su herramienta Harpy dominó un millar de palabras, similar al vocabulario de un niño de tres años. Alrededor de diez años más tarde, el mismo grupo de científicos desarrolló un sistema que no sólo podía analizar palabras individuales sino secuencias enteras de palabras habilitadas por el modelo oculto de Márkov.[8] Así, los primeros asistentes virtuales, los cuales aplicaron software de reconocimiento del habla fueron contestadores automáticos y softwares médicos de dictáfonos digitales.[9] En la década de 1990, la tecnología de reconocimiento de voz digital se convirtió en una característica de las computadoras personales de Microsoft, IBM, Philips y Lernout & Hauspie luchando por los clientes. Mucho más tarde el lanzamiento al mercado del primer teléfono inteligente IBM Simon en 1994 sentó las bases para los asistentes virtuales inteligentes tal como se conocen hoy en día.[10] El primer asistente virtual digital instalado en un teléfono inteligente fue Siri, que fue presentado como una característica del iPhone 4S el 14 de octubre de 2011.[10] Apple Inc. desarrolló Siri tras su adquisición en 2010 de Siri Inc., un spin-off de SRI International, que es un instituto de investigación financiado por DARPA y el Departamento de Defensa de los Estados Unidos.[8]
Como parte de la historia de los asistentes virtuales también tenemos los chatterbots o agentes conversacionales surgidos en algunas páginas de Internet en los años 90 y principios del 2000, que buscaban la interacción con el usuario de la página simulando mantener una conversación con él, con el fin de ayudarle en sus búsquedas de un modo automatizado.[11] Los primeros chatterbots eran muy limitados y no siempre comprendían las instrucciones de los humanos. Estaban insertados en las páginas web y funcionaban mediante texto.[12] Su funcionamiento se basaba en la grabación previa de unas respuestas automatizadas que se ofrecían al usuario tras el reconocimiento de determinadas palabras clave.
Tienen cinco grandes ventajas: Eficacia, mejora de la satisfacción del cliente en línea, optimización de costes, aprendizaje automático continuado y detección de las tendencias y necesidades del mercado.[13]
Según la naturaleza de la interacción entre el usuario y el asistente virtual, se pueden encontrar asistentes virtuales que funcionen a través de texto, voz o intercambio de imágenes. Los separamos además entre asistentes virtuales de propósito general o asistentes virtuales de dominio específico según el grado de complejidad de la tarea que realizan.[14]
Los asistentes virtuales hacen el trabajo a través de:
Algunos asistentes virtuales son accesibles a través de múltiples métodos, tales como Google Assistant a través de chat en la aplicación Google Allo y vía voz en altavoces inteligentes de Google Home.
Los asistentes virtuales usan el procesamiento de lenguajes naturales (PLN) para combinar el texto del usuario o la entrada de voz con comandos ejecutables. Muchos aprenden continuamente usando técnicas de inteligencia artificial, incluyendo el aprendizaje automático.
Los asistentes virtuales pueden estar integrados en diversos tipos de plataformas o, en el caso de algunos como Amazon Alexa, a través de varios de ellos:
Los asistentes virtuales pueden proporcionar una amplia variedad de servicios, incluyendo:[26]
Un asistente virtual puede trabajar con el equipo de atención al cliente de una empresa para proporcionar atención al cliente 24 horas al día, 7 días a la semana.[28][29] Proporciona un tiempo de respuesta rápido, lo que mejora el servicio al cliente.
¡El comercio conversacional es el comercio electrónico que utiliza diversas herramientas de mensajería, incluidos los asistentes de voz[30], así como el chat en directo en sitios web de comercio electrónico, el chat en directo en aplicaciones de mensajería como WeChat, Facebook Messenger y WhatsApp[31] y los chatbots en aplicaciones de mensajería o sitios web.[32]
Asistente | Desarrollador | Lanzamiento | Dispositivo | IoT | ON | Sitio NO oficial |
---|---|---|---|---|---|---|
Alexa | Amazon | noviembre de 2014 | Amazon Echo | Sí | Sí | Enlace |
Bixby | Samsung | 21 de abril de 2017 | Samsung Galaxy S | No | No | Enlace |
Cortana | Microsoft | 2 de abril de 2014 | Invoke | No | No | Enlace |
Google Assistant | 18 de mayo de 2016 | Google Home | Sí | Sí | Enlace | |
Mycroft | Mycroft AI team | 4 de abril de 2016 | Mycroft Mark | No | No | Enlace Archivado el 5 de julio de 2020 en Wayback Machine. |
Siri | Apple | 14 de octubre de 2011 | HomePod | No | No | Enlace |
Celia | Huawei | 27 de abril de 202777 | Huawei P40 | No | No | Enlace |
Sofía | Tudex Networks | 27 de noviembre de 2020 | - | No | No | Enlace Archivado el 6 de diciembre de 2020 en Wayback Machine. |
Los asistentes virtuales son considerados como tecnologías emergentes, es decir, productos de innovación científica y de avance que impactan el estilo de vida de sus usuarios, se espera que ese impacto sea positivo y genere bienestar. Los asistentes virtuales pueden aplicarse en distintos campos.[33]
La educación es uno de los campos en los que pueden utilizarse los asistentes virtuales, para procesos de enseñanza-aprendizaje bien sea presencial o virtual más aún en este tiempo en que las tecnologías de la información y la comunicación están siendo cada vez más usadas para apoyar las labores educativas. Los humanos podemos interactuar con los asistentes virtuales a través de nuestra voz para esperar una respuesta o la ejecución de una orden por parte de los asistentes virtuales.[33]
Entre las ventajas de usar asistentes virtuales en la educación están la preferencia y aceptación de los estudiantes a la interacción por voz, pues es más fácil que la interacción por texto; se puede interactuar como si fuera otra persona sin necesidad de usar un computador, teléfono o tableta.[34]
De acuerdo al informe de educación superior, Horizon Report del año 2019 los asistentes virtuales tendrán gran utilidad y un alto potencial de impacto a largo plazo en la educación superior.[33]
En el año 2020 se publicó un artículo que describe una investigación sobre de la utilidad y eficacia de los asistentes virtuales en educación secundaria.[35] En dicha investigación, se evaluó la capacidad de resolver dudas y brindar información en el aula de los asistentes Amazon Echo y Google Nest mini, los cuales fueron evaluados mediante una serie de preguntas hechas de forma oral por los estudiantes de la asignatura de Tecnología a los asistentes virtuales. Al evaluar a los asistentes virtuales, ninguno de los asistentes pudo responder más de 33 de las 58 preguntas planteadas.[35]
Pese a ello, el uso de asistentes virtuales en el aula tiene una serie de aplicaciones muy beneficiosas, como es el caso de:[36]
La política de privacidad de Google Assistant establece que no almacena datos de audio sin el permiso del usuario, pero puede guardar transcripciones de conversaciones para personalizar la experiencia.[37] La personalización puede desactivarse en los ajustes. Si el usuario quiere que Google Assistant guarde datos de audio, puede ir a Actividad de voz y audio (VAA) y activar la función.
La política de privacidad del asistente virtual de Amazon, Alexa, establece que sólo escucha las conversaciones cuando se utiliza su palabra de inicio (por ejemplo, Alexa, Amazon, Echo).[38] El software empieza a grabar la conversación cuando se pronuncia la palabra de inicio y deja de grabar tras 8 segundos de silencio.
Apple afirma que no graba audio para mejorar Siri. En su lugar, utiliza transcripciones. Los datos de la transcripción sólo se envían si se consideran importantes para el análisis. Los usuarios pueden excluirse en cualquier momento si no quieren que Siri envíe transcripciones a la nube.[39]