Así perdieron Siri, Alexa y Google Assistant la contienda de la inteligencia artificial

Scott Forstall, entonces director de software de Apple, pulsó un botón del iPhone para llamar a Siri y le hizo preguntas.

Agreganos en Google

17.03.2023 12:16

Lectura: 8'

Recibí GRATIS las noticias en tu celular

Por The New York Times | Brian X. Chen, Nico Grant and Karen Weise

SAN FRANCISCO — En un lluvioso martes en San Francisco, los ejecutivos de Apple subieron al escenario en un auditorio abarrotado para anunciar la quinta generación del iPhone. El teléfono, que parecía idéntico a la versión anterior, tenía una nueva característica que el público no tardó en comentar: Siri, un asistente virtual.

Scott Forstall, entonces director de software de Apple, pulsó un botón del iPhone para llamar a Siri y le hizo preguntas. A petición suya, Siri comprobó la hora en París (“8:16 p.m.”, respondió Siri), definió la palabra “mitosis” (“División celular en la que el núcleo se divide en núcleos que contienen el mismo número de cromosomas”, explicó) y sacó una lista de catorce restaurantes griegos muy bien valorados, cinco de ellos en Palo Alto, California.

“Llevo mucho tiempo en el campo de la inteligencia artificial y esto todavía me sorprende”, afirmó Forstall.

Eso fue hace doce años. Desde entonces, Siri y los asistentes basados en inteligencia artificial de la competencia, como Alexa de Amazon y Google Assistant, no han dejado a nadie boquiabierto. La tecnología se ha estancado en gran medida, y los asistentes parlantes se han convertido en el blanco de bromas, incluso en una escena cómica de “Saturday Night Live” de 2018 que presentaba un altavoz inteligente para personas mayores.

El mundo de la tecnología hora está entusiasmado con un tipo diferente de asistente virtual: los chatbots. Estos robots impulsados por IA, como ChatGPT y el nuevo ChatGPT Plus de la empresa OpenAI de San Francisco, pueden improvisar respuestas a preguntas escritas en un cuadro de chat con presteza. La gente ha utilizado ChatGPT para realizar tareas complejas como codificar software, redactar propuestas de negocio y escribir ficción.

Y ChatGPT, que utiliza IA para adivinar qué palabra viene a continuación, está mejorando rápidamente. Hace unos meses no era capaz de escribir un haiku; ahora lo hace con rapidez. El martes, OpenAI presentó su motor de IA de nueva generación, GPT-4, que impulsa ChatGPT.

El entusiasmo en torno a los chatbots ilustra cómo Siri, Alexa y otros asistentes de voz —que en su momento suscitaron una exaltación similar— han desaprovechado su ventaja en la contienda de la IA.

En la última década, los productos se han topado con obstáculos. Siri se topó con obstáculos tecnológicos, como un código tosco que tardaba semanas en actualizarse con funciones básicas, explicó John Burkey, un antiguo ingeniero de Apple que trabajó en el asistente. Amazon y Google calcularon mal cómo se utilizarían los asistentes de voz, lo que los llevó a invertir en áreas con esa tecnología que rara vez dieron sus frutos, dijeron antiguos empleados. Cuando esos experimentos fracasaron, el entusiasmo por la tecnología decayó en las empresas, señalaron.

Los asistentes de voz son “tontos como una piedra”, afirmó Satya Nadella, consejero delegado de Microsoft, en una entrevista este mes con The Financial Times, y declaró que la IA más reciente marcaría el camino. Microsoft ha colaborado estrechamente con OpenAI, invirtiendo 13.000 millones de dólares en la empresa emergente e incorporando su tecnología al motor de búsqueda Bing, así como a otros productos.

Apple no quiso hacer comentarios sobre Siri. Google se comprometió a ofrecer un gran asistente virtual para ayudar a la gente en sus celulares, y dentro de sus casas y autos; la empresa está probando por separado un chatbot llamado Bard. Amazon aseguró que vio un aumento del 30 por ciento en la participación del cliente a nivel mundial con Alexa en el último año y que era optimista sobre su misión de construir IA de clase mundial.

Los asistentes y los chatbots se basan en diferentes tipos de IA. Los chatbots se basan en lo que se conoce como grandes modelos lingüísticos, que son sistemas entrenados para reconocer y generar texto a partir de enormes conjuntos de datos extraídos de internet. A continuación, pueden sugerir palabras para completar una frase.

En cambio, Siri, Alexa y Google Assistant básicamente son lo que se conoce como sistemas de mando y control. Estos pueden entender una lista finita de preguntas y peticiones como “¿Qué tiempo hace en Nueva York?” o “Enciende las luces del dormitorio”. Si un usuario pide al asistente virtual que haga algo que no está en su código, el bot simplemente dice que no puede ayudar.

Siri también tenía un diseño engorroso que hacía que llevara mucho tiempo añadir nuevas funciones, confirmó Burkey, que recibió el encargo de mejorar a Siri en 2014. La base de datos de Siri contiene una gigantesca lista de palabras, incluyendo los nombres de artistas musicales y lugares como restaurantes, en casi dos decenas de idiomas.

Eso la convertía en “una gran bola de nieve”, dijo. Si alguien quiere añadir una palabra a la base de datos de Siri, añadió, “va a parar a un gran montón”.

Así que actualizaciones al parecer sencillas, como añadir algunas frases nuevas al conjunto de datos, requerirían reconstruir toda la base de datos, lo que podría llevar hasta seis semanas, dijo Burkey. Añadir funciones más complejas, como nuevas herramientas de búsqueda, podía llevar casi un año. Eso significaba que no había camino para que Siri se convirtiera en un asistente creativo como ChatGPT, aclaró.

Alexa y Google Assistant se basaron en una tecnología similar a la de Siri, pero las empresas lucharon por generar ingresos significativos con los asistentes, dijeron exgerentes de Amazon y Google. (En cambio, Apple utilizó con éxito a Siri para atraer compradores a sus iPhones).

Después de que Amazon lanzara el Echo, un altavoz inteligente impulsado por Alexa, en 2014, la compañía esperaba que el producto ayudara a aumentar las ventas en su tienda en línea al permitir a los consumidores hablar con Alexa para realizar pedidos, dijo un exlíder de Amazon involucrado con Alexa. Sin embargo, aunque la gente se divertía jugando con la capacidad de Alexa para responder a las indicaciones meteorológicas y programar alarmas, pocos le pedían a Alexa que pidiera artículos, añadió.

Amazon puede haber invertido demasiado en la fabricación de nuevos tipos de hardware, como relojes despertadores y microondas ahora descatalogados que funcionaban con Alexa, que se vendían a precio de costo o por debajo de él, comentó el exejecutivo.

La empresa tampoco invirtió lo suficiente en la creación de un ecosistema para que la gente pudiera ampliar fácilmente las capacidades de Alexa, del mismo modo que Apple había hecho con su App Store, que ayudó a avivar el interés por el iPhone, señaló la persona. Aunque Amazon ofrecía una tienda de “habilidades” para que Alexa controlara accesorios de terceros, como interruptores de la luz, a la gente le resultaba difícil encontrar y configurar habilidades para las bocinas, a diferencia de la experiencia sin fricciones de descargar aplicaciones móviles de las tiendas de aplicaciones. Los fallos de Amazon con Alexa pueden haber llevado a Google por mal camino, aseguró un exdirectivo que trabajó en Google Assistant. Los ingenieros de Google pasaron años experimentando con su asistente para imitar lo que Alexa podía hacer, incluyendo el diseño de altavoces inteligentes y pantallas de tabletas controladas por voz para manejar accesorios para el hogar como termostatos e interruptores de luz. La compañía integró más tarde anuncios en esos productos para el hogar, que no se convirtieron en una fuente importante de ingresos. Ahora muchas de las grandes empresas tecnológicas se apresuran a dar respuestas a ChatGPT. En la sede de Apple, la empresa celebró el mes pasado su cumbre anual sobre IA, un evento interno para que los empleados aprendieran sobre su gran modelo lingüístico y otras herramientas de IA, según explicaron dos personas que saben del programa. Muchos ingenieros, incluyendo a miembros del equipo de Siri, han estado probando conceptos de generación de lenguaje cada semana, aseguraron las personas.

El martes, Google también dijo que pronto lanzaría herramientas de IA generativa para ayudar a empresas, gobiernos y desarrolladores de software a crear aplicaciones con chatbots integrados e incorporar la tecnología subyacente a sus sistemas.

En el futuro, las tecnologías de los chatbots y los asistentes de voz convergerán, según los expertos en IA. Eso significa que la gente podrá controlar los chatbots con el habla, y quienes utilicen productos de Apple, Amazon y Google podrán pedir a los asistentes virtuales que los ayuden con sus trabajos, no solo con tareas como consultar el tiempo.

“Estos productos nunca funcionaron en el pasado porque nunca tuvimos capacidades de diálogo a nivel humano”, comentó Aravind Srinivas, fundador de Perplexity, una empresa emergente de IA que ofrece un motor de búsqueda impulsado por chatbot. “Ahora sí las tenemos”.