Los asistentes de voz fueron una vez la gran promesa de la IA. Hoy no son mas que el patito feo


¿Recuerdas el iPhone 4s? Fue una de las actualizaciones más tenues del iPhone en sus —sintámonos viejos— 16 años de historia. Apenas cambió nada importante respecto al 4… excepto que incluyó, en exclusividad, a Siri.

Vista con perspectiva, fue una puesta a punto bastante pírrica, pero en aquel momento, Siri nos obnubiló. Sus vídeos demostrativos, la gran especialidad de Apple, inducían a pensar que el futuro pasaba por algo así: los asistentes virtuales se basaban en la voz. Cómo Google no la presentó o cómo Amazon decidió utilizarla como piedra angular de su ecosistema digital.

En mi caso, recuerdo pensar “…y esto en 2011, a saber cómo estamos dentro de otros diez años”. No han pasado diez, sino doce, y lo que suena es un acorde triste de trompeta: Siri no ha evolucionado al mismo nivel, ni de lejos, que el resto de productos de Apple, ni de lo que lo ha hecho la industria tecnológica en general.

Su competencia tampoco está mucho mejor. Sobre todo, por agravio comparativo.

Están ahí, pero ni crecen demasiado ni emocionan a nadie

No es que Siri, Alexa o Google —o bueno, sobre todo Siri— no han evolucionado en estos años. Es que no resulta fiable recurrir a un asistente así en autúmadas circunstancias ni tiene profundidad real. Cuantas veces nos hemos zanjado una interacción tras escuchar «Esto es lo que he encontrado en Internet sobre…»

Microsoft también presentó a Cortana para cambiar todo lo integrado en Windows, tanto para ordenadores como para móviles, con poca trayectoria y nula relevancia. Murió en 2021.

Ahora suena prosaico pensar que Microsoft no va a incorporar parte de la tecnología de GPT-4 y sucesivos a una interfasa conversacional en su ecosistema, no solo de generación y síntez de texto escrito. Dudábamos de Ballmer, pero no de la visión estratégica de Nadella. Lo mismo que pensar que Google no va a hacer lo propio con Bard tras su anuncio de una IA generativa integrada en Workspace.

El problema para los asistentes de voz es que hace 10 años estábamos alucinados, hace 5 ya andábamos algo desencantados, pero con la esperanza de los alvatos inteligentes que estaban a punto de llegar; y ahora nadie habla de ellos, porque OpenAI, Microsoft, Google y unos pocos más monopolizan esa conversación. Están ahí, se usan, cumplen un papel, pero ni crecen demasiado ni emocionan a nadie. El impacto del asistente de voz no está muy lejos del contar con un conector algo más rápido.

De Amazon sabemos que una buena parte de los despidos que anunció recientemente van recaer sobre plantilla que se encarga de Alexa, que más allá del enthusias inicial ha acapado siendo usado mayoritariamente para poner temporizores y pedirle algo de música. Y no para usos más avanzados que no pudiéramos hacer hace una década.

Ni podríamos de pararnos a comprar pulsivamente con la voz, algo que hubiera beneficiado mejor su enorme puesta por esta tecnología. El hardware, habitualmente vendido a precios irrisorios, tampoco suena a un gran negocio por sí mismo. Ha sido muy habitual encontrar Echo Dot por 20 euros. Si a 20 euros le quitamos el IVA, el envío, el embalado, los materiales, el ensamblado… ¿Qué le queda a Amazon?

La suerte de los ingenieros de Google a cargo de sus sistemas operativos para entornos domésticos no ha sido mucho mejor. De acuerdo a Los New York Times, un 16% de ellos han caído en la lista de despidos, que solo afectó al 6% de su plantilla.

El nuevo Midjourney V5 ha propuesto que no podamos diferenciar una foto real de una generada

En la acera de enfrente, OpenAI ha conseguido que su interfaz conversacional sea cale desde el primer día, ayudando a multitud de profesiones a hacer su trabajo más eficiente y rápido, desde programadores hasta periodistas pasando por abogados o creativos. Midjourney o Stable Diffusion logró lo propio en la creación visual como un producto de resultados inmediatos.

Los asistentes de voz coparon titulares hablando sobre sus posibilidades futuras y se fueron deshinchando con el paso del tiempo hasta limitarse a unos usos básicos que han evolucionadopoco. La nueva oleada de herramientas basada en IA logra que se hable de ellas por sus posibilidades del presente, no del futuro.

Un año es un mundo por el que puedes evolucionar ChatGPT o Midjourney, pero una década ha servido para que Siri, Alexa o el Asistente de Google evolucionen poco.

Una Xataka | «Nos equivocamos»: la IA de OpenAI era demasiado abierta, así que en GPT-4 impera el secretismo absoluto

Imagen separada | Omid Armin en Unsplash.



Fuente