Amazon estaría planeando el lanzamiento de una Alexa con inteligencia artificial generativa. Esto con el objetivo de que el asistente virtual no se limite a seguir las indicaciones de los usuarios, sino que también puede establecer conversaciones como si fuera otro humano.
Esta versión de Alexa no sería gratuita, se trataría de un pago mensual y no estaría incluida en la suscripción de Amazon Prime, según un informe revelado por CNBC. El mismo reporte señala que el nuevo asistente se lanzaría el 30 de junio de 2024.
Cómo funcionaría la IA de Alexa
Los dispositivos Echo de Amazon integran al asistente virtual Alexa, que puede entender indicaciones como “Alexa, ¿qué horas es?”, “Alexa, cuéntame un chiste” o “Alexa, fija una alarma a las 6 de la mañana”.
Si te fijas, las interacciones con Alexa no son más que indicaciones que en la mayoría de casos cumple. Pero al parecer, Amazon quiere llevarlo al siguiente nivel con el objetivo de que pueda ser más conversacional.
Un ejemplo de una IA conversacional es ChatGPT. Con dicho modelo puedes establecer una charla dado que tiene la capacidad de seguir un hilo conductual casi como si fuera otra persona.
Según lo informado, el costo estimado de usar esta Alexa sería de 2 centavos por consulta y 20 dólares mensuales.
Amazon quiere una Alexa más inteligente
El lanzamiento de esta Alexa ocurriría en un momento donde las compañías tecnológicas se encuentran en una álgida carrera por obtener la inteligencia artificial más avanzada.
Prueba de ello es que en junio de 2024 tendrá lugar la Conferencia Mundial de Desarrolladores de Apple, evento en el que se espera ver una Siri con más capacidades impulsadas con inteligencia artificial.
Apple estaría planeado una profunda transformacional de Siri. Dicha decisión resulta de una serie de evaluaciones hechas por los ejecutivos Craig Federighi y John Giannandrea utilizando el chatbot de OpenAI, ChatGPT, según reportó New York Times.
Las habilidades de este chatbot en la generación de texto, creación de código y resolución de consultas complejas pusieron de manifiesto las limitaciones de Siri para gestionar conversaciones.
Para respaldar estas mejoras, los nuevos modelos de iPhone aumentarían su capacidad de memoria, y Apple está considerando la integración de modelos de IA de otras empresas, similar a lo que hizo Microsoft con OpenAI, para fortalecer aún más las capacidades de Siri.
Por su parte, OpenAI recientemente lanzó el modelo GPT-4o, el cual es capaz de entablar conversaciones en voz alta. Los usuarios tiene la oportunidad de hablarle a la IA y esta les entenderá y responderá.
GPT-4o es capaz de analizar datos de una hoja de Excel, interpretar infografías complejas y explicarlas de manera sencilla, transformar una fotografía que tomaste en una caricatura e incluso asistirte en la comprensión de lenguajes de programación.
La empresa compartió un video que mostraba una prueba del nuevo modelo. En el demo, dos personas conversaban, una en italiano y otra en inglés. OpenAI demostró que GPT-4o podía traducir ambos idiomas en tiempo real.
Por otro lado, Google presentó Gemini Flash en Google I/O 2024. Es la opción más rápida y con menor tiempo de espera dentro de la familia de sus inteligencias artificiales pues funciona directamente en los dispositivos móviles. Las aplicaciones que necesiten respuestas rápidas y no tanto un modelo complejo podrán usar Flash.
Google informó también sobre las mejoras previstas para Gemini 1.5 Pro. La primera es la velocidad de procesamiento. 1.5 Pro podrá analizar documentos extensos: archivos de hasta 1.500 páginas, resumir hasta 100 correos electrónicos al mismo tiempo, una hora de vídeo o bases de código con más de 30.000 líneas.
Además, será más avanzado en la comprensión de imágenes y tendrá la capacidad de planificar viajes de manera detallada y en tiempo real.