Agentes de IA: la tendencia que busca controlar más el PC y el móvil
Varias empresas tecnológicas y fabricantes de móviles ya se encuentran trabajando en lo que se considera la evolución de los actuales chatbots y la próxima tendencia en el PC y Móvil: Los agentes de IA. Esta nueva característica no solo podrá simular conversaciones con humanos en un lenguaje natural y proporcionar respuestas automatizadas, sino que también podrán efectuar acciones en nombre de la persona. Ahondemos más de qué se trata esta próxima tendencia y así comprender por qué se considera que el agente de IA busca controlar más el PC y el móvil.
Objetivo principal de los agentes de IA: Hacer varias cosas por tí en el PC y en el móvil
Los chatbots se han convertido actualmente en los amigos virtuales de numerosos usuarios, dado que cada vez interactúan de forma más natural, siendo capaces incluso de bromear. Sin embargo, están limitados a la conversación como tal. Ahora bien, ¿qué pasaría si estos chatbots tuvieran la capacidad de hacer varias acciones por ti en tu PC o dispositivo móvil, como, por ejemplo: reservar pasajes, efectuar transacciones, hacer pedidos en supermercados o completar formularios, entre otras actividades? Pues precisamente en esto se está trabajando, en convertir prácticamente el chatbot en un completo agente de IA.
Si bien actualmente ya hay un pequeño número de empresas que operan con agentes de IA, estos, al igual que los chatbots, están limitados a ciertas tareas específicas. Además, la idea en la que trabajan empresas y fabricantes como OpenAI, Google, HONOR y MediaTek es en implementar los agentes de IA en los dispositivos de los usuarios finales.
Conociendo algunos de estos agentes en los que se trabajan actualmente
“Operador” de OpenAI
La compañía OpenAI trabaja en su nueva característica llamada en nombre clave “Operador”. Este agente tendría capacidad para llevar a cabo acciones en nombre del usuario, como escribir y ejecutar código, así como efectuar diversas reservaciones. También la empresa estaría trabajando en una herramienta de IA que puede efectuar diversas tareas de forma automatizada en los navegadores webs que tenga el usuario instalado. Sin embargo, no se sabe con certeza si esta herramienta se trata del mismo agente “Operador”.
Las primeras versiones previas de “Operador” comenzarían a llegar en enero del 2025.
Claude 3.5 Sonnet de Anthropic
Anthropic, otro de los “grandes ligas” en el desarrollo de soluciones de IA, también está preparando su agente de IA junto con Claude 3.5 Sonnet. La funcionalidad en la que trabaja Anthropic es capaz de planificar una salida para ver un amanecer. En la prueba que la compañía envió al sitio Wired, cuando se le solicitó al agente de IA que ayudase a planificar una salida para ver un amanecer en el Golden Gate con un amigo, este abrió el navegador predeterminado y buscó información relevante en Google. Se obtuvo, como respuesta, una programación donde se incluyó hora y lugar de visualización ideal, además de compartir la información con dicho amigo.
También el agente de Anthropic fue capaz de programar un sitio web sencillo cuando se le solicitó. Este (el agente de IA) instaló el Visual Studio Code, lo abrió, escribió la página y lo ejecutó en una terminal para mostrar el resultado. Todo ello de forma automatizada, sin intervención alguna del usuario.
“Jarvis” de Google
El gigante de las búsquedas web también prepara su agente de IA, el cual lleva por nombre clave “Jarvis” y todo apunta a que la primera versión previa pudiese ser presentada en diciembre de este año junto al lanzamiento de Gemini 2.0. El modo en que funcionará Jarvis recordará mucho al Recall de Copilot+ PC de Microsoft, pues dicha funcionalidad capturará frecuentemente la pantalla del ordenador y, basándose en el análisis de las mismas, “predecirá” las acciones que va a hacer el usuario.
Sin embargo, “Jarvis” al parecer funcionará solamente con Chrome y posiblemente se extienda a los dispositivos Android. “Jarvis” tendrá la capacidad de hacer clic o escribir en campos textuales. No obstante, el enfoque que se le estaría dando a “Jarvis” sería hacia la investigación y resolver tareas complejas derivadas de las mismas. Por ello, “Jarvis” procesará la información desde la nube y no a nivel local.
El agente de IA “YoYo” de HONOR
El reconocido fabricante de teléfonos inteligentes chino, HONOR, también trabaja para transformar a su asistente de IA, YoYo, en un auténtico agente. No obstante, y a diferencia de otras empresas, este fabricante chino tiene planes muy ambiciosos con su próxima funcionalidad. De acuerdo con HONOR, el agente “YoYo” tendrá la capacidad de comprender lo que está necesitando el usuario en ese momento, y de forma automatizada, conseguir satisfacer esas necesidades.
HONOR asegura que el nuevo agente de IA “YoYo” puede efectuar de forma automática e independiente más de 900 tareas comunes de los usuarios. Por ejemplo, si un usuario acostumbra a tomar café entre las 7 y 9 am, “YoYo” aprenderá ese hábito y al acercarse dichas horas, el agente abrirá el mapa del dispositivo y le mostrará los sitios más cercanos con precios para tomar café. También será capaz de ordenar dicha bebida con una simple orden. Entre las numerosas tareas que “YoYo” es capaz de automatizar está:
- Administrar la renovación automática de suscripciones
- Efectuar tareas relacionadas con permisos y notificaciones
- Convertir documentos
- Completar formularios
- Hacer transacciones
“YoYo” tiene como fecha de arribo, el mes de marzo del 2025.
El chip Dimensity 9400 de MediaTek
Si bien MediaTek no está desarrollando propiamente su agente de IA, su contribución lo está haciendo en la inclusión de su nuevo motor Agentic AI en su chip insignia Dimensity 9400. Esto, en palabras sencillas, significa que los teléfonos equipados con este chip, podrán agilizar los agentes de IA a nivel de hardware. Además, este hecho también implica que MediaTek se convirtió en la primera compañía de chips en incluir este nuevo motor de IA de próxima generación.
Agentes de IA: la próxima gran tendencia en el PC y el móvil
Como vemos, para el 2025 se puede preveer el inicio de la era de los agentes de IA, pues varias empresas de relevancia se están dirigiendo hacia dicho puerto. En el caso de Microsoft y Apple, es muy probable que sus agentes de IA se basen en “Operador” de OpenAI. La proyección para la llegada masiva de estas características avanzadas de IA es a partir de marzo del 2025.
Otro hecho a destacar con esta próxima tendencia es que los agentes de IA tendrán muchas más capacidades para controlar el PC y el móvil del usuario. Esperemos que dichas características de IA se ofrezcan de forma opcional y se le permita al usuario personalizarla. Recordemos que Microsoft, inicialmente cuando lanzó Recall, este vino habilitado de forma predeterminada y no permitía que el usuario la deshabilitase.