
Image generated with OpenAI
Opinión: Por qué los Agentes de IA son el Futuro de la IA Cotidiana
2025 parece ser el año de la IA Agente. OpenAI, Microsoft, Anthropic y otras grandes empresas de tecnología han lanzado sus modelos de IA más avanzados hasta la fecha, capaces de realizar tareas complejas que no eran posibles hace apenas un año. Pero, ¿qué son exactamente los agentes de IA y cuánto de esta tecnología es real frente a pura publicidad?
Mantenerse al día con las tendencias de la IA en los últimos años puede resultar agotador. Hemos pasado de la IA básica a la IA generativa, luego a la IA razonadora y ahora, los agentes de IA están dominando la conversación. En los últimos meses, varias empresas de tecnología han estado presentando nuevos agentes de IA y destacando cómo los flujos de trabajo que los conectan se están volviendo cada vez más atractivos.
En enero, OpenAI lanzó su primer agente de IA, Operator, capaz de realizar tareas de manera autónoma, como navegar por la web, reservar un restaurante o conseguir entradas para un concierto para ti, basándose en tus preferencias y criterios.
Dos meses después, la startup china de IA Zhipu lanzó AutoGLM Rumination, un agente de IA gratuito que puede operar de manera independiente y planificar viajes para los usuarios. Y hace sólo unos días, Microsoft presentó “Computer Use” para Copilot Studio, añadiendo más capacidades autónomas a los agentes de IA, incluyendo la capacidad de tomar el control del escritorio del usuario.
Pero esta tendencia no se trata solo de empresas que lanzan nuevos productos interesantes, sino de un campo complejo y en constante evolución que combina diversas formas de IA con la interacción humana. Los entusiastas de la tecnología y los expertos por igual han mostrado un fuerte optimismo acerca de la IA Agente.
“La tendencia que también me emociona es el flujo de trabajo de agentes de IA”, dijo el experto en IA y cofundador de Coursera y DeepLearning, Andrew Ng, en la conferencia BUILD 2024 de Snowflake en noviembre. “Si tuvieras que preguntar, ¿cuál es la tecnología de IA más importante a la que prestar atención? Diría que es la IA Agente.”
Entonces, ¿qué son exactamente los agentes de IA? ¿Rinden tan bien como afirman los expertos? Aquí te presento una breve descripción de los aspectos más esenciales de esta tecnología emergente y los últimos avances.
¿Qué son los Agentes de IA?
Tal como han demostrado empresas como OpenAI y Microsoft, los agentes de IA son tecnologías capaces de realizar tareas complejas al combinar autónomamente diferentes aplicaciones y software.
En esencia, son “tradicionales” chatbots de IA, pero más avanzados, capaces de realizar tareas más allá de lo que hemos estado acostumbrados en los últimos dos años. Estas incluyen la planificación, la navegación por la web, recordar tus intereses e incluso hacer tus compras de comestibles sin una guía paso a paso, ya que ellos mismos resuelven las cosas.
Google Cloud define a los agentes de IA como “sistemas de software que utilizan la IA para perseguir objetivos y completar tareas en nombre de los usuarios”.
Lo que hace que estos modelos de IA sean verdaderamente especiales son sus avanzadas capacidades de razonamiento, que les permiten procesar múltiples tipos de información —audio, texto, video, código e imágenes— simultáneamente. Pueden entender situaciones complejas de la misma manera que lo harían los humanos, tomar acciones e interactuar con software y plataformas.
Muchas empresas de tecnología están ahora llevando sus modelos de IA a este siguiente nivel.
Hace solo unos días, OpenAI anunció que sus modelos de IA o3 y o4-mini pueden “pensar” con imágenes y manipularlas, por ejemplo, recortándolas o transformándolas. Mientras tanto, la nueva característica de “Uso del Computador” de Microsoft permite a sus agentes de IA reconocer las interfaces gráficas de usuario.
“Si una persona puede usar la aplicación, el agente también puede”, dijo Charles Lamanna, Vicepresidente Corporativo, Copiloto de Negocios e Industria en Microsoft, en el anuncio.
El siguiente nivel: Tecnología de IA Agente
Si bien muchas empresas de tecnología están desarrollando chatbots de IA ultra-inteligentes, la IA agencial va un paso más allá. Esta tecnología se centra en la construcción de sistemas en los que múltiples de estos agentes de IA pueden interactuar y realizar diferentes tareas para proporcionar resultados más precisos y completos.
Durante su charla sobre “El Poder de los Agentes de IA” en un reciente evento Tech Talk al que asistí, organizado por eDreams, la experta en IA Patricia Gutierrez Faxas explicó que estos sistemas pueden adoptar diversas estructuras. Los sistemas multiagente pueden desglosar tareas complejas en más sencillas, asignarlas a agentes especializados y formar diferentes tipos de redes.
Un agente de Inteligencia Artificial puede asumir el papel de “Supervisor”, delegando tareas más pequeñas a otros agentes especializados, o varios agentes pueden trabajar simultáneamente en tareas separadas y coordinarse para entregar el resultado final. Algunos de los beneficios de estos sistemas incluyen una mayor precisión, una mayor privacidad y una reducción de los errores.
Andrew Ng está de acuerdo con este enfoque. Durante su charla en BUILD 2024, enfatizó la importancia de los flujos de trabajo de IA Agentic para procesar tareas complejas con resultados mucho mejores. El salto en rendimiento de modelos como GPT-3.5 a GPT-4, y sus resultados más fuertes en benchmarks de codificación, se debe en gran medida a los flujos de trabajo agentic y al razonamiento agentic.
¿Cómo afectarán los agentes de IA a nuestras vidas?
Las empresas de tecnología están adoptando diferentes enfoques hacia la IA Agente. OpenAI se ha centrado en ideas para usuarios cotidianos. Al lanzar Operator, el equipo explicó en un video que una persona simplemente podría pensar en un platillo que le gustaría preparar, pedirle a ChatGPT que encuentre la mejor receta e incluso hacer que compre los ingredientes necesarios de un supermercado en línea.
El modelo de IA podría hacer preguntas de seguimiento y pausar antes de ejecutar tareas críticas, como completar una compra utilizando la tarjeta de crédito del usuario. Los usuarios pueden establecer límites de gasto o requerir que el asistente pida confirmación antes de comprar algo.
Las posibilidades de cómo la gente común puede utilizar los agentes de IA parecen infinitas, pero los usos más populares hasta ahora incluyen actuar como agentes de viajes, compradores personales y asistentes administrativos, después de todo, ¿quién no querría una tecnología personalizada que envíe correos electrónicos, recuerde cumpleaños importantes y se encargue de los impuestos?
Microsoft ha adoptado un enfoque más corporativo. La compañía ha demostrado cómo las agencias de marketing pueden usar agentes de IA para automatizar la recopilación de datos de mercado y generar análisis basados en información, o cómo las grandes empresas pueden usarlos para el procesamiento de facturas dentro de sus sistemas.
Sin embargo, aunque todos estos casos de uso suenan revolucionarios, los expertos coinciden en que aún queda un largo camino por recorrer. La mayoría de las personas aún no pueden utilizar agentes de IA para mejorar su vida diaria, ya que muchas de estas características, como Operador, sólo están disponibles para los usuarios Pro, una suscripción que cuesta $200 al mes.
Entonces, ¿La IA Agente Está a la Altura de la Exageración?
Muchos titulares de los medios prometen una nueva revolución de la IA liderada por Agentic AI. Sin duda, hay mucho revuelo en la industria, y la realidad podría no estar muy lejos. Un reciente informe compartido por IBM reveló que muchos desarrolladores están explorando y desarrollando activamente esta tecnología.
“IBM y Morning Consult realizaron una encuesta a 1,000 desarrolladores que están construyendo aplicaciones de IA para empresas, y el 99% de ellos dijo que están explorando o desarrollando agentes de IA”, explicó la Dra. Maryam Ashoori, Directora de Gestión de Productos en IBM watsonx.ai. “Así que sí, la respuesta es que el 2025 va a ser el año del agente.”
Sin embargo, los expertos señalan que existen múltiples interpretaciones de lo que verdaderamente son los agentes de IA y cómo deberían funcionar. Como resultado, el progreso y el rendimiento de los actuales agentes de IA a menudo dependen de la perspectiva y los estándares de la persona que evalúa la tecnología.
Lo que es seguro es que muchos expertos y tomadores de decisiones creen profundamente en esta tecnología e invierten fuertemente en su desarrollo. Un estudio reciente reveló que el 84% de los líderes de TI confían en los agentes de IA tanto como en los humanos, y OpenAI espera alrededor de $125 mil millones en ingresos para 2029.
Aunque la tecnología de Agentic AI aún no está completamente desarrollada y su adopción no es tan generalizada como la de los chatbots, principalmente debido a su alto costo, está claro que el optimismo y entusiasmo abrumadores en torno a esta tendencia son lo suficientemente poderosos para impulsar cambios importantes en los meses venideros.