Estos sistemas no solo responden, sino que actúan, planifican y ejecutan tareas de forma autónoma. Para nosotros, en gestión de proyectos y testing, esto no es futuro, es una revolución en la eficiencia que está sucediendo ahora.
Los Agentes de IA ya no son ciencia ficción. Son herramientas prácticas que pueden automatizar desde la generación de reportes y el análisis de datos hasta la ejecución de planes de prueba complejos. Entender su funcionamiento y su potencial te posiciona a la vanguardia, permitiéndote identificar oportunidades para optimizar procesos, reducir el trabajo manual y liberar a tu equipo para que se enfoque en tareas de mayor valor estratégico.
El futuro no es solo inteligente, es «agéntico». Y está llegando más rápido de lo que crees.
Desarrollaré a continuación, parte de lo que vengo investigando.
¿Qué es un Agente de IA?
Imagina un asistente personal superdotado. No solo responde a tus preguntas, sino que actúa proactivamente para cumplir objetivos complejos. Eso, en esencia, es un Agente de IA.
Tengamos en cuenta lo siguiente para entender mejor el contexto actual. Hasta donde se puede conocer, estamos usando las IAs de diversa manera, dependiendo del conocimiento y presupuesto:
- Se usan a las IA Generativas como ChatGPT, Gemini, Claude, DeepSeek y otras IAs en su forma básica.
- Se utilizan ciertos modelos de estas IAs para aprovechar más aún su capacidad y tener mejores resultados, conociendo qué ofrecen los mismos.
- Se utilizan ciertos asistentes virtuales como los GPTs (de OpenAI) o Gems (de Google) con una base de conocimientos cargada y una instrucción principal definida y configurada para atender requerimientos específicos de algún área de conocimiento determinada.
- Se utilizan ciertas herramientas que integran IAs y otras aplicaciones para automatizar procesos como Make, n8n y otros.
Un Agente de IA es un sistema diseñado para percibir su entorno, tomar decisiones y ejecutar acciones de forma autónoma para alcanzar una meta específica. Pensemos en sus componentes clave:
- Sentidos (Sense): El agente percibe su «entorno», que puede ser una página web, una base de datos, una aplicación o cualquier fuente de información digital.
- Rasgos (Traits): Aquí reside su inteligencia. Un agente puede razonar, planificar los pasos a seguir, actuar sobre esos planes, aprender de los resultados, adaptarse si algo cambia y, muy importante, delegar tareas a otros agentes o herramientas.
- Herramientas (Tools): Para actuar, el agente utiliza diversas herramientas: puede navegar por la web, ejecutar código, interactuar con apps, analizar datos o usar funciones específicas de un software.
- Memoria: Al igual que los humanos, los agentes tienen memoria.
- Memoria a corto plazo: Para recordar información inmediata de la tarea en curso (por ejemplo, los pasos que ya ha completado).
- Memoria a largo plazo: Para almacenar conocimiento a lo largo del tiempo, como en una base de datos vectorial (Vector DB), un archivo SQL o documentos, lo que le permite mejorar con la experiencia.
- Supervisión (Oversight): Todo agente opera bajo una supervisión que define sus metas (el «qué») y las tareas permitidas (el «cómo»). Esto garantiza que el agente se mantenga alineado con los objetivos del proyecto.
Agentes de IA vs. IA «Agéntica»: ¿Cuál es la Diferencia?
Recientemente, ha surgido un debate sobre los términos «Agente de IA» (AI Agent) e «IA Agéntica» (Agentic AI). La discusión se centra en el grado de autonomía.
- Un Agente de IA es un sistema que sigue un flujo de trabajo para automatizar tareas.
- La IA Agéntica se refiere a sistemas que son plenamente autónomos, capaces de autogestionarse y tomar iniciativas complejas sin intervención humana directa.
Lo verdaderamente importante es el comportamiento real y el valor que aporta. La tendencia es clara: los agentes de IA son cada vez más autónomos y capaces. ¿Hasta donde llegarán? ¿Qué limites y restricciones le iremos definiendo para controlar sus resultados? La pregunta clave es: ¿Qué puede hacer esta tecnología por nuestro proyecto HOY? Materia a investigar ¿verdad?
Lo importante aquí es ir siguiendo estos temas y entenderlos para poder reaccionar a tiempo cuando lo necesitemos y debamos buscar conocimiento en esta área.
Colaboración: Sistemas Multiagente
El siguiente nivel en esta evolución son los sistemas multiagente. ¿Te imaginas que en lugar de un solo asistente, tengamos un equipo de «especialistas» que colaboran para resolver un problema?
El ejemplo del «Claude Multi-agent Research System» lo ilustra a la perfección:
- Un Agente Líder (orquestador) recibe la tarea principal.
- Este líder delega sub-tareas a agentes especializados:
- Un Subagente de Búsqueda para encontrar información relevante.
- Un Subagente de Citaciones para verificar y referenciar las fuentes.
Este enfoque modular permite abordar problemas mucho más complejos.
Así como existen estas iniciativas que siguen evolucionando desde Anthropic, también hay experiencias similares en OpenAI y en Google, con enfoques y nombres de producto diferentes.
¿Qué nos ofrece OpenAI?
OpenAI no tiene un producto llamado «Multi-agent System», pero ofrece las herramientas para que los desarrolladores construyan los suyos propios a través de la Assistants API.
- Iniciativa Principal: Assistants API y el concepto de «Swarms» (Enjambres) de Agentes.
- Concepto Clave: La Assistants API permite crear «Asistentes» (agentes) con personalidades, instrucciones y herramientas específicas. Un desarrollador puede perfectamente crear un «Asistente-Gerente» que, para resolver un problema complejo, invoca a otros «Asistentes-Trabajadores» que ha creado. (Concepto similar al de Anthropic con el «Orquestador»)
- Ejemplo Práctico: Imagina que tienes una tarea de «analizar el feedback de clientes del último trimestre».
- Un Asistente Orquestador recibe la tarea.
- Este invoca a un Asistente Analista de Datos para que se conecte a la base de datos de encuestas y extraiga los comentarios.
- Luego, pasa esos datos a un Asistente de Análisis de Sentimiento para que clasifique los comentarios como positivos, negativos o neutros.
- Finalmente, entrega los resultados a un Asistente Redactor para que genere un resumen ejecutivo.
- Ejemplo Práctico: Imagina que tienes una tarea de «analizar el feedback de clientes del último trimestre».
- Enfoque: OpenAI proporciona el marco de trabajo (framework) y las herramientas para que las empresas construyan sus propios equipos de agentes a medida. Es un enfoque de «caja de herramientas» muy potente para los desarrolladores.
¿Qué nos ofrece Google (Ecosistema Gemini)?
Google aborda esto desde una perspectiva de integración profunda en sus modelos y una visión a largo plazo con Project Astra.
- Iniciativa Principal: Modelos Gemini con «function calling» avanzado y la visión de Project Astra.
- Concepto Clave: Los modelos Gemini están diseñados desde su núcleo para ser excelentes en el razonamiento y el uso de herramientas (tool use). El concepto fundamental aquí es el «function calling», donde el modelo puede pausar su razonamiento, llamar a una herramienta externa (como una API, una base de datos o un script), obtener un resultado y continuar su tarea con esa nueva información. Un sistema multiagente se construye orquestando múltiples llamadas a funciones, que pueden a su vez invocar a otras instancias del modelo con roles diferentes.
- Project Astra: Es la demostración más ambiciosa de esta visión. Se presenta como un agente universal y multimodal capaz de ver, oír y hablar, recordando lo que ve para contextualizar y ayudar en tareas complejas. Aunque se presenta como un único agente, internamente funciona orquestando múltiples capacidades y modelos especializados para lograr esa fluidez.
- Enfoque: Google se enfoca en hacer su modelo base (Gemini) extremadamente capaz en el uso de herramientas, permitiendo a los desarrolladores construir arquitecturas de agentes complejas sobre esa base sólida, con una visión a futuro de un agente universalmente integrado.
Por lo que he podido entender, aunque Anthropic le dio un nombre claro a su sistema de investigación, la misma capacidad de crear «equipos de IAs» existe y es funcional tanto en OpenAI como en Google. La diferencia radica en el enfoque: OpenAI te da los «bloques de Lego» (API de Asistentes) para que armes tu equipo, mientras que Google te da un «motor súper potente» (Gemini) que puedes integrar en cualquier chasis para crear agentes especializados. Dependerá lógicamente de la empresa y tecnología que tu organización seleccione como socio tecnológico.
¿Y si pensamos en implementar un Agente de IA?
Volviendo al tema central como para ir logrando más conocimiento, me pareció muy interesante buscar información para compartir en relación al enfoque que deberemos considerar a la hora de pensar en su implementación en etapas.
Etapa 1: Definición Estratégica y Caso de Uso
- ¿Qué es?: El punto de partida. Es básico, pero algunas veces uno se puede olvidar u obviarlo. Aquí debemos definir qué problema de negocio resolverá el agente y por qué es importante. Se trata de identificar una tarea o proceso repetitivo y de alto impacto que pueda ser automatizado. Importante: Ir de – a +, ¿se entiende no?
- Actividades Clave:
- Identificar el objetivo (Ej: «Reducir en un 40% el tiempo de generación de reportes de testing»).
- Definir las métricas de éxito (KPIs).
- Establecer los límites y el alcance (¿Qué hará y qué no hará el agente?).
- Fundamental: No sólo lograr el acuerdo con todos los miembros del equipo de proyecto, sino con el Product Owner, los stakeholders y responsables del negocio involucrados, además de las áreas técnicas correspondientes. No es menor el trabajo! 🙂
Etapa 2: Diseño de la Arquitectura del Agente
- ¿Qué es?: Es el plano de construcción de tu agente. En esta fase se decide cómo funcionará, qué herramientas necesitará y cómo «pensará».
- Actividades Clave:
- Seleccionar el Modelo de Lenguaje (LLM) que servirá como «cerebro» (Ej: GPT-4, Claude 3, Gemini).
- Definir las herramientas que usará (APIs de Jira, repositorios de código, bases de datos, etc.).
- Diseñar su memoria (cómo recordará interacciones pasadas para aprender y mejorar).
- Fundamental: Buscar y seleccionar el equipo de desarrollo que se ocupará del diseño, desarrollo, implementación y mantenimiento de la arquitectura, para lo cual habrá que involucrar a las respectivas gerencias y áreas de negocio para lograr el correspondiente presupuesto.
Etapa 3: Desarrollo e Integración
- ¿Qué es?: La fase de construcción. El equipo de desarrollo escribe el código, conecta el agente con las herramientas definidas y configura su lógica de razonamiento.
- Actividades Clave:
- Desarrollar los conectores (APIs) a los sistemas necesarios.
- Implementar el «System Prompt» o las instrucciones maestras que guían el comportamiento del agente.
- Configurar el flujo de trabajo (planning, action, observation).
- Fundamental: Lograr armar un equipo multidisciplinario con roles técnicos y no técnicos.
Etapa 4: Pruebas y Validación Rigurosa
- ¿Qué es?: Una de las etapas más críticas, especialmente para un líder de testing. Aquí se verifica que el agente funcione de manera fiable, segura y predecible. No solo se prueba el código, sino su capacidad de decisión.
- Actividades Clave:
- Testing funcional: ¿El agente completa la tarea correctamente?
- Testing de robustez: ¿Cómo reacciona ante instrucciones ambiguas o errores inesperados?
- Evaluación de seguridad y ética: ¿Se asegura de no filtrar datos sensibles o tomar acciones no permitidas?
- Fundamental: Tener una clara definición del alcance de los principales requerimientos desarrollados como cualquier otro desarrollo tradicional.
Etapa 5: Despliegue Controlado y Monitoreo
- ¿Qué es?: El lanzamiento del agente. En lugar de un lanzamiento masivo, se suele optar por un despliegue gradual (piloto) para un grupo reducido de usuarios o un subconjunto de tareas. Después lo más probable es pensar en su despliegue incremental.
- Actividades Clave:
- Lanzar el agente en un entorno de producción controlado.
- Establecer un dashboard de monitoreo para supervisar su rendimiento en tiempo real (acciones ejecutadas, errores, éxito de las tareas).
- Recopilar feedback de los primeros usuarios.
- Fundamental: Seleccionar y tener una clara justificación del candidato al proyecto piloto, ya que deberá significar y representar una clara solución a un problema o situación determinada del negocio.
Etapa 6: Iteración y Mejora Continua
Incorporar nuevas herramientas o capacidades según surjan nuevas necesidades.
- ¿Qué es?: Un Agente de IA no es un producto que se entrega y se olvida. Es un sistema que evoluciona con el uso y los datos.
- Actividades Clave:
- Analizar los datos de rendimiento y el feedback de los usuarios.
- Refinar las instrucciones (prompts) y la lógica del agente.
- Fundamental: Tener KPIs definidos previamente.