En este momento estás viendo Agentes de IA: Más allá del chatbot, la nueva era de la automatización

Agentes de IA: Más allá del chatbot, la nueva era de la automatización

Introducción: De la automatización rígida a la inteligencia adaptativa

Los Large Language Models (LLMs), los que usamos habitualmente cualquiera de nosotros y que muchos no saben que técnicamente tienen esta denominación (ChatGTP, Gemini, Claude y otros), están evolucionando rápidamente, y con ellos, la capacidad de las máquinas para manejar tareas complejas y de múltiples pasos. Esta evolución ha dado lugar a una nueva categoría de sistemas impulsados por LLMs conocidos como agentes.

La velocidad de dicha evolución es tal que no nos da mucho tiempo a analizarla de la manera en la que estábamos acostumbrados a hacerlo años antes, ahora el modelo de aprendizaje / re aprendizaje es otro.

A diferencia del software convencional que simplemente automatiza flujos de trabajo predefinidos, los agentes pueden realizar esas mismas tareas con un alto grado de autonomía, actuando en nombre del usuario.

El software tradicional, con sus reglas deterministas y rígidas, a menudo se queda corto ante la complejidad y la ambigüedad del mundo real. Por ejemplo, un motor de reglas para detectar fraudes funciona como una simple lista de verificación, mientras que un agente de IA actúa como un investigador experimentado, evaluando el contexto y detectando patrones sutiles que las reglas fijas no pueden.

Este artículo explora los componentes clave para construir agentes de IA, los patrones de orquestación y las salvaguardas (guardrails) esenciales para su funcionamiento seguro y predecible.


Antes de…repasamos ciertas diferencias

AI Agents vs. Software de Automatización (n8n, Make)

La principal diferencia entre un AI Agent y un software de automatización como n8n o Make radica en su capacidad de razonamiento autónomo y toma de decisiones en situaciones ambiguas. Mientras que n8n y Make se basan en reglas estrictas y flujos de trabajo predefinidos, un agente de IA utiliza un modelo de lenguaje grande (LLM) para gestionar la ejecución del flujo de trabajo y tomar decisiones de manera independiente, incluso reconociendo cuándo una tarea ha terminado o cuándo debe corregir sus propias acciones.

Conceptos y ejemplos de comparación

La principal diferencia entre un AI Agent y un software de automatización como n8n o Make radica en su capacidad de razonamiento autónomo y toma de decisiones en situaciones ambiguas. Mientras que n8n y Make se basan en reglas estrictas y flujos de trabajo predefinidos, un agente de IA utiliza un modelo de lenguaje grande (LLM) para gestionar la ejecución del flujo de trabajo y tomar decisiones de manera independiente, incluso reconociendo cuándo una tarea ha terminado o cuándo debe corregir sus propias acciones.

Ejemplo concreto: aprobación de un reembolso

  • Con n8n o Make: Se crearía un flujo de trabajo que dice: «Si el monto es menor a $50 y la razón es ‘artículo defectuoso’, aprobar reembolso. Si no, enviar a un gerente para revisión». Este flujo es rígido y no puede manejar una situación donde la razón es «el paquete llegó tarde» o el monto es de $51. La lógica debe ser explícitamente programada para cada posible escenario.
  • Con un AI Agent: Actuaría como un «investigador experimentado». El agente recibiría la solicitud de reembolso y, al interpretar el texto libre del usuario (ej. «Mi pedido no llegó a tiempo para mi evento»), podría evaluar el contexto (historial de compras, política de envíos, etc.) y decidir si procede o si necesita solicitar más información, todo sin una regla preestablecida para cada variación de la excusa del cliente. Esto se debe a su capacidad de tomar decisiones en base a un juicio matizado.

Los tres pilares de un Agente de IA

En su forma fundamental, un agente se compone de tres elementos centrales:

1. El Modelo (LLM)

El LLM es el cerebro del agente, responsable de su razonamiento y toma de decisiones. La elección del modelo es crucial, ya que los diferentes modelos ofrecen distintas fortalezas en cuanto a complejidad, latencia y costo. La mejor práctica es prototipar con el modelo más capaz y luego probar con modelos más pequeños para optimizar el costo y la latencia sin sacrificar el rendimiento.

2. Las Herramientas

Las herramientas extienden las capacidades del agente, permitiéndole interactuar con sistemas externos a través de APIs. Estas herramientas se clasifican en tres tipos:

  • Herramientas de datos: Permiten al agente recuperar información y contexto (ej. bases de datos, documentos PDF).
  • Herramientas de acción: Capacitan al agente para tomar acciones concretas (ej. enviar correos electrónicos, actualizar registros).
  • Herramientas de orquestación: Permiten que los agentes sirvan como herramientas para otros agentes, una característica fundamental en sistemas multi-agente.

3. Las Instrucciones

Las instrucciones son directrices explícitas que definen el comportamiento del agente. Unas instrucciones claras son esenciales para reducir la ambigüedad y mejorar la toma de decisiones. Las mejores prácticas para la configuración de las instrucciones incluyen el uso de documentos existentes como base, la división de tareas en pasos más pequeños, la definición de acciones claras para cada paso y la anticipación de casos excepcionales.

Orquestación: de un solo Agente a Múltiples Agentes

La orquestación es el patrón que permite a un agente ejecutar flujos de trabajo de manera efectiva. Se recomienda un enfoque incremental, comenzando con sistemas de un solo agente y escalando a arquitecturas más complejas solo cuando sea necesario.

Sistemas de un Solo Agente

Un solo agente puede manejar numerosas tareas si se le proporcionan las herramientas y las instrucciones adecuadas. Estos sistemas son más fáciles de mantener y evaluar. Su funcionamiento se basa en un «bucle de ejecución» que permite al agente operar hasta que se cumple una condición de salida, como una llamada a una herramienta o la emisión de una respuesta final.

Sistemas Multi-Agente

Cuando un solo agente no puede manejar la complejidad de un flujo de trabajo, se pueden distribuir las tareas entre múltiples agentes coordinados. Esto es útil cuando las instrucciones se vuelven demasiado complejas o las herramientas se solapan. Existen dos patrones principales:

  • Patrón del gerente (manager): Un agente central («el gerente») delega tareas a agentes especializados a través de llamadas a herramientas, manteniendo el control y sintetizando los resultados.
  • Patrón descentralizado: Múltiples agentes operan como pares, transfiriéndose el control del flujo de trabajo entre sí. Este patrón es ideal para la «clasificación de conversaciones» o cuando un agente especializado necesita tomar el control total e interactuar directamente con el usuario.

Guardrails: La clave para un despliegue seguro

Los «guardrails» son una capa de defensa esencial para garantizar que los agentes se comporten de manera segura y predecible. Funcionan como un mecanismo de defensa en capas, donde múltiples salvaguardas especializadas se combinan para crear agentes más resilientes.

Los tipos de guardrails incluyen:

  • Clasificador de relevancia: Mantiene al agente enfocado en el tema, marcando consultas irrelevantes.
  • Clasificador de seguridad: Detecta intentos de «jailbreak» o inyecciones de prompt.
  • Filtro de PII: Evita la exposición de información personal identificable.
  • Moderación: Marca entradas dañinas o inapropiadas.
  • Salvaguardas de herramientas: Asignan un nivel de riesgo a cada herramienta para activar acciones de seguridad antes de su ejecución.
  • Protecciones basadas en reglas: Medidas deterministas simples, como listas de bloqueo o filtros de regex.

Conclusión: construyendo valor de forma iterativa

Los agentes representan una nueva era en la automatización de flujos de trabajo, capaces de razonar ante la ambigüedad y manejar tareas complejas de principio a fin. El camino hacia un despliegue exitoso no es un «todo o nada». Comience con bases sólidas: modelos competentes, herramientas bien definidas e instrucciones claras. Escalone la complejidad de la orquestación a medida que avanza y, lo más importante, implemente guardrails en cada etapa para asegurar un funcionamiento seguro.

Con un enfoque iterativo, los agentes pueden generar un valor empresarial significativo, automatizando no solo tareas, sino flujos de trabajo enteros con inteligencia y adaptabilidad.


¿Seguiste mi charla relacionada con AI Agents?

Parte de mi charla dada en la 9na edición de Testing en Chile, pasó por este tema


Fuente de consulta / inspiración: Guide to Build AI Agents

Gus Terrera

Apasionado por el agile testing y la ia.