Herramientas Agénticas
El conjunto completo de capacidades que los agentes pueden invocar durante el flujo de trabajo para completar una tarea de principio a fin sin intervención humana.
¿Qué son las herramientas agénticas?
Las herramientas agénticas son las acciones que un agente puede llevar a cabo durante o más allá de una conversación: buscar información, leer un documento, navegar por una página, escribir en un sistema o incluso enviar un mensaje. En lugar de ceder el control a una persona cuando una tarea requiere algo más que conversación, los agentes invocan herramientas directamente dentro del flujo de trabajo en el momento exacto en que se necesitan.

Todos los canales por los que se comunican los agentes
Todos los canales por los que se comunican los agentes
Mensajería saliente en múltiples canales
Los agentes no están limitados a responder en el canal donde comenzó una conversación. Durante el flujo de trabajo, un agente puede enviar una confirmación por SMS, lanzar un resumen por correo electrónico o publicar un mensaje en Slack o Teams, sin interrumpir el flujo de la conversación.
Gestión de mensajes entrantes
Los agentes pueden recibir y procesar mensajes entrantes en distintos canales como parte de un flujo de trabajo —un SMS, un correo electrónico, el envío de un formulario y más— y continuar la ejecución en función de lo que llegue. Esto permite interacciones multiturn y multicanal que abarcan varias sesiones.
Gestión de archivos
Los agentes pueden recibir y procesar archivos adjuntos de cualquier tipo —documentos, imágenes, audio y vídeo— enviados por un usuario o procedentes de un sistema externo, y actuar sobre su contenido dentro del flujo de trabajo.

Para cuando la tarea exige algo más que conversación
Reconocimiento óptico de caracteres (OCR)
Los agentes invocan OCR durante el flujo de trabajo para leer contenido impreso o manuscrito de imágenes, PDFs y documentos escaneados. El texto extraído se analiza y convierte en campos estructurados que se incorporan directamente al razonamiento del agente o se escriben en un sistema posterior, para facturas, conocimientos de embarque, documentos de identidad, formularios y cualquier documento que llegue como imagen.
Agentes de navegador
No todos los sistemas de los que depende una operación empresarial disponen de API. Los agentes de navegador permiten que un flujo de trabajo navegue por una interfaz web, localice información, rellene campos y extraiga datos de la misma forma que lo haría un operador humano, de modo que herramientas heredadas, portales de proveedores y páginas web de transportistas pueden integrarse en flujos de trabajo automatizados sin necesidad de una integración personalizada.
RAG y recuperación de conocimiento
Los agentes recuperan contenido de bases de conocimiento en el punto de la conversación donde se necesita, haciendo coincidir el contexto con el contenido más relevante disponible. Las bases de conocimiento admiten SOPs, documentación, políticas, contratos y materiales de formación, indexados para que los agentes recuperen con precisión en lugar de de forma general, y se actualicen sin necesidad de redesplegar el agente.
Comprensión de imágenes y documentos
Los agentes pueden analizar el contenido de imágenes y documentos —no solo extraer texto, sino interpretar lo que contienen— en cualquier canal. Una fotografía de un envío dañado enviada por WhatsApp, un certificado escaneado enviado por correo electrónico, una imagen de producto subida mediante chat: los agentes razonan sobre el contenido visual dondequiera que llegue y actúan sobre él como parte de una decisión en el flujo de trabajo.
Transformación de datos y cálculo
Los agentes pueden analizar respuestas de API, transformar estructuras de datos, aplicar reglas de negocio y calcular valores durante el flujo de trabajo mediante bloques de código con control programático completo en cualquier punto de la ejecución, sin salir del flujo de trabajo.
Delegación a agentes externos mediante MCP
Cuando un flujo de trabajo requiere una capacidad que reside en otro agente —como una inversión empresarial existente, un modelo especializado o un sistema de terceros— el agente puede delegar en él mediante MCP, transferir el contexto, esperar una respuesta y continuar sin interrupciones. La infraestructura de agentes existente se conecta directamente a la orquestación sin necesidad de reconstruirse.
Las herramientas agénticas son las que permiten a los agentes completar tareas en lugar de limitarse a mantener conversaciones. Haz clic a continuación para obtener más información sobre cómo se crean y despliegan los agentes de HappyRobot.