Llevando Agentic Retrieval Augmented Generation a Amazon Q Business
Sources: https://aws.amazon.com/blogs/machine-learning/bringing-agentic-retrieval-augmented-generation-to-amazon-q-business, aws.amazon.com
TL;DR
- Agentic Retrieval Augmented Generation (RAG) trae recuperación guiada por agentes a Amazon Q Business, permitiendo consultas complejas y en múltiples pasos con contexto claro.
- El sistema ofrece visibilidad en tiempo real de la descomposición de la consulta, rutas de recuperación de datos y generación de respuestas, aumentando la transparencia.
- Añade herramientas de exploración de datos como búsqueda tabular y recuperación de contexto largo para mejorar el acceso a datos entre documentos y tablas.
- El diálogo de múltiples turnos y la memoria permiten seguimientos más naturales, mientras que las preguntas de aclaración desambiguarán las consultas.
- Activar Agentic RAG en la interfaz de Amazon Q Business es sencillo mediante el interruptor de Búsqueda Avanzada para respuestas más ricas.
Contexto y antecedentes
Amazon Q Business es un asistente empresarial basado en IA generativa diseñado para ayudar a las organizaciones a extraer valor de datos almacenados en fuentes empresariales. Al conectarse con estas fuentes, los empleados pueden responder preguntas, generar contenido y automatizar tareas, respetando permisos existentes y proporcionando citas claras. En el núcleo de sistemas como Amazon Q Business se encuentra Retrieval Augmented Generation (RAG), que fundamenta las respuestas de los modelos de IA en los datos de la organización. El RAG tradicional suele recuperar documentos o pasajes con base en la consulta del usuario y luego usar ese material como contexto para el modelo de lenguaje (LLM). Si bien funciona para preguntas factuales básicas, los casos empresariales a menudo requieren sintetizar información de varias fuentes, entender el contexto específico de la empresa y, a menudo, múltiples pasos de recuperación para entregar respuestas completas y precisas. Cuando las consultas son más complejas—como comparar políticas de vacaciones, analizar implicaciones de políticas entre departamentos o evaluar resultados históricos de proyectos—, una única recuperación puede resultar insuficiente y la experiencia puede volverse opaca durante el procesamiento. Estos desafíos motivan la adopción de estrategias de recuperación basadas en agentes que planifican, ejecutan y refinan el acceso a datos de forma auditable y transparente.
Qué hay de nuevo
Agentic RAG representa una evolución importante al introducir agentes de IA que planifican y ejecutan estrategias de recuperación sofisticadas con un conjunto de herramientas de navegación de datos. Esto permite respuestas más precisas y completas, manteniendo la agilidad que esperan los usuarios.
- Descomposición de consultas: el agente descompone inteligentemente preguntas complejas en componentes manejables. Por ejemplo, una solicitud como “Por favor, compara las políticas de vacaciones de Washington y California” se descompone en consultas separadas para Washington y California.
- Procesamiento transparente: se muestra visibilidad en tiempo real de las etapas de descomposición, rutas de recuperación y flujo de generación de respuestas, durante el procesamiento, y luego se resumen al entregar la respuesta.
- Herramientas de recuperación basadas en el agente: el sistema puede desplegar herramientas como búsqueda tabular (para recuperar datos de tablas incrustadas en documentos o archivos CSV/XLSX) y recuperación de contexto largo (solicitar el documento completo cuando sea necesario).
- Capacidades multi-turno y memoria: el agente mantiene el contexto de la conversación a lo largo de los turnos, permitiendo preguntas de seguimiento naturales y aclaraciones cuando haya ambigüedad.
- Optimización dinámica de respuestas: los agentes evaluan continuamente la calidad de la respuesta y replanifican para mejorar la exhaustividad.
- Activación sencilla: en la interfaz web de Amazon Q Business, active la opción de Búsqueda Avanzada para obtener respuestas más ricas y completas.
Cómo maneja las consultas complejas Agentic RAG
RAG tradicional lucha con preguntas multifacéticas que requieren sintetizar información de múltiples fuentes. Agentic RAG adopta un enfoque de planificación que explora fuentes de datos y recopila información completa. Por ejemplo, ante una solicitud para comparar políticas, el agente maneja Washington y California en paralelo, recopilando datos precisos para alimentar una respuesta holística. Este enfoque mejora la coherencia, la exhaustividad y la exactitud, manteniendo al usuario informado sobre el progreso.
Herramientas y capacidades de exploración de datos
Amazon Q Business incluye herramientas de navegación para optimizar la recuperación de datos:
- Búsqueda tabular: recuperación inteligente de datos en tablas incrustadas en documentos (DOCX, PPTX, PDF) o almacenadas en CSV/XLSX, con opciones para generación de código o linealización tabular.
- Recuperación de contexto largo: determina cuándo se necesita el contexto completo de un documento (por ejemplo, “Resumir el 10K de la Compañía X”) y recupera el documento completo. Este enfoque de selección de herramientas permite al agente estructurar el plan de recuperación manteniendo el contexto a lo largo de múltiples intercambios.
Del Q a decisiones confiables
El enfoque Agentic RAG atiende preguntas con matices, como análisis regional, implicaciones de políticas y tendencias históricas, descomponiendo las consultas, proporcionando transparencia y sintetizando la información recuperada en una respuesta completa. El resultado es una respuesta más precisa y completa que respeta permisos empresariales y ofrece citas claras.
Por qué esto importa (impacto para desarrolladores/empresas)
- Mayor precisión para preguntas complejas de empresa: la descomposición de consultas y las herramientas de recuperación especializadas permiten respuestas contextuales.
- Mayor transparencia y confianza: visibilidad en tiempo real del procesamiento ayuda a entender cómo se llega a las conclusiones.
- Mejor colaboración entre fuentes de datos: la memoria entre turnos y las aclaraciones reducen malentendidos y permiten un refinamiento preciso.
- Insights más rápidos y ricos para grandes organizaciones: combinar análisis regional, implicaciones de políticas y tendencias históricas facilita la toma de decisiones.
- Activación fácil en la interfaz: el interruptor de Búsqueda Avanzada facilita la adopción de capacidades de recuperación avanzadas.
Detalles técnicos o Implementación
- Arquitectura del agente: los agentes de IA planifican y razonan sobre el uso de herramientas de recuperación y generación, replanteando según el contexto y el historial de la conversación.
- Memoria y gestión de contexto: se mantiene una memoria de conversación de corto plazo para preservar el contexto entre turnos, permitiendo seguimientos naturales sin repetir información.
- Estrategia de desambiguación: cuando existen varias interpretaciones, el sistema formula preguntas de clarificación para alinear la intención y mejorar la relevancia.
- Planificación y ejecución de recuperación: el agente evalúa múltiples estrategias de recuperación en paralelo y elige la herramienta más eficaz.
- Despliegue y uso: active Agentic RAG a través del interruptor de Búsqueda Avanzada en la interfaz web de Amazon Q Business para obtener respuestas más ricas y completas.
Flujo de trabajo de ejemplo
- El usuario plantea una pregunta compleja y multifacética.
- El agente descompone la consulta en tareas de recuperación distintas para cada elemento.
- El agente selecciona las herramientas adecuadas (búsqueda tabular, contexto largo) para recopilar datos precisos.
- El LLM sintetiza la información recuperada en una respuesta coherente.
- El agente presenta el resultado con una visión transparente de la descomposición y las fuentes de datos, y las etapas se recapitulan al entregar la respuesta final.
Conclusiones clave
- Agentic RAG habilita consultas empresariales sofisticadas con múltiples etapas y visibilidad de procesamiento en tiempo real.
- Se fundamenta en descomposición, memoria, preguntas de aclaración y planificación dinámica para entregar insights completos y precisos.
- Herramientas como búsqueda tabular y recuperación de contexto largo amplían el alcance de recuperación más allá de simples extractos.
- Las etapas transparentes y la interfaz facilitan la adopción de estrategias de recuperación avanzadas.
- El enfoque está diseñado para manejar análisis interregionales, implicaciones de políticas y tendencias históricas con contexto empresarial.
Preguntas frecuentes (FAQ)
- Q: ¿Qué es Agentic RAG en Amazon Q Business? A: Es un enfoque basado en agentes que planifica, ejecuta y refina el acceso a datos para consultas empresariales complejas, proporcionando visibilidad en tiempo real de la descomposición, rutas de recuperación y generación de respuestas.
- Q: ¿Cómo funciona la descomposición de consultas para comparar políticas regionales? A: El agente descompone la pregunta en subconsultas discretas para cada región y las procesa en paralelo para obtener un contexto completo.
- Q: ¿Cómo se proporciona la transparencia durante el procesamiento? A: El sistema muestra en tiempo real las etapas de descomposición, rutas de recuperación y flujo de generación de respuestas, y resume las etapas al entregar la respuesta.
- Q: ¿Cómo ayuda la memoria entre turnos las interacciones? A: La memoria de conversación de corto plazo mantiene el contexto entre turnos, permitiendo seguimientos naturales y aclaraciones enfocadas cuando es necesario.
- Q: ¿Cómo activo Agentic RAG en la interfaz? A: En la interfaz web de Amazon Q Business, active el interruptor Búsqueda Avanzada para acceder a respuestas más ricas y completas.
Referencias
More news
Llevar agentes de IA de concepto a producción con Amazon Bedrock AgentCore
Análisis detallado de cómo Amazon Bedrock AgentCore facilita la transición de aplicaciones de IA basadas en agentes desde un concepto de prueba hasta sistemas de producción empresariales, conservando memoria, seguridad, observabilidad y gestión escalable de herramientas.
Monitorear la inferencia por lotes de Bedrock de AWS con métricas de CloudWatch
Descubra cómo monitorear y optimizar trabajos de inferencia por lotes de Bedrock con métricas, alarmas y paneles de CloudWatch para mejorar rendimiento, costos y operación.
Solicitando precisión con Stability AI Image Services en Amazon Bedrock
Bedrock incorpora Stability AI Image Services con nueve herramientas para crear y editar imágenes con mayor precisión. Descubre técnicas de prompting para uso empresarial.
Escala la producción visual con Stability AI Image Services en Amazon Bedrock
Stability AI Image Services ya está disponible en Amazon Bedrock, ofreciendo capacidades de edición de imágenes listas para usar a través de la API de Bedrock y ampliando los modelos Stable Diffusion 3.5 y Stable Image Core/Ultra ya presentes.
Usar AWS Deep Learning Containers con Amazon SageMaker AI MLflow gestionado
Vea cómo los AWS Deep Learning Containers (DLCs) se integran con SageMaker AI gestionado por MLflow para equilibrar el control de la infraestructura y una gobernanza de ML sólida. Un flujo de TensorFlow para predicción de edad de abalones ilustra el seguimiento de extremo a extremo y la trazabilidad
Construir Flujos de Trabajo Agenticos con GPT OSS de OpenAI en SageMaker AI y Bedrock AgentCore
Visión general de extremo a extremo para implementar modelos GPT OSS de OpenAI en SageMaker AI y Bedrock AgentCore, impulsando un analizador de acciones multiagente con LangGraph, con cuantización MXFP4 de 4 bits y orquestación serverless.