Agentic Retrieval Augmented Generation arrive dans Amazon Q Business pour les données d'entreprise
Sources: https://aws.amazon.com/blogs/machine-learning/bringing-agentic-retrieval-augmented-generation-to-amazon-q-business, aws.amazon.com
TL;DR
- Agentic RAG permet des stratégies de récupération basées sur des agents dans Amazon Q Business pour gérer des requêtes d’entreprise complexes.
- Il offre une décomposition des requêtes, une visibilité en temps réel du traitement et une mémoire multi-tours dans les conversations.
- Il prend en charge des outils de navigation des données tels que la recherche tabulaire et la récupération de contexte long pour des réponses plus complètes.
- Il améliore la transparence, le clarificateur et la qualité des réponses tout en préservant les autorisations de données.
- Activez via le bouton Avancé de Recherche dans l’interface web d’Amazon Q Business.
Contexte et contexte historique
Amazon Q Business est un assistant d’entreprise alimenté par l’IA générative qui aide les organisations à exploiter la valeur de leurs données. En se connectant à des sources de données d’entreprise, les employés peuvent l’utiliser pour trouver rapidement des réponses, générer du contenu et automatiser des tâches, tout en respectant les permissions et en fournissant des citations claires. Au cœur des systèmes comme Amazon Q Business se trouve la RAG, qui fonde les réponses de l’IA sur les données de l’organisation. Les implémentations RAG traditionnelles suivent une approche simple: récupérer des documents pertinents en fonction d’une requête et générer une réponse en utilisant ces documents comme contexte pour le LLM. Bien que cette méthodologie convienne pour des questions factuelles de base, les environnements d’entreprise présentent des défis complexes qui révèlent les limites de cette approche unique. Considérons une question sur les différences entre deux packages d’avantages ou une comparaison des résultats de projets sur plusieurs trimestres. Ces requêtes nécessitent de synthétiser des informations provenant de sources multiples, de comprendre le contexte spécifique de l’entreprise et nécessitent souvent plusieurs étapes de récupération pour recueillir des informations complètes sur chaque aspect. Les systèmes RAG traditionnels peinent avec une telle complexité, fournissant des réponses incomplètes ou ne s’adaptant pas lorsque les résultats initiaux ne suffisent pas. Apporter de l’agence à Amazon Q Business est un nouveau paradigme pour gérer des requêtes d’entreprise sophistiquées via des stratégies de récupération basées sur des agents. En introduisant des agents d’IA qui planifient et exécutent des stratégies de récupération sophistiquées avec une suite d’outils de navigation de données, Agentic RAG représente une évolution importante dans la manière dont les assistants IA interagissent avec les données d’entreprise, offrant des réponses plus précises et complètes tout en conservant la rapidité attendue par les utilisateurs. Avec Agentic RAG dans Amazon Q Business, vous disposez de plusieurs nouvelles capacités, dont la décomposition des requêtes et des événements transparents, l’utilisation d’outils de récupération basés sur des agents, des capacités de conversation améliorées et l’optimisation des réponses par agents. Pour illustrer comment ces capacités répondent aux besoins des entreprises, on peut envisager des scénarios tels que des comparaisons de performance entre régions ou des implications de politiques entre départements. L’approche se distingue par sa capacité à diviser des requêtes complexes en tâches de recherche gérées et à maintenir le contexte de la conversation.
Quoi de neuf
Agentic RAG introduit un ensemble de capacités destinées à traiter des questions d’entreprise complexes:
- Décomposition des requêtes: des agents d’IA décomposent intelligemment les questions en composants discrets et gérables. Par exemple, Please compare the vacation policies of Washington and California? est décomposé en washington state vacation policies et california state vacation policies.
- Visibilité en temps réel: le système affiche les requêtes décomposées et les étapes de récupération pertinentes à l’écran pendant que les données sont récupérées, puis ces étapes sont réduites lors de la diffusion de la réponse.
- Utilisation d’outils de récupération basés sur des agents: les agents de RAG peuvent déployer des outils d’exploration et des méthodes de récupération en séquences optimales tout en maintenant le contexte sur plusieurs tours.
- Améliorations des capacités conversationnelles: la mémoire à court terme permet de maintenir le contexte au fil des échanges, facilitant les suivis sans répéter les informations précédentes.
- Optimisation des réponses par agent: les agents évaluent continuellement la qualité des réponses et réévaluent les actions pour améliorer l’exhaustivité lorsque la récupération initiale est insuffisante.
- Clarification en cas d’ambiguïté: lorsque plusieurs interprétations possibles existent, le système pose des questions de clarification pour affiner l’intention.
- Activation facile: dans l’interface web, activez Advanced Search pour activer Agentic RAG et obtenir des réponses plus riches et complètes.
- Cas d’usage: les scénarios transrégionaux ou les analyses d’implications politiques entre départements illustrent les avantages.
Pourquoi cela compte (impact pour les développeurs/entreprises)
L’approche Agentic RAG est pertinente car elle répond aux principaux défis des interactions avec les données d’entreprise:
- Amélioration de la précision et de l’exhaustivité pour les questions complexes grâce à la décomposition des requêtes et à des récupérations multi-sources coordonnées.
- Transparence et confiance accrues grâce à une visibilité en temps réel des étapes de traitement et des chemins de récupération.
- Respect des autorisations et fourniture de citations pour garantir que les réponses restent fondées sur le cadre de gouvernance des données de l’organisation.
- Prise de décision plus rapide grâce à des dialogues contextuels multi-turns capables de traiter des questions nuancées comme l’interprétation de politiques ou les implications inter-départements.
- Support de flux analytiques plus riches, comme les comparaisons entre régions ou l’analyse de tendances historiques, tout en préservant le contexte de la conversation.
Détails techniques ou Implémentation
Agentic RAG s’appuie sur un ensemble d’outils de navigation des données disponibles dans Amazon Q Business:
- Recherche tabulaire: permet une récupération intelligente de données via génération de code ou linéarisation tabulaire sur des tableaux petits et grands présents dans des documents (DOCX, PPTX, PDF) ou stockés en CSV ou XLSX.
- Récupération de contexte long: détermine quand le contexte complet d’un document est nécessaire et récupère le contexte complet du document pour que le LLM puisse générer.
- Sélection et déploiement des outils: les agents RAG déploient intelligemment divers outils d’exploration des données et méthodes de récupération dans des séquences optimales tout en maintenant le contexte sur plusieurs tours.
- Mémoire multi-tour: l’agent conserve le contexte de conversation entre les échanges, permettant des suivis naturels sans récapituler l’historique.
- Déambiguation: lorsque plusieurs interprétations existent, l’agent pose des questions de clarification pour vérifier l’intention.
- Activation opérationnelle: pour commencer, activez Agentic RAG via l’option Avancé de Recherche dans l’interface web du Amazon Q Business.
Tableau: Outils de récupération clés utilisés par Agentic RAG
| Outil | But |
|---|---|
| Recherche tabulaire | Récupération intelligente des données via génération de code ou linéarisation tabulaire dans des tableaux intégrés dans des documents ou stockés en CSV/XLSX |
| Récupération de contexte long | Récupérer le contexte complet du document nécessaire pour une requête (par exemple Résumer le 10K de la société X) |
| Ces capacités permettent au système de planifier les étapes de récupération tout en conservant le contexte entre les tours et de synthétiser des informations issues de sources multiples en des réponses cohérentes et correctement citées. |
Points clés
- Agentic RAG introduit un paradigme de planification et récupération pour les données d’entreprise dans Amazon Q Business.
- La visibilité en temps réel et la mémoire entre les tours améliorent la confiance et la qualité des réponses.
- La sélection intelligente des outils et la récupération multi-étapes permettent des réponses plus précises et nuancées.
- Les questions de clarification aident à résoudre l’ambiguïté et à adapter les résultats à l’intention.
- L’activation est simple via Avancé de Recherche dans l’interface Q Business.
FAQ
-
Qu’est-ce que Agentic RAG dans Amazon Q Business?
C’est une approche de récupération basée sur des agents qui décompose les requêtes complexes, planifie les étapes de récupération et utilise un ensemble d’outils de navigation des données pour ancrer les réponses dans les données d’entreprise, avec une visibilité du traitement en temps réel.
-
Comment gère-t-il les requêtes complexes multi-source?
Le système décompose la requête en parties distinctes, exécute des étapes de récupération parallèles entre sources et synthétise les résultats avec le LLM pour produire des réponses précises et complètes, en affichant le progrès et en posant des questions de clarification si nécessaire.
-
Comment activer Agentic RAG en pratique?
Dans l’interface web d’Amazon Q Business, activez Avancé de Recherche pour activer Agentic RAG et bénéficier de réponses plus riches.
-
u’en est-il de la mémoire et du contexte entre les tours?
L’agent conserve une mémoire à court terme pour maintenir le contexte entre les échanges, permettant des questions de suivi naturelles sans récapituler l’historique.
Références
More news
Faire passer vos agents IA du concept à la production avec Amazon Bedrock AgentCore
Une exploration détaillée de la façon dont Amazon Bedrock AgentCore aide à faire passer des applications IA basées sur des agents du proof of concept à des systèmes de production de niveau entreprise, en préservant mémoire, sécurité, observabilité et gestion d’outils à l’échelle.
Surveiller l’inférence par lot Bedrock d’AWS via les métriques CloudWatch
Apprenez à surveiller et optimiser les jobs d’inférence par lot Bedrock via CloudWatch, with alertes et tableaux de bord pour améliorer les performances, les coûts et l’exploitation.
Prompting pour la précision avec Stability AI Image Services sur Amazon Bedrock
Bedrock intègre Stability AI Image Services avec neuf outils pour créer et modifier des images avec précision. Apprenez les techniques de prompting adaptées à l’entreprise.
Utiliser les AWS Deep Learning Containers avec SageMaker AI géré MLflow
Découvrez comment les AWS Deep Learning Containers (DLCs) s’intègrent à SageMaker AI géré par MLflow pour équilibrer le contrôle de l’infrastructure et une gouvernance ML robuste. Un flux TensorFlow pour la prédiction de l’âge des abalones illustre le suivi de bout en bout et la traçabilité des modè
Évoluer la production visuelle avec Stability AI Image Services dans Amazon Bedrock
Stability AI Image Services est désormais disponible dans Amazon Bedrock, offrant des capacités d’édition d’images prêtes à l’emploi via l’API Bedrock et étendant les modèles Stable Diffusion 3.5 et Stable Image Core/Ultra déjà présents.
Créer des flux de travail agentiques avec GPT OSS d’OpenAI sur SageMaker AI et Bedrock AgentCore
Vue d’ensemble complète sur le déploiement des modèles GPT OSS d’OpenAI sur SageMaker AI et Bedrock AgentCore pour alimenter un analyseur d’actions multi-agents avec LangGraph, incluant la quantification MXFP4 en 4 bits et une orchestration sans serveur.