Skip to content
Créez un flux de travail agentique de planification de voyage avec Amazon Nova
Source: aws.amazon.com

Créez un flux de travail agentique de planification de voyage avec Amazon Nova

Sources: https://aws.amazon.com/blogs/machine-learning/create-a-travel-planning-agentic-workflow-with-amazon-nova, aws.amazon.com

TL;DR

  • Construisez un assistant de planification de voyage à l’aide d’agents IA avec Amazon Nova et LangGraph pour gérer des tâches complexes en plusieurs étapes.
  • Utilisez Nova Lite pour le routage et les nœuds d’action simples; cinq nœuds complexes fonctionnent sur Nova Pro pour un suivi avancé et des opérations en plusieurs étapes.
  • Déployez une architecture serverless en trois couches (interface, traitement central, intégration) sur AWS Lambda avec des conteneurs Docker, et orchestrer avec LangGraph.
  • Déployez via AWS CDK ; intégrez Secrets Manager et Cognito ; stockez les données de session dans DynamoDB et maintenez l’état de la conversation avec AgentState.
  • La solution peut être étendue avec des API et sources de données supplémentaires, autorisant des recommandations personnalisées et une intégration en temps réel.

Contexte et origine

La planification de voyage implique la réservation d’hébergements, la sélection d’activités et l’organisation des transports locaux — un processus dynamique et en plusieurs étapes qui peut être accablant pour les utilisateurs. Les progrès de l’IA générative ont permis des flux agentiques où les grands modèles de langage (LLM) peuvent accéder à des outils externes et à des données afin d’accomplir des tâches via des conversations naturelles. Cet article AWS décrit la construction d’une solution de planification de voyage qui exploite Amazon Nova, une nouvelle génération de modèles de base disponibles sur Amazon Bedrock, reconnue pour son équilibre coût-performance. En associant Nova à LangGraph pour l’orchestration, les auteurs démontrent un assistant de voyage pratique capable d’accéder à des données en temps réel et de coordonner des tâches complexes. L’approche est mise en œuvre dans une architecture serverless avec Lambda, en insistant sur un design en trois couches : interaction avec le frontend, traitement central et services d’intégration. Le nœud routeur analyse les requêtes des utilisateurs et, avec la connaissance des descriptions des 14 nœuds d’action, décide quelles actions doivent être exécutées, tandis que les nœuds d’action, alimentés par Nova Pro ou Nova Lite, gèrent la recherche web, les recommandations personnalisées, les vérifications météo, les recherches de produits et la gestion du panier. La couche d’intégration unifie les sources de données et les services via une interface ; le système conserve l’état de la conversation grâce à AgentState, un dictionnaire Python qui assure l’accès fiable au contexte et aux résultats entre les nœuds. Cette architecture permet une mise à l’échelle horizontale et une extensibilité pour de nouvelles capacités, et le déploiement est codifié avec AWS Cloud Development Kit (CDK), qui produit un template CloudFormation. Pour plus de détails, voir l’article AWS : Créez un flux de planification de voyage avec Amazon Nova. L’article précise que Nova et LangGraph s’associent pour gérer un flux agentique. Le nœud routeur analyse chaque requête avec un LLM et détermine quels nœuds d’action activer. Cinq nœuds complexes dépendent de Nova Pro pour des tâches nécessitant une exécution multi-étapes, tandis que le routeur et les nœuds simples utilisent Nova Lite pour équilibrer coût et latence. Les deux modèles prennent en compte une fenêtre contextuelle de 300 000 tokens, peuvent traiter des entrées texte, image et vidéo, et prennent en charge le texte en plus de 200 langues, afin d’adresser un public mondial. La couche d’intégration unifie des sources de données et des services, permettant à des organisations d’intégrer rapidement leurs propres API et sources selon les besoins. Le déploiement est effectué via CDK et génère des ressources telles que fonctions Lambda, tables DynamoDB et configurations API. Après déploiement, le stack CloudFormation exporte un endpoint API pour le frontend et un utilisateur Cognito est créé pour l’accès. Les auteurs présentent aussi une démonstration de personnalisation via des profils utilisateur stockés dans DynamoDB et des liens de produits en direct vers Amazon.com, que les utilisateurs peuvent explorer ou ajouter au panier. Nova Lite offre des performances raisonnables pour l’orchestration, tandis que Nova Pro gère des tâches de complexité accrue. L’article évoque aussi des directions futures comme ReAct et invite à consulter le dépôt GitHub pour des échantillons de code et des guides.

Ce qu’il y a de nouveau

Cet article propose un flux de travail complet de planification de voyage combinant Amazon Nova et LangGraph pour prendre en charge des interactions agentiques. Points clés :

  • Architecture serverless en trois couches (frontend, traitement central, intégration) sur AWS Lambda avec des conteneurs Docker.
  • Orchestration pilotée par LangGraph avec un nœud routeur et 14 nœuds d’action couvrant la recherche d’hébergement, les vérifications météo, la découverte de produits et la gestion du panier.
  • Stratégie de modèle en deux volets : Nova Lite pour le routage et les nœuds simples ; Nova Pro pour cinq nœuds complexes, avec des opérations avancées.
  • Couche d’intégration unifiée pour connecter plusieurs sources de données et services.
  • Gestion d’état de conversation via AgentState pour maintenir le contexte à travers les nœuds.
  • Déploiement via AWS CDK qui expose un endpoint API pour le frontend et nécessite Secrets Manager pour les clés API et Cognito pour l’authentification.
  • Démonstration avec un persona voyageur d’affaires, axée sur les métriques de routage, d’appel de fonction, de qualité des réponses et de latence.
  • Personnalisation à travers des profils DynamoDB et liens de produits en direct, permettant exploration ou ajout au panier.
  • Conseils pratiques pour étendre l’architecture à d’autres domaines et données externes, en s’appuyant sur la documentation Bedrock Agents et le dépôt GitHub pour des exemples.

Pourquoi c’est important (impact pour les développeurs/entreprises)

  • Rapport coût-performance : Nova Lite offre un routage rapide et une génération de contenu basique à faible coût, tandis que Nova Pro gère les tâches complexes d’instructions multi-étapes, permettant des déploiements de production équilibrés.
  • Données en temps réel et intégration : l’architecture est conçue pour accéder à des données en temps réel et pour s’intégrer à des API externes et systèmes de réservation, ce qui permet des recommandations à jour et des liens de produits vivants.
  • Personnalisation à grande échelle : stocker des profils d’utilisateurs dans DynamoDB permet de délivrer des itinéraires et des recommandations personnalisés au sein d’un cadre serverless évolutif, avec potentiel d’intégration aux bases de données clients existantes.
  • Extensibilité et réutilisation : la conception en graphe favorise l’évolutivité et l’ajout de nouvelles capacités via des nœuds d’action et des intégrations API.
  • Pratique de déploiement : l’utilisation de CDK facilite la provision des ressources et assure sécurité et gouvernance via Secrets Manager et Cognito.
  • Valeur pédagogique : l’article fournit un modèle concret pour construire des flux agentiques avec des LLMs et des cadres d’orchestration modernes, avec métriques et étapes de déploiement.

Détails techniques ou Implementation

Vue d’ensemble de l’architecture

  • Architecture serverless avec Lambda et Docker, en trois couches : frontend, traitement central et intégration.
  • LangGraph assure une orchestration avec état pour gérer un graphe de composants (nœuds) exécutant des tâches de planification.
  • Le nœud routeur analyse les requêtes via un LLM et détermine quels nœuds d’action activer, en s’appuyant sur les descriptions des 14 nœuds d’action.
  • La couche d’intégration unifie les sources de données et les services, offrant une connectivité flexible.
  • L’état de la conversation est conservé via AgentState (TypedDict), enregistrant l’historique, les profils et les résultats.
  • Les modèles offrent une fenêtre contextuelle de 300 000 tokens, acceptent entrée texte/image/vidéo et prennent en charge le texte dans plus de 200 langues.

Rôles des nœuds et allocation des modèles

  • Nova Lite alimente le routeur et les nœuds d’action simples, offrant un traitement rapide et une génération de contenu efficace.
  • Cinq nœuds complexes utilisent Nova Pro en raison de la nécessité de suivre des instructions avancées et des opérations multi-etapes.
  • L’architecture est conçue pour évoluer horizontalement et ajouter de nouveaux nœuds et intégrations selon les besoins.

Flux de données et gestion d’état

  • Les interactions utilisateur passent du frontend au routeur puis vers des nœuds d’action spécialisés qui récupèrent des données et calculent des recommandations tout en mettant à jour l’état partagé via AgentState.
  • La couche d’intégration connecte diverses sources et services; les profils et données de voyage sont stockés dans DynamoDB pour personnalisation.

Déploiement et prérequis

  • Le déploiement se fait via AWS CDK, produisant un template CloudFormation pour provisionner les fonctions Lambda, les tables DynamoDB et les configurations API.
  • Prérequis : cloner le dépôt GitHub, obtenir les clés API des services requis et les stocker dans Secrets Manager. Un fichier .env doit être créé à la racine.
  • Si c’est la première utilisation de CDK dans ce compte-région, effectuer le bootstrap de l’environnement avant le déploiement. Un script déploie la solution et affiche l’URL de l’endpoint API pour le frontend.
  • Après déploiement, le stack CloudFormation est accessible dans la console AWS et les Outputs fournissent les valeurs essentielles. Le flux montre aussi la création d’un utilisateur Cognito pour accéder au WebAppDomain.
  • Les auteurs soulignent que les détails d’implémentation (code des fonctions Lambda et patterns d’intégration) sont disponibles dans le répertoire GitHub.

Composants-clés et comparaison rapide des modèles

| Type de modèle | Usage principal | Fenêtre de contexte | Entrées | Remarques |---|---|---|---|---| | Nova Lite | Routeur et nœuds simples | 300 000 tokens | Texte, image, vidéo; 200+ langues | Traitement rapide, coût réduit pour le routage et la génération basique |Nova Pro | Fonctions complexes et planification multi-étapes | 300 000 tokens | Texte, image, vidéo; 200+ langues | Suivi avancé des instructions pour la planification |

Comment tester et étendre

  • Les auteurs illustrent avec une persona voyageur d’affaires et un flux de conversation typique pour évaluer la précision du routage, les appels de fonction, la qualité des réponses et la latence.
  • La personnalisation est démontrée via des profils dans DynamoDB ; en production, ces profils peuvent être reliés à des bases de données clients et systèmes de réservation.
  • Les recommandations de produits sont des liens en direct vers des items sur Amazon.com, permettant d’explorer ou d’ajouter au panier directement.
  • La solution peut être étendue en ajoutant de nouveaux nœuds d’action et des intégrations API pour couvrir davantage de sources de données.
  • Le dépôt GitHub fournit des échantillons de code et des guides de mise en œuvre, et la documentation Bedrock Agents offre des informations complémentaires sur l’automatisation des tâches multi-etapes.

Points clés

  • Les flux agentiques ouvrent des possibilités pour gérer des tâches complexes via des LLMs connectés à des outils et données externes.
  • L’approche à deux niveaux (Nova Lite et Nova Pro) équilibre latence, coût et capacité pour des scénarios de planification de voyage.
  • LangGraph offre une architecture d’orchestration évolutive et avec état pour coordonner plusieurs nœuds spécialisés et maintenir le contexte.
  • Le déploiement via CDK et l’intégration Secrets Manager/Cognito facilite la gouvernance et la sécurité.
  • Personnalisation et achats en direct démontrent une valeur pratique dans l’expérience de voyage basée sur l’IA.

FAQ

  • Q : Qu’est-ce qu’un flux agentique dans ce contexte ? A : C’est un système IA où les LLMs peuvent accéder à des outils externes et à des données pour exécuter des tâches multi-etapes par le biais de conversations naturelles.
  • Q : Pourquoi utiliser Nova et LangGraph ensemble ? A : Nova fournit des modèles de base performants et cohérents en coût, tandis que LangGraph offre une orchestration d’état pour gérer des flux complexes avec plusieurs nœuds.
  • Q : Quelles sont les étapes de déploiement ? A : Cloner le dépôt, configurer les clés API dans Secrets Manager, créer le fichier .env, bootstraper le CDK si nécessaire, exécuter le script de déploiement et utiliser les Outputs pour configurer le frontend.
  • Q : Ce cadre peut-il être réutilisé dans d’autres domaines ? A : Oui. L’architecture est conçue pour être étendue avec de nouvelles sources de données et de nouveaux nœuds d’action afin de soutenir d’autres flux agentiques.

Références

More news

aws.amazon.com

Utiliser les AWS Deep Learning Containers avec SageMaker AI géré MLflow

Découvrez comment les AWS Deep Learning Containers (DLCs) s’intègrent à SageMaker AI géré par MLflow pour équilibrer le contrôle de l’infrastructure et une gouvernance ML robuste. Un flux TensorFlow pour la prédiction de l’âge des abalones illustre le suivi de bout en bout et la traçabilité des modè