Skip to content
Améliorez l’analyse géospatiale avec Amazon Bedrock : LLM, RAG et flux GIS
Source: aws.amazon.com

Améliorez l’analyse géospatiale avec Amazon Bedrock : LLM, RAG et flux GIS

Sources: https://aws.amazon.com/blogs/machine-learning/enhance-geospatial-analysis-and-gis-workflows-with-amazon-bedrock-capabilities

TL;DR

  • Amazon Bedrock offre une plateforme sécurisée et flexible pour héberger et invoquer des modèles d’IA et les intégrer aux systèmes d’information géographique (SIG) et flux associés.
  • Le RAG (Récupération Basée sur le Contexte) et les flux pilotés par des agents permettent des cas d’utilisation géospatiaux en combinant des bases de connaissances avec des données en temps réel et des actions contre des fournisseurs externes.
  • Les bases de connaissances hébergées sur des sources comme S3 et SharePoint fournissent des documents non structurés ; les outils peuvent récupérer des informations en direct ou piloter des processus externes via AWS Lambda, le tout orchestré par des Bedrock Agents.
  • L’article présente un agent d’analyse sismique qui relie des données Redshift aux requêtes géospatiales pour illustrer un flux de bout en bout.
  • Un pipeline pratique est décrit, incluant les permissions IAM, la configuration AWS CLI, la préparation des données, la configuration de Redshift, une base de connaissances et un agent, afin de démontrer comment opérationnaliser Bedrock dans les contextes GIS.

Contexte et arrière-plan

Les données géospatiales sont associées à une position sur la Terre (latitude, longitude, altitude) et les SIG offrent un moyen de stocker, analyser et afficher ces informations. Dans les applications SIG, ces informations sont souvent présentées sur des cartes montrant rues, bâtiments et végétation. À mesure que les données s’accumulent et que les systèmes d’information gagnent en complexité, les parties prenantes ont besoin de solutions qui révèlent des insights de qualité et facilitent des flux de travail intuitifs. Les LLMs constituent une sous-catégorie de modèles de base qui peuvent transformer des entrées textuelles (ou des images) en sorties, et sont utilisés pour diverses tâches de traitement du langage naturel. Amazon Bedrock est un service complet, sûr et flexible pour développer des applications et des agents d’IA générative. Il permet d’héberger et d’invoquer des modèles et facilite l’intégration avec l’infrastructure environnante. Les LLMs prennent en charge de nombreuses tâches générales de traitement du langage naturel, et dans les contextes géospatiaux, ils peuvent enrichir les flux SIG, soutenir l’exploration des données et aider à la prise de décision. Pour adapter les performances des LLMs à des cas d’usage spécifiques, des approches comme le RAG et les flux pilotés par des agents ont été développées. Le RAG injecte des informations contextuelles d’une base de connaissances lors de l’invocation du modèle, tandis que les flux pilotés par des agents gèrent des analyses de données plus complexes et l’orchestration. Avec le RAG, des informations contextuelles provenant d’une base de connaissances sont injectées dans le prompt du modèle lors de l’invocation. Bedrock propose des bases de connaissances gérées connectées à des sources de données telles que S3 et SharePoint, permettant d’ajouter des informations complémentaires comme des plans de développement urbain, des rapports d’intelligence ou des politiques et réglementations lors de la génération des réponses par l’IA. Lorsque le modèle répond en s’appuyant sur le contenu du RAG, il peut fournir des références et des citations aux sources. Dans les contextes géospatiaux, de nombreuses données sont structurées et stockées dans les SIG, ce qui permet de connecter directement le SIG au LLM via des outils et des agents, plutôt que de se limiter aux bases de connaissances. De nombreux LLMs (par exemple Claude sur Amazon Bedrock) permettent de décrire les outils disponibles afin que le modèle génère du texte pour invoquer des processus externes, tels que récupérer des informations météo en direct ou interroger une base de données structurée, démarrer un flux de travail ou ajouter des couches à une carte. Parmi les fonctionnalités géospatiales courantes à intégrer avec votre LLM, citons: invoquer des requêtes sur une base de données spatiale, déclencher des flux de travail, dessiner sur la carte ou interroger des informations en temps réel. Les outils sont souvent implémentés dans AWS Lambda, qui exécute du code sans gérer des serveurs. Bedrock propose les Bedrock Agents pour simplifier l’orchestration et l’intégration avec vos outils géospatiaux. Les Agents suivent les instructions de raisonnement du LLM pour décomposer une demande en tâches plus petites et agir sur les fournisseurs de tâches identifiés. Des diagrammes accompagnent l’article pour illustrer comment Bedrock Agents peut améliorer des solutions GIS. L’exemple de démonstration utilise un agent d’analyse des tremblements avec une base de connaissances basée sur Amazon Redshift. L’instance Redshift dispose de deux tables: earthquakes (date, magnitude, latitude, longitude) et counties (polygon). Les capacités géospatiales de Redshift permettent de relier ces ensembles de données pour répondre à des questions du type: quel comté a connu le tremblement le plus récent, ou quel comté a enregistré le plus de tremblements au cours des 20 dernières années. L’agent Bedrock peut générer ces requêtes géospatiales en langage naturel. Ce pipeline montre comment le RAG et les flux pilotés par agents peuvent maintenir l’exactitude des données tout en connectant des modèles d’IA à des sources de connaissances et à des systèmes de données structurées. Pour mettre en œuvre cette approche, vous devez disposer d’un compte AWS avec les autorisations IAM appropriées pour Amazon Bedrock, Amazon Redshift et Amazon S3. L’article détaille les étapes à suivre pour configurer AWS CLI, valider l’environnement, créer des variables Bedrock et Redshift, configurer les rôles IAM pour S3 et Redshift, préparer les données et le stockage dans S3, transformer les données géospatiales, mettre en place le cluster Redshift, créer le schéma de la base de données, créer une base de connaissances, puis créer et configurer un agent. Bien que l’article fournisse des extraits de code pour illustrer ces étapes, l’objectif principal est le flux de bout en bout: relier le raisonnement IA à des données géospatiales et à des bases de connaissances organisationnelles pour des flux GIS plus dynamiques et contextuels. L’intégration de l’IA avec les GIS crée des systèmes intuitifs qui aident des utilisateurs de niveaux techniques variés à réaliser des analyses spatiales complexes via des interactions en langage naturel. En utilisant le RAG et les flux orientés par agents, les organisations peuvent maintenir l’exactitude des données tout en connectant des modèles d’IA à des bases de connaissance et à des systèmes de données structurées. Amazon Bedrock facilite cette convergence entre IA et technologies GIS, en fournissant une plateforme robuste pour l’invocation de modèles, la récupération de connaissances et l’intégration des systèmes dans un contexte géospatial. Pour plus de détails et les diagrammes, consultez le billet original sur le blog AWS.

Ce qui est nouveau

AspectDescription
RAGInjection contextuelle dynamique à partir d’une base de connaissances lors de l’invocation du modèle pour les requêtes géospatiales.
Flux dirigés par agentsDécomposition d’une requête en tâches et exécution d’actions contre des fournisseurs de tâches identifiés pour réaliser des analyses géospatiales.
Bases de connaissancesConnexions gérées vers des sources telles que S3 et SharePoint pour enrichir les sorties avec des documents et des références de politique.
Outils et orchestrationOutils (souvent Lambda) permettent la récupération de données en direct, l’interaction avec des cartes ou le contrôle de flux, orchestrés par les Bedrock Agents.
Exemple end-to-endUn agent d’analyse des tremblements illustre comment interroger des données Redshift pour produire des insights et des cartes géospatiales.

Pourquoi c’est important (impact pour développeurs/entreprises)

  • Analyse simplifiée: l’IA assistée pour GIS réduit les étapes manuelles et accélère l’exploration des données géospatiales.
  • Prise de décision améliorée: des réponses contextualisées soutiennent la planification et l’interprétation des politiques avec des références traçables.
  • Intégration flexible: Bedrock offre une approche unifiée pour héberger des modèles, gérer des bases de connaissances et connecter des sources de données existantes et des flux de travail.
  • Valeur pour tous les rôles: les utilisateurs techniques, métier et leadership bénéficient de résultats accessibles et basés sur les données.
  • Sorties auditées: avec RAG, il est possible de citer des sources; les agents réalisent des tâches qui se connectent à des données en direct et à des outils, ce qui réduit les risques de résultats obsolètes.

Détails techniques ou Mise en œuvre (haut niveau)

Cette section résume l’approche d’implémentation telle que décrite dans l’article. Le modèle général combine des modèles Bedrock hébergés, la récupération de connaissances via le RAG et des Bedrock Agents qui orchestrent des tâches contre des sources de données et des outils externes.

Vue d’ensemble de l’architecture

  • Sources de données: données GIS stockées dans une base de données GIS structurée (p. ex., Redshift avec des polygones de comtés) et jeux de données géospatiaux en temps réel.
  • Modèles IA: LLMs hébergés sur Bedrock agissent comme mécanismes de raisonnement et d’interface en langage naturel.
  • Couche de connaissance: bases de connaissances gérées dans S3 ou SharePoint fournissent des documents non structurés et des références de politique.
  • Orchestration: Bedrock Agents transforment les intentions des utilisateurs en tâches et appellent des processus externes ou des stores de données (généralement des fonctions Lambda).
  • Outils: des processus externes récupèrent des données en direct, interrogent des stores de données spatiales ou modifient des couches GIS; ces outils peuvent être invoqués par le LLM via des descriptions d’outils.

Données et stockage (exemple)

  • L’exemple des tremblements utilise une instance Redshift avec deux tables: earthquakes (date, magnitude, latitude, longitude) et counties (polygones). Les capacités géospatiales de Redshift relient ces ensembles de données pour répondre à des questions comme quel comté a connu le tremblement le plus récent, ou quel comté a enregistré le plus de tremblements au cours des 20 dernières années. L’agent Bedrock peut générer des requêtes géospatiales en langage naturel, en s’appuyant sur les données Redshift et le flux de travail de l’agent pour réaliser l’analyse.
  • Les bases de connaissances dans Bedrock peuvent se connecter à des sources telles que S3 et SharePoint pour fournir des documents supplémentaires et des références de politique.

Pipeline end-to-end (haut niveau)

  • Préparer les permissions IAM pour Bedrock, Redshift et S3.
  • Configurer l’environnement AWS CLI et valider la configuration.
  • Créer et initialiser les variables Bedrock et Redshift, y compris les rôles qui permettent l’accès aux données.
  • Préparer les données géospatiales et les stocker dans S3 pour utilisation par le flux.
  • Transformer les formats de données géospatiales selon les besoins pour s’aligner sur les capacités Redshift.
  • Configurer le cluster Redshift et créer le schéma de base de données pertinent.
  • Créer et charger la base de connaissances avec les documents nécessaires à la génération RAG.
  • Créer et configurer un Bedrock Agent pour interpréter les intentions, récupérer des informations de soutien, interroger les stores et modifier les couches GIS lorsque pertinent.

Exemples de prompts et capacités

  • L’article présente des prompts tels que: Résumez quelles zones autorisent la construction d’un appartement. Ici, le LLM effectue une récupération via RAG en utilisant les documents de zonage comme contexte et répond en langage naturel. Un autre exemple demande un rapport sur l’utilisation des données d’urbanisme pour planifier un nouveau développement afin de répondre à une forte demande, le LLM récupère des documents du code d’urbanisme et produit un rapport standardisé. Un troisième exemple demande d’afficher les propriétés à faible densité sur une rue donnée sur la carte, en utilisant un outil de dessin pour placer des marqueurs. Enfin, une demande « puis-je construire un appartement ici » utilise l’état de la carte et le contexte politique pour répondre avec une justification.
  • Les démonstrations illustrent l’utilisation de modèles via des templates de prompts, le RAG, la synthèse, le raisonnement en chaîne et le contrôle de l’interface utilisateur, y compris la gestion du contexte d’interface et l’invocation d’outils.

Mise en œuvre et tests (haut niveau)

  • Après la création de l’agent, vous pouvez le tester avec des entrées en langage naturel et observer comment le LLM emploie le RAG pour récupérer des sources et comment l’agent déclenche des outils pour générer des cartes, des requêtes ou des rapports.
  • L’article met l’accent sur des tests de bout en bout et sur la suppression des ressources pour éviter des coûts indésirables.

Points à considérer pour les praticiens

  • La gestion IAM, la gouvernance des données et le contrôle des coûts sont essentiels lors du déploiement de flux GIS basés sur Bedrock.
  • Le RAG améliore la précision contextuelle en référant des bases de connaissance, tandis que les flux pilotés par agents traitent des tâches multi-étapes et l’orchestration entre données et outils.
  • La combinaison Bedrock-Redshift-S3-Lambda permet des pipelines d’IA géospatiale de bout en bout qui s’intègrent aux systèmes GIS existants et aux politiques organisationnelles.

Points clés à retenir

  • Bedrock offre une plateforme complète pour héberger des modèles, gérer des bases de connaissances et orchestrer des flux GIS pilotés par IA.
  • Le RAG et les flux pilotés par agents permettent des analyses géospatiales avec contexte et une automatisation multi-étapes sur des données et outils.
  • Des bases de connaissances connectées à S3 et SharePoint enrichissent les réponses IA avec des documents et des politiques pertinents, tandis que les données GIS dans Redshift soutiennent le raisonnement spatial précis.
  • Les Bedrock Agents simplifient l’orchestration du raisonnement des LLM et l’invocation d’outils en temps réel, offrant des expériences GIS interactives via le langage naturel.
  • L’exemple « Analyse des tremblements » illustre un pipeline complet reliant le raisonnement IA à des données géospatiales et à des stores de données en direct, avec précision et traçabilité.

FAQ

  • - **Q : Qu’est-ce qu’un Bedrock Agent dans ce contexte GIS ?**

    Les Bedrock Agents visent à simplifier l’orchestration et l’intégration, en décomposant une demande utilisateur en tâches plus petites et en exécutant des actions contre des fournisseurs de tâches identifiés. - **Q : Comment le RAG aide-t-il les cas géospatiaux ?** **A :** Le RAG injecte du contexte à partir d’une base de connaissances lors de l’invocation du modèle, ce qui permet à l’IA de faire référence à des sources et de citer des références dans ses réponses. - **Q : Quelles données sont utilisées dans l’exemple des tremblements ?** **A :** Un ensemble Redshift avec earthquakes (date, magnitude, latitude, longitude) et counties (polygones) est utilisé; les capacités géospatiales de Redshift relient ces données pour répondre à des questions spatiales. - **Q : Quelle configuration est nécessaire pour mettre en œuvre cette approche ?** **A :** Un compte AWS avec les permissions IAM pour Bedrock, Redshift et S3; configuration AWS CLI; création de variables Bedrock et Redshift; préparation des données; création d’une base de connaissances; création et configuration d’un agent.

Références

More news

aws.amazon.com

Utiliser les AWS Deep Learning Containers avec SageMaker AI géré MLflow

Découvrez comment les AWS Deep Learning Containers (DLCs) s’intègrent à SageMaker AI géré par MLflow pour équilibrer le contrôle de l’infrastructure et une gouvernance ML robuste. Un flux TensorFlow pour la prédiction de l’âge des abalones illustre le suivi de bout en bout et la traçabilité des modè