Skip to content
Comment les services de santé d Amazon ont amélioré la découverte dans la recherche Amazon via AWS ML et Gen AI
Source: aws.amazon.com

Comment les services de santé d Amazon ont amélioré la découverte dans la recherche Amazon via AWS ML et Gen AI

Sources: https://aws.amazon.com/blogs/machine-learning/learn-how-amazon-health-services-improved-discovery-in-amazon-search-using-aws-ml-and-gen-ai, https://aws.amazon.com/blogs/machine-learning/learn-how-amazon-health-services-improved-discovery-in-amazon-search-using-aws-ml-and-gen-ai/, AWS ML Blog

TL;DR

  • La recherche en santé dans les domaines du commerce électronique présente des défis où les recherches de produits classiques ne suffisent pas, avec des relations complexes entre symptômes, conditions et services.
  • Amazon Health Services a résolu ces défis de découverte en utilisant une pile AWS en trois volets : SageMaker pour les modèles ML, Bedrock pour les capacités LLM et EMR/Athena pour le traitement des données.
  • L approche réunit une compréhension des requêtes par ML, une recherche vectorielle pour le couplage produit et une optimisation de la pertinence via des LLM dans un cadre Retrieval Augmented Generation (RAG).
  • Une base de connaissances health care a été enrichie avec des termes d ontologie et des prompts améliorés par LLM, intégrés via FAISS pour une recherche par similarité efficace et stockés dans S3.
  • La solution est utilisée quotidiennement pour aider les clients à trouver des médicaments sur ordonnance et des services de santé primaires ou spécialisés via Health Benefits Connector et d autres offres.

Contexte et arrière plan

La découverte en matière de santé dans les environnements d e commerce présente des défis que la recherche de produits traditionnelle n est pas conçue pour traiter. Contrairement à des livres ou à des électroniques, les requêtes de santé impliquent des relations subtiles entre symptômes, conditions, traitements et services, nécessitant une compréhension approfondie de la terminologie médicale et de l intention du client. En élargissant Amazon au-delà du commerce électronique vers des services de santé, l accès direct à des médicaments sur ordonnance via Amazon Pharmacy, les soins primaires via One Medical et les partenariats de soins spécialisés via Health Benefits Connector créent des défis techniques uniques. Nous avons développé une solution qui combine ML pour la compréhension des requêtes, recherche vectorielle pour l alignement avec les offres et LLM pour l optimisation de la pertinence. L architecture repose entièrement sur les services AWS : SageMaker pour les modèles ML, Bedrock pour les capacités LLM et EMR/Athena pour le traitement des données. Cette approche permet de comprendre l intention de recherche en matière de santé et de faire correspondre cette intention avec les produits et services de santé les plus pertinents. Nous avons identifié deux extrêmes dans le parcours de recherche des clients : les requêtes spearfishing qui visent des produits spécifiques, et les requêtes sanitaires plus générales qui cherchent des informations et des recommandations couvrant plusieurs types de produits. Cette segmentation a guidé la construction de capacités dédiées pour répondre au spectre complet des recherches de santé. Pour déterminer l intention spearfishing, nous avons analysé des données d engagement de recherche anonymisées et entraîné un modèle de classification pour comprendre quelles requêtes mènent à l engagement avec les ASIN de la pharmacie Amazon. Le processus a utilisé PySpark sur EMR et Athena pour traiter les données à grande échelle. Pour identifier l intention de santé plus large, nous avons formé un modèle NER afin d annoter les mots clés en terminologie médicale. Un corpus ontologique a été utilisé pour reconnaître des concepts tels que conditions de santé, maladies, traitements, blessures et médicaments. Lorsque des termes alternatifs faisaient défaut, des LLM ont été recrutés pour enrichir la base de connaissances. Le modèle NER est protégé par des prédictions de types de produits de santé générés par des modèles de correspondance requête produit Amazon. Pour étendre le vocabulaire médical au delà des données existantes, un cadre clair de mise en correspondance a été utilisé avec des termes supplémentaires apportés par des LLM et des retours d experts. Un exemple concret illustre une requête pharmacie comme atorvastatine 40 mg qui déclenche une expérience orientée médicaments sur ordonnance, alors qu une requête générale comme tension artérielle élevée déclenche une expérience offrant plusieurs options. Pour soutenir des capacités similaires de reconnaissance d entités médicales, Amazon Comprehend Medical est cité comme outil puissant pour détecter des entités médicales dans des segments de texte. Afin de construire une base de connaissances robuste pour les produits et services de santé, nous avons démarré avec les offres existantes et les données catalogues, puis utilisé un LLM avec un prompt affiné et des exemples few shot pour ajouter des mots clés pertinents liés à des conditions, symptômes et traitements. La base de connaissances a ensuite été convertie en embeddings via FAISS et un index a été créé pour permettre une recherche efficace par similarité, tout en conservant des correspondances avec les éléments originaux. La base de connaissances et les embeddings ont été stockés sur S3, et OpenSearch Service a été identifié comme une option viable pour les capacités de base de données vectorielles. Des travaux d embedding à grande échelle ont été exécutés avec des tâches récurrentes de SageMaker Notebook. Le pattern RAG est au coeur de la solution. L étape initiale identifie des mots clés et des produits connus pour établir une vérité de base. Avec les métadonnées du catalogue et les attributs ASIN, la requête est transformée en embedding et utilisée pour chercher dans l index de similarité. Les correspondances sont évaluées selon un schéma de pertinence ESCI — exact, substitut, complément,Irrelevante. Un processus de labellisation est mis en place avec des étiquettes humaines et des étiquettes générées par des LLM via Bedrock en batch pour renforcer les signaux de pertinence au fil du temps. Les conclusions démontrent comment une approche axée sur les données et les modèles peut améliorer la découvrabilité des services et produits de santé dans une plateforme d ecommerce tout en respectant les exigences spécifiques du domaine.

À retenir

  • La recherche en santé nécessite une compréhension du domaine et des représentations de connaissances spécifiques, au delà des recherches de produits classiques.
  • Le cadre RAG permet de relier les requêtes des utilisateurs à des éléments de connaissance pertinents et d aligner les résultats avec les offres de soins.
  • L augmentation par LLM et la labellisation de pertinence avec ESCI assurent la qualité et l actualité des résultats.
  • Les outils AWS comme SageMaker, Bedrock, EMR et FAISS permettent de construire et maintenir des bases de connaissances sur la santé à grande échelle dans un cadre ecommerce.
  • L étiquetage humain combiné à l étiquetage par LLM offre des signaux de qualité solides pour le classement et la pertinence des résultats.

FAQ

Références

https://aws.amazon.com/blogs/machine-learning/learn-how-amazon-health-services-improved-discovery-in-amazon-search-using-aws-ml-and-gen-ai/

More news

aws.amazon.com

Utiliser les AWS Deep Learning Containers avec SageMaker AI géré MLflow

Découvrez comment les AWS Deep Learning Containers (DLCs) s’intègrent à SageMaker AI géré par MLflow pour équilibrer le contrôle de l’infrastructure et une gouvernance ML robuste. Un flux TensorFlow pour la prédiction de l’âge des abalones illustre le suivi de bout en bout et la traçabilité des modè