Lancer et faire évoluer vos agents et outils sur Amazon Bedrock AgentCore Runtime en toute sécurité
Sources: https://aws.amazon.com/blogs/machine-learning/securely-launch-and-scale-your-agents-and-tools-on-amazon-bedrock-agentcore-runtime, aws.amazon.com
TL;DR
- AgentCore Runtime offre un cadre d hébergement sans serveur et securise pour les agents et outils IA.
- Il est agnostique au framework et au modele, permettant de reutiliser du code existant sans migration et de melanger Bedrock, Claude, OpenAI ou Gemini.
- Des sessions persists via des microVM jusqu a 8 heures autorisent des flux de travail d agents complexes avec moins de cold starts.
- Une isolation per session protege les donnees et les credentials et empeche les fuites entre locataires.
- AgentCore Memory fournit une memoire durable entre les sessions pour des cas d utilisation longue duree.
Contexte et marche de fond
Les organisations s intéressent de plus en plus aux agents IA, mais beaucoup stagnent a un stade de preuve de concept. Les equipes veulent utiliser differents frameworks et models selon les cas d usage, mais la standardisation peut freiner l innovation. La nature stochastic des agents ajoute des problemes de securite, requireant une isolation renforcee entre les sessions. Les questions d identite et de controle d acces pour des agents agissant au nom d utilisateurs ou accedant a des systemes sensibles reviennent souvent. Les agents doivent parfois traiter des entrees diverses telles que texte, images et documents, avec des charges utiles qui depassent les limites serverless classiques. Enfin, prevoir les ressources de calcul est difficile et le surprovisionnement augmente les coûts. Configurer des infrastructures pour des charges vary, courtes ou longues, demande une expertise specialisee. AgentCore Runtime adresse ces defis avec un cadre d hebergement sans serveur securise specialise pour les charges de travail d agents. Il prend en charge l orchestrations des conteneurs, la gestion des sessions, l echelonnage et l isolation de securite afin que les developpeurs se consacrent a des experiences intelligentes plutot que a l infrastructure. Cet article expose comment AgentCore Runtime permet une mise en œuvre flexible, une portabilite entre frameworks et modeles et des flux de travail de developpement plus fluides.
Nouvelles fonctionnalites
AgentCore Runtime adopte une approche agnostique au framework et au modele. Votre equipe peut continuer a utiliser LangGraph pour des raisonnements complexes, CrewAI pour la collaboration multi agents ou des agents personnalises via Strands, sans modification architecturale. Il est possible d integrer differents grands modeles de langue LLM provenant de vos fournisseurs preferes, y compris les modeles Bedrock geres, Claude, OpenAI ou Gemini, garantissant une portabilite et permettant d optimiser les performances et les coûts. Les deux exemples présents illustrent l utilisation du AgentCore SDK quel que soit le framework ou le modele. Apres quelques modifications, vous pouvez deployer avec ou sans le Starter Toolkit du AgentCore Runtime. Le toolkit a pour but de simplifier le developpement local et la gestion des dependances en Python via l outil uv. Une courte video guide accompagne les instructions. Pour les applications de chat, AgentCore Runtime prend en charge le streaming en natif. Cela permet des flux de reponses en continu dans les interfaces utilisateur. Le runtime transforme aussi la vision serverless en proposant des environnements d execution persists qui conservent l etat entre les invocations. Des microVM dedicates peuvent durer jusqu a 8 heures, supportant des flux de travail multi etapes ou les appels suivants s appuient sur le contexte et l etat acquis precedemment. Bien que cela reduise le besoin de gestion d etat externe, AgentCore Memory demeure une option pour une etat durable entre les sessions. Le cycle de vie des sessions comprend trois etats. Lorsqu une invocation est effectuee avec un identifiant de session unique, un environnement d execution dedie est provisionne et passe a l etat Active lors du traitement ou des taches en arriere plan. Le systeme suit l activite synchrone et les reponses de verification de sante via des messages tels que HealthyBusy. Les sessions passent a Idle lorsqu elles ne traitent plus mais restent provisionnees pour une reutilisation immediate. Elles se terminent lorsque l inactivite excede 15 minutes, lorsque la duree maximale de 8 heures est atteinte ou lorsque les verification de sante echouent. Comprendre ces transitions est crucial pour concevoir des flux de travail resiliants et gerer proprement les ressources. Consultez AgentCore Runtime Service Quotas pour plus de details. Les donnees de session sont ephmeres: elles existeront uniquement pendant la session active et seront completely effacees a la fin. Pour les besoins de donnees qui doivent durer au dela d une session, AgentCore Memory offre une solution de memoire durable pour l historique des conversations, les motifs de comportement et les insights entre les sessions. La securite et l isolation restent des diffrenciateurs clefs: les agents IA manipulent des etats contextuels complexes et peuvent acceder a des credentials sensibles et des fichiers. L isolation traditionnelle des conteneurs peut etre insuffisante pour les charges de travail des agents. AgentCore Runtime assure une isolation microVM par session qui protege contre les fuites de donnees et assure que l etat et les outils restent compartimentes. Quand une session se termine, la microVM est termine et la memoire est sanitisee pour reduire les risques de persistence de donnees.
Pourquoi cela compte (impact pour les developpeurs et les entreprises)
La combinaison de la flexibilite entre frameworks et modeles avec l isolation et les environnements d execution persistants permet aux equipes de passer de la verification a la production avec une meilleure securite et gouvernance. Les developpeurs peuvent reutiliser le code existant, combiner des models pour differentes taches et deployer rapidement sans compromis sur la securite. La capacite a maintenir le contexte sur une session reduit le besoin de solutions externalise de gestion de l etat, tout en offrant une memoire durable lorsque cela est necessaire. Les entreprises beneficient d une gestion plus simple des ressources et d un controle de coûts plus efficace, car elles peuvent choisir les modeles optimises pour la performance et le cout sans etre lies a un seul fournisseur ou framework. L isolation des donnees entre sessions est cruciale dans les environnements multi locataires et renforce la confiance des clients. En somme, AgentCore Runtime facilite la transition des preuves de concept vers des solutions robustes et securisées, avec la capacite de gerer des workloads varies d agents avec efficacite.
Détails techniques ou Implémentation
AgentCore Runtime exécute des frameworks et modeles variés dans des microVMs isolées. Points clés:
- Portabilite entre frameworks et modeles: les equipes peuvent reutiliser du code sans migrations architecturales, avec support pour LangGraph, CrewAI, Strands et des agents personnalises.
- Flexibilité des modeles et des fournisseurs: il est possible de combiner Bedrock, Claude, OpenAI ou Gemini et de maintenir une portabilite tout en choisissant la meilleure option pour chaque tache.
- Exécution avec etat et scalabilite: les sessions durent jusqu a 8 heures dans des microVMs dédiées, avec des etats Active, Idle et Terminated selon les quotas. Les proprietes architecturales incluent l isolation complete par session: chaque session dispose de ressources de calcul, de memoire et de systeme de fichiers isolees. A la fin de la session, la microVM est terminee et la memoire sanitisee pour eviter la persistence des donnees ou la contamination croisee. Les donnees temporaires de la session existent uniquement pendant la vie de la session; pour des donnees qui doivent durer, AgentCore Memory propose des options de memoire durable pour l historique des conversations et les insights. Les developers peuvent commencer avec le AgentCore Starter toolkit pour configurer rapidement les environnements locaux et gerer les dependances Python. Le toolkit facilite la configuration, le lancement et l invocation pour deployer et utiliser l agent, avec des exemples montrant l integration du AgentCore SDK avec divers frameworks et modeles. Le streaming est natif pour les cas d usage de chat et des exemples presentent comment adapter du code existant a des flux en continu. Tableau resume des faits essentiels.
| Aspect | Description |
|---|---|
| Duree MicroVM | jusqu a 8 heures par session |
| Etat Active | traitement des requetes ou taches en arriere plan |
| Etat Idle | provisionnee et prête a l emploi |
| Etat Terminated | inactivité, limite de temps ou verification de sante echouee |
| Isolation | isolation complete par session des ressources |
Points clefs
- AgentCore Runtime offre un cadre securise pour l hebergement sans serveur des agents IA.
- Portabilite entre frameworks et modeles, reutilisation du code et flexibilité entre fournisseurs.
- Sessions persistentes jusqu a 8 heures, permettant des flux de travail complexes sans trop de cold starts.
- Isolation par session reduisant les risques de fuite de donnees et de contamination croisee.
- AgentCore Memory offre une memoire durable entre les sessions pour des usages de longue duree.
FAQ
-
Qu est ce que AgentCore Runtime et pourquoi y penser ?
C est un cadre d hebergement sans serveur pour les agents IA qui met l accent sur la securite, l isolation et l execution avec etat, tout en restant agnostique au framework et au modele.
-
Comment fonctionne l isolation entre les sessions ?
Chaque session tourne dans une microVM dediee et les donnees de la session sont sanitisees a la fin pour eviter les fuites entre sessions.
-
Combien de temps peut durer une session ?
Une session peut durer jusqu a 8 heures, avec un seuil dad/inactivite de 15 minutes pouvant mettre fin a la session.
-
uels modeles et frameworks sont supportes ?
Vous pouvez melanger bedrock, Claude, OpenAI ou Gemini, et utiliser LangGraph, CrewAI, Strands ou des agents personnalises via le meme modele de deployment.
References
More news
Faire passer vos agents IA du concept à la production avec Amazon Bedrock AgentCore
Une exploration détaillée de la façon dont Amazon Bedrock AgentCore aide à faire passer des applications IA basées sur des agents du proof of concept à des systèmes de production de niveau entreprise, en préservant mémoire, sécurité, observabilité et gestion d’outils à l’échelle.
Surveiller l’inférence par lot Bedrock d’AWS via les métriques CloudWatch
Apprenez à surveiller et optimiser les jobs d’inférence par lot Bedrock via CloudWatch, with alertes et tableaux de bord pour améliorer les performances, les coûts et l’exploitation.
Prompting pour la précision avec Stability AI Image Services sur Amazon Bedrock
Bedrock intègre Stability AI Image Services avec neuf outils pour créer et modifier des images avec précision. Apprenez les techniques de prompting adaptées à l’entreprise.
Utiliser les AWS Deep Learning Containers avec SageMaker AI géré MLflow
Découvrez comment les AWS Deep Learning Containers (DLCs) s’intègrent à SageMaker AI géré par MLflow pour équilibrer le contrôle de l’infrastructure et une gouvernance ML robuste. Un flux TensorFlow pour la prédiction de l’âge des abalones illustre le suivi de bout en bout et la traçabilité des modè
Évoluer la production visuelle avec Stability AI Image Services dans Amazon Bedrock
Stability AI Image Services est désormais disponible dans Amazon Bedrock, offrant des capacités d’édition d’images prêtes à l’emploi via l’API Bedrock et étendant les modèles Stable Diffusion 3.5 et Stable Image Core/Ultra déjà présents.
Créer des flux de travail agentiques avec GPT OSS d’OpenAI sur SageMaker AI et Bedrock AgentCore
Vue d’ensemble complète sur le déploiement des modèles GPT OSS d’OpenAI sur SageMaker AI et Bedrock AgentCore pour alimenter un analyseur d’actions multi-agents avec LangGraph, incluant la quantification MXFP4 en 4 bits et une orchestration sans serveur.