Skip to content
Prompting pour la précision avec Stability AI Image Services sur Amazon Bedrock
Source: aws.amazon.com

Prompting pour la précision avec Stability AI Image Services sur Amazon Bedrock

Sources: https://aws.amazon.com/blogs/machine-learning/prompting-for-precision-with-stability-ai-image-services-in-amazon-bedrock, https://aws.amazon.com/blogs/machine-learning/prompting-for-precision-with-stability-ai-image-services-in-amazon-bedrock/, AWS ML Blog

TL;DR

  • Amazon Bedrock propose désormais Stability AI Image Services, avec neuf outils pour améliorer la création et la modification d’images.
  • Le service étend les modèles Stable Diffusion et Stable Image pour offrir un contrôle fin via des prompts structurés.
  • Il met l’accent sur les techniques de prompting avancées ( prompting modulaire, prompts négatifs et weighting), les prompts axés sur le style et les flux de travail image-à-image, disponibles via les API Bedrock.
  • Les capacités comprennent l’in-painting, le transfert de style, recolorisation, suppression d’arrière-plan, suppression d’objets et guides de style, avec un contrôle additionnel via ControlNet, IP-Adapter et clip-based captioning.
  • L’article partage des meilleures pratiques, des exemples et des approches pour maximiser la qualité des sorties dans des usages d’entreprise tels que la photographie produit et les campagnes marketing. AWS ML Blog

Contexte et arrière-plan

Le blog AWS Machine Learning annonce que Stability AI Image Services sont désormais accessibles via des APIs dans Amazon Bedrock. Ces services étendent les capacités des modèles d’image de Stability AI, permettant aux entreprises d’obtenir un contrôle précis sur la génération et l’édition d’images. Le contenu s’inscrit dans la continuité d’autres articles sur l’ingénierie des prompts sur AWS et élargit la discussion sur la façon dont les techniques de prompting peuvent optimiser la qualité et la précision pour des applications d’entreprise. L’objectif est de proposer des visuels professionnels cohérents avec l’identité de marque pour la photographie produit, les concepts visuels et les campagnes. AWS ML Blog

Qu’est-ce qui est nouveau

  • Accès aux Stability AI Image Services via les API Bedrock, offrant neuf outils d’image pour façonner et modifier des visuels avec plus de précision.
  • Extension des modèles Stable Diffusion et Stable Image pour permettre un contrôle granulaire des prompts et des résultats.
  • Accent sur des prompts clairs comme direction artistique et sur l’utilisation de prompts forts pour contrôler le ton, la texture, l’éclairage et la composition.
  • Disponibilité des API pour l’in-painting, le transfert de style, la recoloration, la suppression d’arrière-plan, la suppression d’objets et les guides de style.
  • Pratiques de prompting structurés : trois formats principaux de formulation, prompting modulaire pour isoler les éléments et prompts négatifs pour exclure des éléments indésirables.
  • Introduction de la syntaxe de weighting des prompts pour prioriser des composants spécifiques (par ex. accentuer le personnage sur l’arrière-plan). Exemples concrets de prompts pondérés montrent comment cette technique guide le modèle. AWS ML Blog
  • Techniques d’appariement de style et prompting guidé par référence, y compris l’utilisation de balises de style et de références à des genres visuels reconnus. AWS ML Blog
  • Flux de travail image-à-image et outils de contrôle : Structure, Sketch et Style, avec ControlNet, IP-Adapter et clipping-based captioning pour un contrôle accru lorsqu’associés à des modèles Stability AI. AWS ML Blog

Pourquoi cela compte (impact pour les développeurs/entreprises)

Pour les développeurs et les entreprises, Stability AI Image Services dans Bedrock offrent un contrôle visuel précis, reproductible et à l’échelle. Des prompts clairs et structurés aident à maintenir une cohérence de marque dans la photographie produit, les concepts visuels et les campagnes marketing. L’association du prompting modulaire, des prompts négatifs et du weighting réduit l’ambiguïté, permettant des résultats plus prévisibles et des cycles d’itération plus rapides. Les flux image-à-image et les prompting guidés par des références permettent d’étendre les cas d’utilisation vers l’adaptation d’actifs et la production à grande échelle. AWS ML Blog

Détails techniques ou Mise en œuvre

Structure des prompts et formats

Pour exploiter pleinement les capacités granulaires, il est recommandé de construire des prompts bien structurés qui donnent un contrôle fin. L’article précise que la structure du prompt influence les résultats et que des prompts plus structurés donnent des sorties plus cohérentes et maîtrisables. Trois formats principaux existent, offrant différents niveaux de contrôle et de lisibilité, adaptés à différentes interfaces et objectifs. Le choix du format approprié permet au modèle de comprendre l’intention et d’atteindre le résultat souhaité. AWS ML Blog

Prompting modulaire

Le prompting modulaire divise les prompts en composants distincts, chacun spécifiant ce qu’il faut dessiner et comment cela doit apparaître. Les avantages incluent la prévention d’instructions conflictuelles, la possibilité de contrôler précisément la sortie et la simplification du débogage. En isolant les éléments, on peut rapidement identifier les parties efficaces ou inefficaces. Des exemples montrent que l’ordre des prompts peut influencer le poids visuel. AWS ML Blog

Prompts négatifs et weighting des prompts

Les prompts négatifs guident le modèle pour éviter les éléments indésirables et fonctionnent comme une liste de vérification de retouche. Un prompt négatif bien structuré peut renforcer le réalisme et réduire les éléments distrayants. L’article donne des exemples concrets, y compris des prompts négatifs du type « No cartoon, no watermarks, no blurry edges ». La syntaxe de weighting permet de hiérarchiser les composants (par ex. character:1.8, background:1.1). Un exemple illustrant les poids montre comment influencer la sortie : editorial product photo of (a translucent gel moisturizer jar:1.4) placed on a (frosted glass pedestal:1.2), surrounded by (dewy pink flower petals:1.1), with soft (diffused lighting:1.3), shallow depth of field. AWS ML Blog

Empreinte stylistique et prompting guidé par référence

Les prompts utilisent des balises de style et des références à des signatures artistiques pour ancrer l’esthétique. Les termes de style peuvent être combinés et pondérés pour obtenir une expression visuelle unique mais cohérente. Par exemple, une référence à Van Gogh peut être utilisée dans une instruction de style:1.3. L’article montre aussi que des images de référence peuvent guider la pose, la palette ou l’éclairage dans des flux image-à-image (Structure, Sketch, Style). AWS ML Blog

Flux de travail image-à-image et outils de contrôle

Les services prennent en charge les flux Structure, Sketch et Style, qui utilisent une image de contrôle pour guider le résultat. Des outils tels que ControlNet, IP-Adapter et clip-based captioning apportent un contrôle supplémentaire lorsqu’ils sont associés aux modèles Stability AI. Ces capacités étendent les scénarios d’entreprise, de la retouche photographique produit à l’adaptation d’actifs pour les campagnes. AWS ML Blog

Pour démarrer avec l’API

Pour commencer avec Stability AI Image Services dans Amazon Bedrock, suivez les instructions dans Getting started with the API pour remplir les prérequis. L’article met en avant les bonnes pratiques de prompting et démontre comment structurer les prompts, adopter le prompting modulaire et utiliser prompts négatifs et poids pour des résultats constants. AWS ML Blog

Points clés

  • Stability AI Image Services disponibles dans Amazon Bedrock via des APIs, avec neuf outils d’image.
  • Contrôle précis et reproductible des visuels, utile pour la cohérence de marque en marketing et produit.
  • Techniques comme prompting modulaire, prompts négatifs et weighting pour influencer finement les sorties.
  • Utilisation de prompts orientés style et de références visuelles, ainsi que des flux image-à-image pour des scénarios avancés.
  • Contrôle accru grâce à ControlNet, IP-Adapter et clipping-based captioning dans des pipelines de production. AWS ML Blog

FAQ

  • Qu’est-ce que Stability AI Image Services dans Bedrock ?

    Un ensemble d’outils de génération et d’édition d’images disponibles via les API Bedrock, qui étendent les modèles Stability AI pour un usage professionnel. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/prompting-for-precision-with-stability-ai-image-services-in-amazon-bedrock/)

  • uelles techniques de prompting sont mises en avant ?

    Le prompting modulaire, les prompts négatifs et le weighting pour un contrôle précis et une meilleure débogabilité. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/prompting-for-precision-with-stability-ai-image-services-in-amazon-bedrock/)

  • uels flux de travail image-à-image sont mentionnés ?

    Structure, Sketch et Style, avec des images de référence et des outils de contrôle pour un guidage renforcé. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/prompting-for-precision-with-stability-ai-image-services-in-amazon-bedrock/)

  • Comment les styles et références aident-ils ?

    Ils ancrent l’esthétique dans des langages visuels reconnus et aident à aligner les visuels sur l’identité de la marque. [AWS ML Blog](https://aws.amazon.com/blogs/machine-learning/prompting-for-precision-with-stability-ai-image-services-in-amazon-bedrock/)

Références

More news

aws.amazon.com

Utiliser les AWS Deep Learning Containers avec SageMaker AI géré MLflow

Découvrez comment les AWS Deep Learning Containers (DLCs) s’intègrent à SageMaker AI géré par MLflow pour équilibrer le contrôle de l’infrastructure et une gouvernance ML robuste. Un flux TensorFlow pour la prédiction de l’âge des abalones illustre le suivi de bout en bout et la traçabilité des modè