Stable Diffusion est le générateur d'images IA le plus flexible et le plus technique. Contrairement à Midjourney ou DALL-E 3 qui simplifient l'expérience utilisateur, Stable Diffusion vous donne un contrôle granulaire sur chaque aspect de la génération — mais cela nécessite de maîtriser une syntaxe de prompt spécifique et des paramètres techniques que les autres modèles n'utilisent pas.

Générateur automatique : Notre générateur de prompts Stable Diffusion crée des prompts optimisés avec la syntaxe pondérée, les quality tags et les prompts négatifs adaptés à votre version de SD. Téléchargez une image de référence pour commencer.

La Syntaxe Pondérée Expliquée

La syntaxe pondérée est ce qui rend Stable Diffusion unique parmi les générateurs d'images IA. Elle vous permet d'augmenter ou de diminuer l'importance relative de chaque terme dans votre prompt.

Syntaxe de Base

Le format est (terme:poids) où le poids est un nombre décimal. La valeur par défaut est 1.0.

Raccourcis de Pondération

Stable Diffusion supporte aussi des raccourcis avec des parenthèses multiples :

Règles de Pondération

La pondération est un outil puissant, mais il faut l'utiliser avec discernement :

Exemple Complet

(masterpiece:1.2), (best quality:1.1), 1girl, (flowing red hair:1.2), green eyes, (medieval dress:1.1), standing in a (enchanted forest:1.3), (golden hour lighting:1.2), (bokeh:0.8), detailed face, soft shadows

Maîtriser les Prompts Négatifs

Les prompts négatifs sont une fonctionnalité exclusive à Stable Diffusion (et aux modèles dérivés). Ils indiquent au modèle ce que vous ne voulez PAS voir dans l'image. C'est souvent la différence entre un résultat amateur et un résultat professionnel.

Prompt Négatif Universel

Ce prompt négatif fonctionne bien comme base pour la plupart des générations :

(worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, username, blurry, deformed, jpeg artifacts

Prompts Négatifs Spécialisés

Pour les portraits :

(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra fingers, mutated hands, poorly drawn face, ugly, disfigured, cross-eyed, asymmetric face, extra limbs, fused fingers

Pour les paysages :

(worst quality:1.4), (low quality:1.4), blurry, watermark, text, logo, oversaturated, distorted horizon, unnatural colors

Pour l'anime :

(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra digits, missing fingers, poorly drawn face, simple background, flat colors, bad proportions

Tags de Qualité Essentiels

Les quality tags sont des mots-clés qui améliorent la qualité générale de l'image. Leur efficacité varie selon la version de Stable Diffusion et le checkpoint utilisé.

Tags les Plus Efficaces

Tag Effet Efficace sur
masterpiece Qualité maximale, composition soignée SD 1.5, certains SDXL
best quality Détails fins, rendu propre SD 1.5, SDXL
highly detailed Augmente le niveau de détail Tous
sharp focus Netteté accrue Tous
8k uhd Haute résolution apparente SD 1.5, variable sur SDXL
intricate details Détails complexes et fins Tous

Différences entre SD 1.5, SDXL et SD 3.5

SD 1.5

La version la plus mature avec le plus grand écosystème de checkpoints et LoRAs. Les prompts SD 1.5 dépendent fortement des quality tags et de la syntaxe pondérée. Résolution native : 512x512.

Prompt type : (masterpiece:1.2), (best quality:1.1), highly detailed, 1girl, long blonde hair, blue eyes, white dress, standing in flower field, golden hour, (bokeh:0.8), sharp focus

SDXL

Résolution native de 1024x1024 avec une compréhension améliorée du langage naturel. SDXL nécessite moins de quality tags mais bénéficie toujours de la pondération pour le contrôle précis. Le système de deux encodeurs de texte (CLIP ViT-L et OpenCLIP ViT-bigG) donne une meilleure compréhension sémantique.

Prompt type : beautiful young woman with long blonde hair, wearing an elegant white dress, standing in a sunlit wildflower meadow, (golden hour:1.2), soft bokeh background, detailed skin texture, professional photography

SD 3.5

La dernière version utilise une architecture MMDiT (Multi-Modal Diffusion Transformer) qui comprend beaucoup mieux le langage naturel. Les quality tags traditionnels ont moins d'impact. Les descriptions détaillées en langage naturel fonctionnent le mieux.

Prompt type : A beautiful young woman with flowing blonde hair and bright blue eyes stands in a vast field of wildflowers during golden hour. She wears an elegant white summer dress that catches the warm breeze. The background is softly blurred with warm amber tones. Professional portrait photography with detailed skin texture and natural soft lighting.

Compatibilité avec les Checkpoints

Les checkpoints (modèles personnalisés) sont une force majeure de Stable Diffusion. Chaque checkpoint a été entraîné avec des préférences de prompt spécifiques.

Conseil clé : lisez toujours la page du checkpoint sur CivitAI pour connaître les prompts recommandés et les quality tags préférés. Un prompt parfait pour un checkpoint peut être inefficace pour un autre.

CFG Scale, Steps et Samplers

CFG Scale (Classifier-Free Guidance)

Le CFG Scale contrôle la fidélité au prompt. C'est un paramètre fondamental que beaucoup de débutants négligent.

Steps (Étapes de diffusion)

Le nombre de steps influence le temps de génération et la qualité du résultat :

Samplers

Le choix du sampler affecte la qualité et le style du résultat. Les plus populaires en 2026 :

Templates de Prompts Avancés

Portrait Photoréaliste (SD 1.5)

Prompt : (masterpiece:1.2), (best quality:1.1), (RAW photo:1.2), portrait of a 30 year old woman, (detailed skin texture:1.2), natural skin, freckles, green eyes, auburn hair, (natural lighting:1.1), f/2.8, Canon EOS R5, 85mm lens, shallow depth of field

Négatif : (worst quality:1.4), (low quality:1.4), bad anatomy, deformed iris, extra fingers, poorly drawn face, airbrushed skin, plastic skin, doll-like

Paysage Fantasy (SDXL)

Prompt : majestic fantasy landscape, ancient ruins overgrown with luminescent plants, (floating islands:1.2) in a purple twilight sky, waterfalls cascading into mist, (volumetric lighting:1.3), ethereal atmosphere, concept art quality, highly detailed, 8k

Négatif : (worst quality:1.4), blurry, watermark, text, oversaturated, flat lighting

Anime (Anything V5)

Prompt : (masterpiece:1.2), (best quality:1.1), 1girl, long silver hair, violet eyes, detailed eyes, (fantasy armor:1.2), glowing runes, dynamic pose, magical particles, night sky background, (bloom:0.8), detailed face

Négatif : (worst quality:1.4), (low quality:1.4), bad anatomy, extra limbs, poorly drawn hands, simple background, flat shading

Générez des Prompts Stable Diffusion Optimisés

Téléchargez une image de référence et obtenez un prompt Stable Diffusion complet avec syntaxe pondérée, quality tags et prompt négatif.

Essayer le Générateur SD →

Questions Fréquentes

Comment fonctionne la syntaxe pondérée dans Stable Diffusion ?

La syntaxe pondérée utilise des parenthèses et des deux-points pour augmenter ou diminuer l'importance d'un terme. (terme:1.3) augmente le poids de 30%, (terme:0.7) le réduit de 30%. La valeur par défaut est 1.0. Évitez les poids supérieurs à 1.5 qui causent des artefacts visuels et des distorsions.

Quels sont les meilleurs prompts négatifs pour Stable Diffusion ?

Un bon prompt négatif universel : (worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, blurry, deformed. Pour les portraits, ajoutez des termes spécifiques comme extra fingers, mutated hands, poorly drawn face. Adaptez selon le checkpoint utilisé.

Quelle est la différence entre SD 1.5, SDXL et SD 3.5 pour les prompts ?

SD 1.5 nécessite des prompts très structurés avec des quality tags et répond bien à la syntaxe pondérée. SDXL comprend mieux le langage naturel et nécessite moins de quality tags. SD 3.5 utilise un nouveau système qui favorise les descriptions naturelles détaillées, similaire à Flux, avec moins de dépendance aux tags techniques.

Comment choisir le bon CFG Scale pour mes prompts Stable Diffusion ?

Le CFG Scale contrôle la fidélité au prompt. Les valeurs basses (3-5) donnent des résultats créatifs mais moins fidèles. Les valeurs moyennes (7-9) offrent le meilleur équilibre — c'est le sweet spot pour la plupart des usages. Les valeurs élevées (10-15) suivent très fidèlement le prompt mais risquent la sur-saturation. Commencez à 7 et ajustez selon vos résultats.