Stable Diffusion est le générateur d'images IA le plus flexible et le plus technique. Contrairement à Midjourney ou DALL-E 3 qui simplifient l'expérience utilisateur, Stable Diffusion vous donne un contrôle granulaire sur chaque aspect de la génération — mais cela nécessite de maîtriser une syntaxe de prompt spécifique et des paramètres techniques que les autres modèles n'utilisent pas.
Générateur automatique : Notre générateur de prompts Stable Diffusion crée des prompts optimisés avec la syntaxe pondérée, les quality tags et les prompts négatifs adaptés à votre version de SD. Téléchargez une image de référence pour commencer.
La Syntaxe Pondérée Expliquée
La syntaxe pondérée est ce qui rend Stable Diffusion unique parmi les générateurs d'images IA. Elle vous permet d'augmenter ou de diminuer l'importance relative de chaque terme dans votre prompt.
Syntaxe de Base
Le format est (terme:poids) où le poids est un nombre décimal. La valeur par défaut est 1.0.
(golden hour:1.3)— augmente l'importance de « golden hour » de 30%(bokeh:0.7)— réduit l'importance de « bokeh » de 30%(masterpiece:1.2), (best quality:1.1)— quality tags avec pondération
Raccourcis de Pondération
Stable Diffusion supporte aussi des raccourcis avec des parenthèses multiples :
(terme)=(terme:1.1)((terme))=(terme:1.21)(((terme)))=(terme:1.33)[terme]=(terme:0.9)— réduit le poids
Règles de Pondération
La pondération est un outil puissant, mais il faut l'utiliser avec discernement :
- Restez entre 0.5 et 1.5 : Au-delà, vous risquez des artefacts visuels et des distorsions
- Pondérez peu de termes : Si tout est pondéré à 1.3, rien n'est vraiment mis en avant
- Utilisez la pondération pour résoudre des problèmes : Si un élément n'apparaît pas, augmentez son poids. S'il domine trop, réduisez-le
Exemple Complet
(masterpiece:1.2), (best quality:1.1), 1girl, (flowing red hair:1.2), green eyes, (medieval dress:1.1), standing in a (enchanted forest:1.3), (golden hour lighting:1.2), (bokeh:0.8), detailed face, soft shadows
Maîtriser les Prompts Négatifs
Les prompts négatifs sont une fonctionnalité exclusive à Stable Diffusion (et aux modèles dérivés). Ils indiquent au modèle ce que vous ne voulez PAS voir dans l'image. C'est souvent la différence entre un résultat amateur et un résultat professionnel.
Prompt Négatif Universel
Ce prompt négatif fonctionne bien comme base pour la plupart des générations :
(worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, username, blurry, deformed, jpeg artifacts
Prompts Négatifs Spécialisés
Pour les portraits :
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra fingers, mutated hands, poorly drawn face, ugly, disfigured, cross-eyed, asymmetric face, extra limbs, fused fingers
Pour les paysages :
(worst quality:1.4), (low quality:1.4), blurry, watermark, text, logo, oversaturated, distorted horizon, unnatural colors
Pour l'anime :
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra digits, missing fingers, poorly drawn face, simple background, flat colors, bad proportions
Tags de Qualité Essentiels
Les quality tags sont des mots-clés qui améliorent la qualité générale de l'image. Leur efficacité varie selon la version de Stable Diffusion et le checkpoint utilisé.
Tags les Plus Efficaces
| Tag | Effet | Efficace sur |
|---|---|---|
masterpiece |
Qualité maximale, composition soignée | SD 1.5, certains SDXL |
best quality |
Détails fins, rendu propre | SD 1.5, SDXL |
highly detailed |
Augmente le niveau de détail | Tous |
sharp focus |
Netteté accrue | Tous |
8k uhd |
Haute résolution apparente | SD 1.5, variable sur SDXL |
intricate details |
Détails complexes et fins | Tous |
Différences entre SD 1.5, SDXL et SD 3.5
SD 1.5
La version la plus mature avec le plus grand écosystème de checkpoints et LoRAs. Les prompts SD 1.5 dépendent fortement des quality tags et de la syntaxe pondérée. Résolution native : 512x512.
Prompt type : (masterpiece:1.2), (best quality:1.1), highly detailed, 1girl, long blonde hair, blue eyes, white dress, standing in flower field, golden hour, (bokeh:0.8), sharp focus
SDXL
Résolution native de 1024x1024 avec une compréhension améliorée du langage naturel. SDXL nécessite moins de quality tags mais bénéficie toujours de la pondération pour le contrôle précis. Le système de deux encodeurs de texte (CLIP ViT-L et OpenCLIP ViT-bigG) donne une meilleure compréhension sémantique.
Prompt type : beautiful young woman with long blonde hair, wearing an elegant white dress, standing in a sunlit wildflower meadow, (golden hour:1.2), soft bokeh background, detailed skin texture, professional photography
SD 3.5
La dernière version utilise une architecture MMDiT (Multi-Modal Diffusion Transformer) qui comprend beaucoup mieux le langage naturel. Les quality tags traditionnels ont moins d'impact. Les descriptions détaillées en langage naturel fonctionnent le mieux.
Prompt type : A beautiful young woman with flowing blonde hair and bright blue eyes stands in a vast field of wildflowers during golden hour. She wears an elegant white summer dress that catches the warm breeze. The background is softly blurred with warm amber tones. Professional portrait photography with detailed skin texture and natural soft lighting.
Compatibilité avec les Checkpoints
Les checkpoints (modèles personnalisés) sont une force majeure de Stable Diffusion. Chaque checkpoint a été entraîné avec des préférences de prompt spécifiques.
- Realistic Vision : Excelle avec des prompts photographiques détaillés et des termes de caméra (
Canon EOS R5, 85mm f/1.4, RAW photo) - DreamShaper : Polyvalent, fonctionne bien avec des prompts mixtes art/photo
- Anything V5 : Optimisé pour l'anime, utilise des tags danbooru (
1girl, long_hair, blue_eyes, school_uniform) - Juggernaut XL : Checkpoint SDXL populaire, favorise le langage naturel avec des quality tags modérés
Conseil clé : lisez toujours la page du checkpoint sur CivitAI pour connaître les prompts recommandés et les quality tags préférés. Un prompt parfait pour un checkpoint peut être inefficace pour un autre.
CFG Scale, Steps et Samplers
CFG Scale (Classifier-Free Guidance)
Le CFG Scale contrôle la fidélité au prompt. C'est un paramètre fondamental que beaucoup de débutants négligent.
- CFG 3-5 : Créatif, libre — le modèle prend des libertés avec votre prompt
- CFG 7-9 : Équilibré — bon compromis entre créativité et fidélité (recommandé)
- CFG 10-15 : Strict — suit le prompt de près mais peut sur-saturer
- CFG 15+ : Déconseillé — artefacts fréquents et couleurs artificielles
Steps (Étapes de diffusion)
Le nombre de steps influence le temps de génération et la qualité du résultat :
- 15-20 steps : Rapide, qualité acceptable pour les tests
- 25-35 steps : Bon équilibre qualité/vitesse (recommandé)
- 40-50 steps : Haute qualité, temps de génération plus long
- 50+ steps : Rendements décroissants — rarement nécessaire
Samplers
Le choix du sampler affecte la qualité et le style du résultat. Les plus populaires en 2026 :
- DPM++ 2M Karras : Le standard — rapide et de bonne qualité
- Euler a : Créatif, bon pour les compositions artistiques
- DPM++ SDE Karras : Excellent pour les détails fins et les textures
- UniPC : Rapide et efficace, bon pour le prototypage
Templates de Prompts Avancés
Portrait Photoréaliste (SD 1.5)
Prompt : (masterpiece:1.2), (best quality:1.1), (RAW photo:1.2), portrait of a 30 year old woman, (detailed skin texture:1.2), natural skin, freckles, green eyes, auburn hair, (natural lighting:1.1), f/2.8, Canon EOS R5, 85mm lens, shallow depth of field
Négatif : (worst quality:1.4), (low quality:1.4), bad anatomy, deformed iris, extra fingers, poorly drawn face, airbrushed skin, plastic skin, doll-like
Paysage Fantasy (SDXL)
Prompt : majestic fantasy landscape, ancient ruins overgrown with luminescent plants, (floating islands:1.2) in a purple twilight sky, waterfalls cascading into mist, (volumetric lighting:1.3), ethereal atmosphere, concept art quality, highly detailed, 8k
Négatif : (worst quality:1.4), blurry, watermark, text, oversaturated, flat lighting
Anime (Anything V5)
Prompt : (masterpiece:1.2), (best quality:1.1), 1girl, long silver hair, violet eyes, detailed eyes, (fantasy armor:1.2), glowing runes, dynamic pose, magical particles, night sky background, (bloom:0.8), detailed face
Négatif : (worst quality:1.4), (low quality:1.4), bad anatomy, extra limbs, poorly drawn hands, simple background, flat shading
Générez des Prompts Stable Diffusion Optimisés
Téléchargez une image de référence et obtenez un prompt Stable Diffusion complet avec syntaxe pondérée, quality tags et prompt négatif.
Essayer le Générateur SD →Questions Fréquentes
Comment fonctionne la syntaxe pondérée dans Stable Diffusion ?
La syntaxe pondérée utilise des parenthèses et des deux-points pour augmenter ou diminuer l'importance d'un terme. (terme:1.3) augmente le poids de 30%, (terme:0.7) le réduit de 30%. La valeur par défaut est 1.0. Évitez les poids supérieurs à 1.5 qui causent des artefacts visuels et des distorsions.
Quels sont les meilleurs prompts négatifs pour Stable Diffusion ?
Un bon prompt négatif universel : (worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, blurry, deformed. Pour les portraits, ajoutez des termes spécifiques comme extra fingers, mutated hands, poorly drawn face. Adaptez selon le checkpoint utilisé.
Quelle est la différence entre SD 1.5, SDXL et SD 3.5 pour les prompts ?
SD 1.5 nécessite des prompts très structurés avec des quality tags et répond bien à la syntaxe pondérée. SDXL comprend mieux le langage naturel et nécessite moins de quality tags. SD 3.5 utilise un nouveau système qui favorise les descriptions naturelles détaillées, similaire à Flux, avec moins de dépendance aux tags techniques.
Comment choisir le bon CFG Scale pour mes prompts Stable Diffusion ?
Le CFG Scale contrôle la fidélité au prompt. Les valeurs basses (3-5) donnent des résultats créatifs mais moins fidèles. Les valeurs moyennes (7-9) offrent le meilleur équilibre — c'est le sweet spot pour la plupart des usages. Les valeurs élevées (10-15) suivent très fidèlement le prompt mais risquent la sur-saturation. Commencez à 7 et ajustez selon vos résultats.