Stable Diffusion ist der leistungsfähigste und anspruchsvollste KI-Bildgenerator auf dem Markt. Im Gegensatz zu Midjourney oder DALL-E 3, die das Benutzererlebnis vereinfachen, gibt Ihnen Stable Diffusion direkten Zugriff auf die internen Modellparameter: Token-Gewichtungen, Sampler, CFG Scale, negative Prompts und ein riesiges Ökosystem feinabgestimmter Modelle. Mit dieser Kontrolle geht eine steilere Lernkurve einher.
Dieser Leitfaden deckt alles ab: von der grundlegenden Token-Syntax mit Kommatrennung bis hin zu fortgeschrittener Gewichtsmanipulation, Modellauswahl, Sampler-Wahl und den Unterschieden zwischen SD 1.5, SDXL und SD 3.5. Sie erfahren auch, wie Sie unseren Stable Diffusion Prompt-Generator und Tools wie ImageToPrompt nutzen, um SD-kompatible Prompts aus Referenzbildern zu erzeugen.
Automatischer Generator: Unser Stable Diffusion Prompt-Generator erstellt optimierte Prompts mit gewichteter Syntax, Quality Tags und negativen Prompts, die auf Ihre SD-Version abgestimmt sind. Laden Sie ein Referenzbild hoch, um zu beginnen.
Die gewichtete Syntax erklärt
Die gewichtete Syntax macht Stable Diffusion unter den KI-Bildgeneratoren einzigartig. Sie ermöglicht es Ihnen, die relative Bedeutung jedes einzelnen Begriffs in Ihrem Prompt zu erhöhen oder zu verringern.
Grundlegende Syntax
Das Format lautet (Begriff:Gewicht), wobei das Gewicht eine Dezimalzahl ist. Der Standardwert beträgt 1.0.
(golden hour:1.3)— erhöht die Bedeutung von «golden hour» um 30%(bokeh:0.7)— verringert die Bedeutung von «bokeh» um 30%(masterpiece:1.2), (best quality:1.1)— Quality Tags mit Gewichtung
Gewichtungs-Kurzschreibweisen
Stable Diffusion unterstützt auch Kurzschreibweisen mit mehrfachen Klammern:
(Begriff)=(Begriff:1.1)((Begriff))=(Begriff:1.21)(((Begriff)))=(Begriff:1.33)[Begriff]=(Begriff:0.9)— verringert das Gewicht
Regeln für die Gewichtung
Die Gewichtung ist ein mächtiges Werkzeug, sollte aber mit Bedacht eingesetzt werden:
- Bleiben Sie zwischen 0.5 und 1.5: Darüber hinaus riskieren Sie visuelle Artefakte und Verzerrungen
- Gewichten Sie nur wenige Begriffe: Wenn alles auf 1.3 gewichtet ist, wird nichts wirklich hervorgehoben
- Nutzen Sie die Gewichtung zur Problemlösung: Wenn ein Element nicht erscheint, erhöhen Sie sein Gewicht. Dominiert es zu sehr, verringern Sie es
Vollständiges Beispiel
(masterpiece:1.2), (best quality:1.1), 1girl, (flowing red hair:1.2), green eyes, (medieval dress:1.1), standing in a (enchanted forest:1.3), (golden hour lighting:1.2), (bokeh:0.8), detailed face, soft shadows
Negative Prompts meistern
Negative Prompts sind eine exklusive Funktion von Stable Diffusion (und abgeleiteten Modellen). Sie teilen dem Modell mit, was Sie NICHT im Bild sehen möchten. Oft ist dies der Unterschied zwischen einem Amateuergebnis und einem professionellen Resultat.
Universeller negativer Prompt
Dieser negative Prompt funktioniert gut als Basis für die meisten Generierungen:
(worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, username, blurry, deformed, jpeg artifacts
Spezialisierte negative Prompts
Für Portraits:
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra fingers, mutated hands, poorly drawn face, ugly, disfigured, cross-eyed, asymmetric face, extra limbs, fused fingers
Für Landschaften:
(worst quality:1.4), (low quality:1.4), blurry, watermark, text, logo, oversaturated, distorted horizon, unnatural colors
Für Anime:
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra digits, missing fingers, poorly drawn face, simple background, flat colors, bad proportions
Wichtige Quality Tags
Quality Tags sind Schlüsselwörter, die die allgemeine Bildqualität verbessern. Ihre Wirksamkeit variiert je nach Stable Diffusion-Version und verwendetem Checkpoint.
Die effektivsten Tags
| Tag | Wirkung | Effektiv bei |
|---|---|---|
masterpiece |
Höchste Qualität, sorgfältige Komposition | SD 1.5, einige SDXL |
best quality |
Feine Details, sauberes Rendering | SD 1.5, SDXL |
highly detailed |
Erhöht den Detailgrad | Alle |
sharp focus |
Erhöhte Schärfe | Alle |
8k uhd |
Scheinbar hohe Auflösung | SD 1.5, variabel bei SDXL |
intricate details |
Komplexe, feine Details | Alle |
Unterschiede zwischen SD 1.5, SDXL und SD 3.5
SD 1.5
Die ausgereifteste Version mit dem größten Ökosystem an Checkpoints und LoRAs. SD 1.5-Prompts sind stark abhängig von Quality Tags und der gewichteten Syntax. Native Auflösung: 512x512.
Typischer Prompt: (masterpiece:1.2), (best quality:1.1), highly detailed, 1girl, long blonde hair, blue eyes, white dress, standing in flower field, golden hour, (bokeh:0.8), sharp focus
SDXL
Native Auflösung von 1024x1024 mit verbessertem Verständnis natürlicher Sprache. SDXL benötigt weniger Quality Tags, profitiert aber weiterhin von der Gewichtung für präzise Steuerung. Das Zwei-Encoder-System (CLIP ViT-L und OpenCLIP ViT-bigG) bietet ein besseres semantisches Verständnis.
Typischer Prompt: beautiful young woman with long blonde hair, wearing an elegant white dress, standing in a sunlit wildflower meadow, (golden hour:1.2), soft bokeh background, detailed skin texture, professional photography
SD 3.5
Die neueste Version nutzt eine MMDiT-Architektur (Multi-Modal Diffusion Transformer), die natürliche Sprache deutlich besser versteht. Traditionelle Quality Tags haben weniger Einfluss. Detaillierte natürlichsprachliche Beschreibungen funktionieren am besten.
Typischer Prompt: A beautiful young woman with flowing blonde hair and bright blue eyes stands in a vast field of wildflowers during golden hour. She wears an elegant white summer dress that catches the warm breeze. The background is softly blurred with warm amber tones. Professional portrait photography with detailed skin texture and natural soft lighting.
Kompatibilität mit Checkpoints
Checkpoints (benutzerdefinierte Modelle) sind eine große Stärke von Stable Diffusion. Jeder Checkpoint wurde mit spezifischen Prompt-Präferenzen trainiert.
- Realistic Vision: Hervorragend mit detaillierten fotografischen Prompts und Kamerabegriffen (
Canon EOS R5, 85mm f/1.4, RAW photo) - DreamShaper: Vielseitig, funktioniert gut mit gemischten Kunst-/Foto-Prompts
- Anything V5: Optimiert für Anime, verwendet Danbooru-Tags (
1girl, long_hair, blue_eyes, school_uniform) - Juggernaut XL: Beliebter SDXL-Checkpoint, bevorzugt natürliche Sprache mit moderaten Quality Tags
Wichtiger Tipp: Lesen Sie immer die Checkpoint-Seite auf CivitAI, um die empfohlenen Prompts und bevorzugten Quality Tags zu erfahren. Ein perfekter Prompt für einen Checkpoint kann für einen anderen wirkungslos sein.
CFG Scale, Steps und Sampler
CFG Scale (Classifier-Free Guidance)
Der CFG Scale steuert die Prompttreue. Es ist ein grundlegender Parameter, den viele Anfänger vernachlässigen.
- CFG 3-5: Kreativ, frei — das Modell nimmt sich Freiheiten mit Ihrem Prompt
- CFG 7-9: Ausgewogen — guter Kompromiss zwischen Kreativität und Treue (empfohlen)
- CFG 10-15: Streng — folgt dem Prompt genau, kann aber übersättigen
- CFG 15+: Nicht empfohlen — häufige Artefakte und künstliche Farben
Steps (Diffusionsschritte)
Die Anzahl der Steps beeinflusst die Generierungszeit und die Ergebnisqualität:
- 15-20 Steps: Schnell, akzeptable Qualität für Tests
- 25-35 Steps: Gutes Gleichgewicht Qualität/Geschwindigkeit (empfohlen)
- 40-50 Steps: Hohe Qualität, längere Generierungszeit
- 50+ Steps: Abnehmende Erträge — selten notwendig
Sampler
Die Wahl des Samplers beeinflusst die Qualität und den Stil des Ergebnisses. Die beliebtesten im Jahr 2026:
- DPM++ 2M Karras: Der Standard — schnell und gute Qualität
- Euler a: Kreativ, gut für künstlerische Kompositionen
- DPM++ SDE Karras: Hervorragend für feine Details und Texturen
- UniPC: Schnell und effizient, gut für schnelle Prototypen
Fortgeschrittene Prompt-Vorlagen
Fotorealistisches Portrait (SD 1.5)
Prompt: (masterpiece:1.2), (best quality:1.1), (RAW photo:1.2), portrait of a 30 year old woman, (detailed skin texture:1.2), natural skin, freckles, green eyes, auburn hair, (natural lighting:1.1), f/2.8, Canon EOS R5, 85mm lens, shallow depth of field
Negativ: (worst quality:1.4), (low quality:1.4), bad anatomy, deformed iris, extra fingers, poorly drawn face, airbrushed skin, plastic skin, doll-like
Fantasy-Landschaft (SDXL)
Prompt: majestic fantasy landscape, ancient ruins overgrown with luminescent plants, (floating islands:1.2) in a purple twilight sky, waterfalls cascading into mist, (volumetric lighting:1.3), ethereal atmosphere, concept art quality, highly detailed, 8k
Negativ: (worst quality:1.4), blurry, watermark, text, oversaturated, flat lighting
Anime (Anything V5)
Prompt: (masterpiece:1.2), (best quality:1.1), 1girl, long silver hair, violet eyes, detailed eyes, (fantasy armor:1.2), glowing runes, dynamic pose, magical particles, night sky background, (bloom:0.8), detailed face
Negativ: (worst quality:1.4), (low quality:1.4), bad anatomy, extra limbs, poorly drawn hands, simple background, flat shading
Optimierte Stable Diffusion Prompts generieren
Laden Sie ein Referenzbild hoch und erhalten Sie einen vollständigen Stable Diffusion Prompt mit gewichteter Syntax, Quality Tags und negativem Prompt.
SD-Generator ausprobieren →Häufig gestellte Fragen
Wie funktioniert die gewichtete Syntax in Stable Diffusion?
Die gewichtete Syntax verwendet Klammern und Doppelpunkte, um die Bedeutung eines Begriffs zu erhöhen oder zu verringern. (Begriff:1.3) erhöht das Gewicht um 30%, (Begriff:0.7) verringert es um 30%. Der Standardwert ist 1.0. Vermeiden Sie Gewichte über 1.5, da diese visuelle Artefakte und Verzerrungen verursachen.
Was sind die besten negativen Prompts für Stable Diffusion?
Ein guter universeller negativer Prompt: (worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, blurry, deformed. Für Portraits fügen Sie spezifische Begriffe wie extra fingers, mutated hands, poorly drawn face hinzu. Passen Sie den negativen Prompt an den verwendeten Checkpoint an.
Was ist der Unterschied zwischen SD 1.5, SDXL und SD 3.5 bei den Prompts?
SD 1.5 benötigt stark strukturierte Prompts mit Quality Tags und reagiert gut auf die gewichtete Syntax. SDXL versteht natürliche Sprache besser und benötigt weniger Quality Tags. SD 3.5 nutzt ein neues System, das detaillierte natürliche Beschreibungen bevorzugt, ähnlich wie Flux, mit geringerer Abhängigkeit von technischen Tags.
Wie wähle ich den richtigen CFG Scale?
Der CFG Scale steuert die Prompttreue. Niedrige Werte (3-5) liefern kreative, aber weniger treue Ergebnisse. Mittlere Werte (7-9) bieten die beste Balance — der Sweet Spot für die meisten Anwendungen. Hohe Werte (10-15) folgen dem Prompt sehr genau, riskieren aber Übersättigung. Beginnen Sie bei 7 und passen Sie je nach Ergebnis an.