Stable Diffusion ist der leistungsfähigste und anspruchsvollste KI-Bildgenerator auf dem Markt. Im Gegensatz zu Midjourney oder DALL-E 3, die das Benutzererlebnis vereinfachen, gibt Ihnen Stable Diffusion direkten Zugriff auf die internen Modellparameter: Token-Gewichtungen, Sampler, CFG Scale, negative Prompts und ein riesiges Ökosystem feinabgestimmter Modelle. Mit dieser Kontrolle geht eine steilere Lernkurve einher.

Dieser Leitfaden deckt alles ab: von der grundlegenden Token-Syntax mit Kommatrennung bis hin zu fortgeschrittener Gewichtsmanipulation, Modellauswahl, Sampler-Wahl und den Unterschieden zwischen SD 1.5, SDXL und SD 3.5. Sie erfahren auch, wie Sie unseren Stable Diffusion Prompt-Generator und Tools wie ImageToPrompt nutzen, um SD-kompatible Prompts aus Referenzbildern zu erzeugen.

Automatischer Generator: Unser Stable Diffusion Prompt-Generator erstellt optimierte Prompts mit gewichteter Syntax, Quality Tags und negativen Prompts, die auf Ihre SD-Version abgestimmt sind. Laden Sie ein Referenzbild hoch, um zu beginnen.

Die gewichtete Syntax erklärt

Die gewichtete Syntax macht Stable Diffusion unter den KI-Bildgeneratoren einzigartig. Sie ermöglicht es Ihnen, die relative Bedeutung jedes einzelnen Begriffs in Ihrem Prompt zu erhöhen oder zu verringern.

Grundlegende Syntax

Das Format lautet (Begriff:Gewicht), wobei das Gewicht eine Dezimalzahl ist. Der Standardwert beträgt 1.0.

Gewichtungs-Kurzschreibweisen

Stable Diffusion unterstützt auch Kurzschreibweisen mit mehrfachen Klammern:

Regeln für die Gewichtung

Die Gewichtung ist ein mächtiges Werkzeug, sollte aber mit Bedacht eingesetzt werden:

Vollständiges Beispiel

(masterpiece:1.2), (best quality:1.1), 1girl, (flowing red hair:1.2), green eyes, (medieval dress:1.1), standing in a (enchanted forest:1.3), (golden hour lighting:1.2), (bokeh:0.8), detailed face, soft shadows

Negative Prompts meistern

Negative Prompts sind eine exklusive Funktion von Stable Diffusion (und abgeleiteten Modellen). Sie teilen dem Modell mit, was Sie NICHT im Bild sehen möchten. Oft ist dies der Unterschied zwischen einem Amateuergebnis und einem professionellen Resultat.

Universeller negativer Prompt

Dieser negative Prompt funktioniert gut als Basis für die meisten Generierungen:

(worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, username, blurry, deformed, jpeg artifacts

Spezialisierte negative Prompts

Für Portraits:

(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra fingers, mutated hands, poorly drawn face, ugly, disfigured, cross-eyed, asymmetric face, extra limbs, fused fingers

Für Landschaften:

(worst quality:1.4), (low quality:1.4), blurry, watermark, text, logo, oversaturated, distorted horizon, unnatural colors

Für Anime:

(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra digits, missing fingers, poorly drawn face, simple background, flat colors, bad proportions

Wichtige Quality Tags

Quality Tags sind Schlüsselwörter, die die allgemeine Bildqualität verbessern. Ihre Wirksamkeit variiert je nach Stable Diffusion-Version und verwendetem Checkpoint.

Die effektivsten Tags

Tag Wirkung Effektiv bei
masterpiece Höchste Qualität, sorgfältige Komposition SD 1.5, einige SDXL
best quality Feine Details, sauberes Rendering SD 1.5, SDXL
highly detailed Erhöht den Detailgrad Alle
sharp focus Erhöhte Schärfe Alle
8k uhd Scheinbar hohe Auflösung SD 1.5, variabel bei SDXL
intricate details Komplexe, feine Details Alle

Unterschiede zwischen SD 1.5, SDXL und SD 3.5

SD 1.5

Die ausgereifteste Version mit dem größten Ökosystem an Checkpoints und LoRAs. SD 1.5-Prompts sind stark abhängig von Quality Tags und der gewichteten Syntax. Native Auflösung: 512x512.

Typischer Prompt: (masterpiece:1.2), (best quality:1.1), highly detailed, 1girl, long blonde hair, blue eyes, white dress, standing in flower field, golden hour, (bokeh:0.8), sharp focus

SDXL

Native Auflösung von 1024x1024 mit verbessertem Verständnis natürlicher Sprache. SDXL benötigt weniger Quality Tags, profitiert aber weiterhin von der Gewichtung für präzise Steuerung. Das Zwei-Encoder-System (CLIP ViT-L und OpenCLIP ViT-bigG) bietet ein besseres semantisches Verständnis.

Typischer Prompt: beautiful young woman with long blonde hair, wearing an elegant white dress, standing in a sunlit wildflower meadow, (golden hour:1.2), soft bokeh background, detailed skin texture, professional photography

SD 3.5

Die neueste Version nutzt eine MMDiT-Architektur (Multi-Modal Diffusion Transformer), die natürliche Sprache deutlich besser versteht. Traditionelle Quality Tags haben weniger Einfluss. Detaillierte natürlichsprachliche Beschreibungen funktionieren am besten.

Typischer Prompt: A beautiful young woman with flowing blonde hair and bright blue eyes stands in a vast field of wildflowers during golden hour. She wears an elegant white summer dress that catches the warm breeze. The background is softly blurred with warm amber tones. Professional portrait photography with detailed skin texture and natural soft lighting.

Kompatibilität mit Checkpoints

Checkpoints (benutzerdefinierte Modelle) sind eine große Stärke von Stable Diffusion. Jeder Checkpoint wurde mit spezifischen Prompt-Präferenzen trainiert.

Wichtiger Tipp: Lesen Sie immer die Checkpoint-Seite auf CivitAI, um die empfohlenen Prompts und bevorzugten Quality Tags zu erfahren. Ein perfekter Prompt für einen Checkpoint kann für einen anderen wirkungslos sein.

CFG Scale, Steps und Sampler

CFG Scale (Classifier-Free Guidance)

Der CFG Scale steuert die Prompttreue. Es ist ein grundlegender Parameter, den viele Anfänger vernachlässigen.

Steps (Diffusionsschritte)

Die Anzahl der Steps beeinflusst die Generierungszeit und die Ergebnisqualität:

Sampler

Die Wahl des Samplers beeinflusst die Qualität und den Stil des Ergebnisses. Die beliebtesten im Jahr 2026:

Fortgeschrittene Prompt-Vorlagen

Fotorealistisches Portrait (SD 1.5)

Prompt: (masterpiece:1.2), (best quality:1.1), (RAW photo:1.2), portrait of a 30 year old woman, (detailed skin texture:1.2), natural skin, freckles, green eyes, auburn hair, (natural lighting:1.1), f/2.8, Canon EOS R5, 85mm lens, shallow depth of field

Negativ: (worst quality:1.4), (low quality:1.4), bad anatomy, deformed iris, extra fingers, poorly drawn face, airbrushed skin, plastic skin, doll-like

Fantasy-Landschaft (SDXL)

Prompt: majestic fantasy landscape, ancient ruins overgrown with luminescent plants, (floating islands:1.2) in a purple twilight sky, waterfalls cascading into mist, (volumetric lighting:1.3), ethereal atmosphere, concept art quality, highly detailed, 8k

Negativ: (worst quality:1.4), blurry, watermark, text, oversaturated, flat lighting

Anime (Anything V5)

Prompt: (masterpiece:1.2), (best quality:1.1), 1girl, long silver hair, violet eyes, detailed eyes, (fantasy armor:1.2), glowing runes, dynamic pose, magical particles, night sky background, (bloom:0.8), detailed face

Negativ: (worst quality:1.4), (low quality:1.4), bad anatomy, extra limbs, poorly drawn hands, simple background, flat shading

Optimierte Stable Diffusion Prompts generieren

Laden Sie ein Referenzbild hoch und erhalten Sie einen vollständigen Stable Diffusion Prompt mit gewichteter Syntax, Quality Tags und negativem Prompt.

SD-Generator ausprobieren →

Häufig gestellte Fragen

Wie funktioniert die gewichtete Syntax in Stable Diffusion?

Die gewichtete Syntax verwendet Klammern und Doppelpunkte, um die Bedeutung eines Begriffs zu erhöhen oder zu verringern. (Begriff:1.3) erhöht das Gewicht um 30%, (Begriff:0.7) verringert es um 30%. Der Standardwert ist 1.0. Vermeiden Sie Gewichte über 1.5, da diese visuelle Artefakte und Verzerrungen verursachen.

Was sind die besten negativen Prompts für Stable Diffusion?

Ein guter universeller negativer Prompt: (worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, blurry, deformed. Für Portraits fügen Sie spezifische Begriffe wie extra fingers, mutated hands, poorly drawn face hinzu. Passen Sie den negativen Prompt an den verwendeten Checkpoint an.

Was ist der Unterschied zwischen SD 1.5, SDXL und SD 3.5 bei den Prompts?

SD 1.5 benötigt stark strukturierte Prompts mit Quality Tags und reagiert gut auf die gewichtete Syntax. SDXL versteht natürliche Sprache besser und benötigt weniger Quality Tags. SD 3.5 nutzt ein neues System, das detaillierte natürliche Beschreibungen bevorzugt, ähnlich wie Flux, mit geringerer Abhängigkeit von technischen Tags.

Wie wähle ich den richtigen CFG Scale?

Der CFG Scale steuert die Prompttreue. Niedrige Werte (3-5) liefern kreative, aber weniger treue Ergebnisse. Mittlere Werte (7-9) bieten die beste Balance — der Sweet Spot für die meisten Anwendungen. Hohe Werte (10-15) folgen dem Prompt sehr genau, riskieren aber Übersättigung. Beginnen Sie bei 7 und passen Sie je nach Ergebnis an.