Sie öffnen Midjourney, tippen „a cool dragon“ und drücken Enter. Das Ergebnis ist... okay. Generisch sogar. Ihr Freund tippt etwas völlig anderes und erhält ein atemberaubendes filmisches Meisterwerk. Was ist der Unterschied? Der Prompt.
Effektive KI-Bild-Prompts zu schreiben ist eine erlernbare Fähigkeit. Es ist keine Magie, und Sie müssen weder Künstler noch Programmierer sein. Dieses Tutorial bringt Sie vom Schreiben von Ein-Wort-Prompts mit mittlermäßigen Ergebnissen zum Erstellen detaillierter, strukturierter Prompts, die konsistent genau das Bild generieren, das Sie sich vorstellen.
Am Ende dieses Leitfadens werden Sie die fünf Kernelemente verstehen, die jeder großartige Prompt enthält, wie man Prompts Schritt für Schritt aufbaut und wie man ein Tool wie ImageToPrompt nutzt, um Prompts aus Bildern zu rekonstruieren, die Ihnen gefallen.
Warum gute Prompts wichtig sind (und was einen schlechten ausmacht)
KI-Bildgeneratoren wie Midjourney, Stable Diffusion, DALL-E 3 und Flux sind keine Gedankenleser. Sie sind Mustererkennungsmaschinen, die auf Milliarden von Bildern und deren Beschriftungen trainiert wurden. Wenn Sie einen Prompt eingeben, durchsucht das Modell seine gelernten Assoziationen und generiert ein Bild, das statistisch zu Ihrer Beschreibung passt.
Ein schlechter Prompt scheitert auf eine von drei Arten:
- Zu vage: „a landscape“ könnte alles sein — ein Aquarell, ein Foto, eine Pixel-Art-Szene, Tag oder Nacht, Berge oder Strand. Das Modell wird raten.
- Widersprüchlich: „dark bright neon photorealistic cartoon“ schickt das Modell in mehrere Richtungen gleichzeitig. Die Ausgabe wird verwirrt sein.
- Fehlender Kontext: „a woman“ sagt dem Modell nichts über Alter, Aussehen, Ausdruck, Kleidung, Umgebung, Beleuchtung oder Stil. Sie erhalten die durchschnittlichste Frau in der durchschnittlichsten Umgebung.
Ein guter Prompt ist spezifisch, konsistent und geschichtet. Er sagt dem Modell, was Sie sehen möchten, wie es aussehen soll und welche technischen Parameter es benötigt, um Ihre Vision umzusetzen.
Die 5 Elemente eines großartigen KI-Bild-Prompts
Großartige Prompts bestehen aus fünf Bausteinen. Sie brauchen nicht immer alle fünf — manchmal ist ein starker Zwei-Elemente-Prompt effektiver als ein schwacher Fünf-Elemente-Prompt — aber das Verständnis aller fünf gibt Ihnen die volle Kontrolle.
1. Motiv
Das Motiv ist das Hauptobjekt in Ihrem Bild: eine Person, ein Gegenstand, ein Wesen, ein Ort oder ein abstraktes Konzept. Dies ist das wichtigste Element. Seien Sie spezifisch.
- Schwach: „a dog“
- Besser: „a golden retriever puppy“
- Stark: „a golden retriever puppy sitting in autumn leaves, looking up at the camera with tongue out“
2. Stil
Der Stil sagt dem Modell, welche visuelle Sprache es verwenden soll. Ohne Stil wählt das Modell einen für Sie — normalerweise fotorealistisch oder was auch immer in seinen Trainingsdaten für dieses Motiv am häufigsten war.
- Fotografie-Stile: portrait photography, street photography, macro photography, aerial photography
- Illustrationsstile: watercolor, ink illustration, flat design, editorial illustration
- Malstile: oil painting, impressionist, acrylic painting, gouache
- Digitale Kunststile: concept art, digital painting, 3D render, pixel art
- Spezifische Künstler (vorsichtig verwenden): „in the style of Studio Ghibli“, „impressionist like Monet“
3. Komposition
Die Komposition beschreibt, wie das Motiv innerhalb des Bildes eingerahmt wird. Viele Anfänger überspringen dies, aber es beeinflusst die endgültige Ausgabe dramatisch.
- Einstellungsgrößen: close-up, medium shot, full body, wide shot, establishing shot
- Kamerawinkel: eye level, low angle, high angle, bird's eye view, worm's eye view, Dutch angle
- Rahmungstechniken: rule of thirds, centered composition, golden ratio, negative space
- Tiefe: shallow depth of field, deep focus, bokeh background
4. Beleuchtung
Beleuchtung kann ein Bild von flach und langweilig zu emotional wirkungsvoll transformieren. Professionelle Fotografen sind besessen von Licht, weil es definiert, wie alles aussieht. Ihr KI-Modell versteht Beleuchtungssprache.
- Tageszeit: golden hour, blue hour, midday, nighttime, overcast
- Lichtquelle: studio lighting, natural light, candlelight, neon lighting, bioluminescence
- Qualität: soft light, hard light, diffused light, dramatic shadows, high contrast
- Richtung: front-lit, backlit (silhouette), side-lit (Rembrandt lighting), rim light
5. Technische Parameter
Technische Parameter sind modellspezifische Anweisungen, die Ausgabequalität und Format steuern. Diese variieren je nach Plattform, umfassen aber typischerweise Seitenverhältnis, Qualitätsmodifikatoren und Rendering-Stil.
- Seitenverhältnis: 16:9 (Querformat), 9:16 (Hochformat/Stories), 1:1 (Quadrat), 4:5 (Instagram-Hochformat)
- Qualitätsmarker (Midjourney): --quality 2, --stylize 750
- Qualitäts-Token (Stable Diffusion): „masterpiece, best quality, ultra-detailed“
- Rendering: 8K resolution, photorealistic, hyperrealistic, cinematic
Einfach anfangen: Einzelmotiv-Prompts und wie man sie erweitert
Der beste Weg, Prompt-Schreiben zu lernen, ist mit einem einzelnen Motiv zu beginnen und progressiv Komplexität hinzuzufügen. Hier ein praktisches Beispiel:
| Iteration | Prompt | Was geändert wurde |
|---|---|---|
| 1 | a lighthouse | Ausgangspunkt |
| 2 | a lighthouse on rocky cliffs | Umgebung hinzugefügt |
| 3 | a lighthouse on rocky cliffs during a storm | Wetter/Stimmung hinzugefügt |
| 4 | a lighthouse on rocky cliffs during a storm, dramatic waves crashing, oil painting | Stil hinzugefügt |
| 5 | a lighthouse on rocky cliffs during a storm, dramatic waves crashing, oil painting, golden light breaking through clouds, low angle shot | Beleuchtung und Komposition hinzugefügt |
| 6 | a lighthouse on rocky cliffs during a storm, dramatic waves crashing, oil painting by J.M.W. Turner, golden light breaking through storm clouds, low angle wide shot, highly detailed, impasto texture | Künstler-Referenz und Texturdetail hinzugefügt |
Jede Iteration fügt Spezifik hinzu, ohne den vorherigen Elementen zu widersprechen. Der finale Prompt wird ein dramatisch beeindruckenderes Ergebnis liefern als der erste — und Sie können bei jedem Schritt genau sehen, warum. Nicht sicher, wie Sie anfangen sollen? Probieren Sie unser Text-zu-Prompt-Tool — geben Sie eine einfache Beschreibung ein und erhalten Sie in Sekunden einen professionellen Prompt.
Wie verschiedene KI-Modelle Prompts interpretieren
Nicht alle KI-Bildgeneratoren funktionieren gleich. Der gleiche Prompt wird auf verschiedenen Plattformen sehr unterschiedliche Ergebnisse produzieren, und das Verständnis dieser Unterschiede spart Ihnen Stunden an Frustration.
Midjourney
Midjourney reagiert gut auf ästhetische und emotionale Sprache. Es ist auf hochwertiger kuratierter Kunst und Fotografie trainiert und hat starke ästhetische Standardeinstellungen. Es verwendet Parameter-Flags (--ar, --style, --chaos) nach dem Hauptprompt und Gewichtungen mit Doppelpunkten (::). Natürlichsprachliche Beschreibungen funktionieren gut.
Stable Diffusion
Stable Diffusion verwendet kommaseparierte Token-Listen statt natürlichsprachlicher Sätze. Qualitäts-Token am Anfang des Prompts beeinflussen die Ausgabe stark. Es hat ein separates Negativ-Prompt-Feld zum Ausschließen unerwünschter Elemente. Token-Gewichte wie (important:1.3) geben Ihnen feingranulare Kontrolle.
DALL-E 3
DALL-E 3 (verwendet in ChatGPT) versteht natürliche Sprache äußerst gut und befolgt Anweisungen wörtlich. Es ist das beste Modell für Anfänger, weil Sie umgangssprachliche Prompts schreiben können. Es lehnt bestimmte Inhalte automatisch ab und schreibt Prompts intern aus Sicherheitsgründen um.
Flux
Flux (entwickelt von Black Forest Labs) verarbeitet natürliche Sprache wie DALL-E 3, erzeugt aber Bilder mit mehr fotografischem Realismus. Es eignet sich hervorragend für komplexe Kompositionsszenen, die in einfachem Englisch beschrieben werden. Siehe unseren Flux AI Prompt-Leitfaden für modellspezifische Tipps.
Motiv-Vokabular: Wie man Dinge benennt
Die Verwendung des richtigen Vokabulars in Ihren Prompts aktiviert spezifische Assoziationen in den Trainingsdaten des Modells. Hier sind die Begriffe, die die konsistentesten Ergebnisse liefern:
Personen
- Alter: toddler, child, teenager, young adult, middle-aged, elderly
- Allgemein: person, man, woman, figure, silhouette, portrait subject
- Rollen: warrior, scientist, merchant, explorer, chef, musician
- Ausdrücke: smiling, contemplative, stoic, joyful, melancholy, fierce
- Kleidung: casual, formal, medieval armor, futuristic suit, Victorian dress
Orte und Umgebungen
- Natur: forest, mountain range, ocean cliff, desert dunes, arctic tundra, tropical jungle
- Urban: city street, rooftop, alleyway, subway station, market square
- Innenräume: cozy cabin, gothic cathedral, minimalist apartment, ancient library, space station
- Größenhinweise: vast, intimate, towering, cramped, sprawling
Stil-Vokabular: Fotografie, Illustration, Malerei, 3D
Stil-Vokabular ist der Bereich, in dem Anfänger die größten Fortschritte machen können. Hier sind spezifische Begriffe, die zuverlässig unterschiedliche visuelle Ästhetiken erzeugen:
Fotografie-Stile
- Porträt: studio portrait, environmental portrait, candid portrait, headshot
- Landschaft: landscape photography, long exposure, HDR photography
- Dokumentarisch: street photography, photojournalism, documentary style
- Kommerziell: product photography, editorial photography, fashion photography
- Technisch: macro photography, aerial photography, underwater photography
Illustration und Malerei
- Aquarell: loose watercolor, detailed watercolor illustration, botanical watercolor
- Tusche: pen and ink illustration, crosshatching, brush ink painting, manga style
- Ölmalerei: classical oil painting, impressionist oil, alla prima, plein air
- Digitale Illustration: flat vector illustration, character concept art, children's book illustration
Kompositionsbegriffe die tatsächlich funktionieren
Diese Kompositionsbegriffe verändern zuverlässig, wie das Motiv in der Ausgabe eingerahmt wird:
| Begriff | Was er bewirkt | Am besten für |
|---|---|---|
| close-up / extreme close-up | Füllt den Rahmen mit Motivdetail | Porträts, Texturen, Details |
| medium shot / waist up | Zeigt Motiv von Hüfte bis Kopf | Porträt, Charakterkunst |
| full body shot | Zeigt ganze Person von Kopf bis Fuß | Mode, Charakterdesign |
| wide shot / establishing shot | Motiv klein in der Umgebung | Landschaften, Szenen |
| bird's eye view / top-down | Blick direkt von oben | Karten, Essen, Flat Lay |
| Dutch angle | Kamera diagonal geneigt | Spannung, Unruhe, Action |
| shallow depth of field | Hintergrund unscharf (Bokeh) | Porträts, Produktfotos |
| symmetrical composition | Perfekte Spiegelbalance | Architektur, formelle Porträts |
Beleuchtungsbegriffe die Bilder transformieren
Beleuchtung ist das am meisten unterschätzte Element in Anfänger-Prompts. Ein einziger spezifischer Beleuchtungsbegriff kann ein flaches, generisches Bild in etwas Filmisches verwandeln.
Natürliches Licht
- Golden hour: warmes orange-goldenes Licht, lange Schatten, romantisch und filmisch
- Blue hour: kühles blaues Dämmerungslicht nach Sonnenuntergang, atmosphärisch und stimmungsvoll
- Overcast: weiches diffuses Licht, keine harten Schatten, ideal für Porträts
- Harsh midday sun: hoher Kontrast, starke Schatten, intensiv und energetisch
- Moonlight: kühles silber-blaues Licht, mystisch, geringe Sichtbarkeit
Künstliches und Speziallicht
- Studio lighting: kontrolliertes, professionelles, gleichmäßiges Licht mit Füll- und Hauptlicht
- Rembrandt lighting: dramatisches Seitenlicht mit dreieckiger Hervorhebung auf der Wange
- Neon lighting: farbiges urbanes Leuchten, Cyberpunk-Ästhetik, Farbreflexionen
- Candlelight / firelight: warmes flackerndes Orange, intim und ursprünglich
- Volumetric light / god rays: sichtbare Lichtstrahlen durch die Atmosphäre
- Backlit / silhouette: Motiv dunkel vor hellem Hintergrund
Stimmung und Atmosphäre hinzufügen
Stimmungswörter funktionieren als semantische Kurzform, die ganze Cluster visueller Assoziationen aktiviert. Ein einzelnes Stimmungswort kann Farbpalette, Kontrast, Kompositionstendenz und sogar den Ausdruck des Motivs verändern.
- Epic / cinematic: Weitwinkel, dramatische Beleuchtung, hoher Kontrast, weiter Blick
- Serene / peaceful: weiches Licht, gedämpfte Palette, offener Raum, sanftes Motiv
- Melancholy / somber: entsättigte Farben, bedecktes Licht, isoliertes Motiv
- Whimsical / magical: Pastellfarben, Glitzer, Fantasy-Elemente, Weichzeichnung
- Gritty / raw: hohe Körnung, entsättigt, urban, abgenutzte Texturen
- Mysterious / ethereal: Nebel, Dunst, diffuses Licht, mehrdeutige Tiefe
- Vibrant / energetic: gesättigte Farben, dynamische Komposition, Bewegungsunschärfe
- Cozy / warm: warme Töne, weiches Licht, intime Einstellung, gemütliches Setting


Ihr erster Prompt: Schritt-für-Schritt-Anleitung
Lassen Sie uns einen kompletten Prompt von Grund auf erstellen. Das Ziel: ein filmisches Porträt einer Astronautin auf einem fremden Planeten.
Schritt 1: Motiv definieren
„a female astronaut in a worn spacesuit“
Schritt 2: Umgebung hinzufügen
„standing on the surface of a red alien planet, jagged rock formations in the background, two moons visible in the sky“
Schritt 3: Komposition wählen
„medium shot, low camera angle looking slightly up at her, rule of thirds“
Schritt 4: Beleuchtung definieren
„warm orange sunset light from the left, long shadows, rim light from a distant star“
Schritt 5: Stil wählen
„cinematic photography, hyperrealistic, 8K, sharp focus“
Schritt 6: Stimmung hinzufügen
„epic, solitary, awe-inspiring“
Der komplette Prompt
a female astronaut in a worn spacesuit standing on the surface of a red alien planet, jagged rock formations in the background, two moons visible in the sky, medium shot, low camera angle looking slightly up at her, warm orange sunset light from the left, long shadows, rim light from a distant star, cinematic photography, hyperrealistic, 8K, sharp focus, epic, solitary, awe-inspiring
Dieser Prompt wird dramatisch beeindruckendere Ergebnisse liefern als „an astronaut on a planet.“ Jedes Wort verdient seinen Platz.
Häufige Anfängerfehler und wie man sie vermeidet
Fehler 1: Adjektive ohne Substantive verwenden
„Beautiful, amazing, stunning“ — diese sagen dem Modell nicht, was schön aussieht. Stattdessen: „beautiful detailed oil painting“ oder „stunning golden hour portrait photography.“
Fehler 2: Beschreiben, was man nicht will
„A portrait without sunglasses“ zwingt das Modell, über Sonnenbrillen nachzudenken. Beschreiben Sie stattdessen einfach, was Sie wollen: „a portrait, eyes visible and expressive.“ In Stable Diffusion verschieben Sie unerwünschte Elemente in den negativen Prompt.
Fehler 3: Widersprüchliche Stile stapeln
„Photorealistic watercolor 3D render illustration“ — wählen Sie einen oder zwei kompatible Stile. Fotorealistisch und Aquarell sind Gegensätze.
Fehler 4: Seitenverhältnis ignorieren
Eine Landschaftsszene im Quadratformat verliert die Hälfte ihrer Wirkung. Geben Sie immer das Seitenverhältnis an, wenn Sie die beabsichtigte Verwendung kennen: --ar 16:9 für Querformat, --ar 9:16 für Hochformat/Stories, --ar 1:1 für Social Media.
Fehler 5: Alles auf einmal ändern
Wenn ein Bild nicht wie gewünscht ausfällt und Sie 10 Dinge in Ihrem Prompt ändern, können Sie nicht wissen, was es behoben hat. Ändern Sie ein Element nach dem anderen und iterieren Sie.
Fehler 6: Nur auf Textbeschreibung vertrauen
Wenn Sie ein Referenzbild im Kopf haben, nutzen Sie es. Tools wie ImageToPrompt können jedes Bild analysieren und die genauen Prompt-Elemente extrahieren, die seinen Stil definieren — die Sie dann für Ihr eigenes Projekt anpassen können.
Übungsaufgaben: 5 Prompts zum sofort Ausprobieren
Der beste Weg, Prompt-Schreiben zu verinnerlichen, ist zu üben. Hier sind fünf Übungen, die verschiedene Fähigkeiten trainieren:
Übung 1: Die Porträt-Challenge
Schreiben Sie einen Porträt-Prompt mit: einem Personentyp + einer Umgebung + einem Beleuchtungstyp + einem Stil. Generieren Sie ihn, identifizieren Sie, was Sie ändern würden, und iterieren Sie zweimal.
Übung 2: Der Stil-Tausch
Nehmen Sie das gleiche Motiv und generieren Sie es in 3 völlig unterschiedlichen Stilen. Beachten Sie, wie sehr der Stil allein das Gefühl verändert.
Übung 3: Die Beleuchtungsstudie
Nehmen Sie ein einfaches Motiv („a wooden table with a vase of flowers“) und generieren Sie es mit 5 verschiedenen Lichtbedingungen. Vergleichen Sie den emotionalen Unterschied.
Übung 4: Die Detail-Eskalation
Beginnen Sie mit einem 3-Wort-Prompt. Fügen Sie Elemente einzeln hinzu, generieren Sie nach jeder Ergänzung, bis Sie 8+ Elemente haben. Dokumentieren Sie, wie jede Ergänzung die Ausgabe verändert hat.
Übung 5: Das Reverse Engineering
Finden Sie online ein Bild, das Ihnen gefällt. Nutzen Sie ImageToPrompt, um seinen Prompt zu extrahieren. Studieren Sie den extrahierten Prompt, um zu verstehen, was dieses Bild besonders macht, und passen Sie ihn dann für ein anderes Motiv an.
Selbst ausprobieren
Laden Sie ein beliebiges Bild hoch und erhalten Sie in unter 10 Sekunden einen optimierten KI-Prompt. Kostenlos, kein Konto erforderlich.
Kostenlosen Bild-zu-Prompt-Generator testen →