Sie öffnen Midjourney zum ersten Mal, tippen «cooler Drache» und erhalten ein Ergebnis, das... in Ordnung ist. Generisch. Nichts, was auch nur annähernd dem entspricht, was Sie sich vorgestellt hatten. Gleichzeitig tippt jemand anderes einen ganzen Absatz spezifischer Beschreibungen ein und erzeugt etwas Atemberaubendes.
Der Unterschied ist Prompt Engineering — die Fähigkeit, klar und effektiv mit KI-Bildgeneratoren zu kommunizieren. Es ist keine Programmierung. Es ist keine Magie. Es ist ein erlernbares Handwerk, und dieser Leitfaden gibt Ihnen eine solide Grundlage von Anfang an.
Was ist ein Prompt?
Im Kontext der KI-Bildgenerierung ist ein Prompt die Textanweisung, die Sie einem KI-Modell geben, um ein Bild zu erzeugen. Die KI liest Ihren Text, interpretiert, was Sie meinen, und erzeugt Pixel, die versuchen, Ihrer Beschreibung zu entsprechen.
Die grundlegende Herausforderung: KI-Modelle wurden mit Milliarden von Bildern und Bildunterschriften trainiert. Sie haben Zusammenhänge zwischen Wörtern und visuellen Konzepten gelernt. Aber sie interpretieren Ihre Worte probabilistisch — jede Generierung ist leicht unterschiedlich, und das Modell trifft unzählige Mikro-Entscheidungen darüber, was Sie «wirklich meinten».
Prompt Engineering ist die Praxis, Prompts so zu schreiben, dass diese Mikro-Entscheidungen in Richtung des Ergebnisses gelenkt werden, das Sie tatsächlich wollen.
Warum «Cooler Drache» nicht funktioniert
«Cooler Drache» ist maximal mehrdeutig. Die KI hat Tausende von Drachen gesehen, die als «cool» beschrieben wurden — westliche Drachen, östliche Drachen, Cartoon-Drachen, realistische Drachen, feuerspeiende Drachen, fliegende Drachen. Ohne zusätzliche Orientierung wählt sie etwas, das den Durchschnitt all dessen darstellt. Das Ergebnis wirkt generisch, weil es im Grunde genau das ist — der statistische Durchschnitt von «cooler Drache».
Je spezifischer Ihr Prompt ist, desto mehr hat die KI zum Arbeiten, und desto unverwechselbarer wird Ihr Ergebnis. Vergleichen Sie:
Schwach: cool dragon
Stark: ancient sea dragon emerging from stormy ocean waves at night, translucent teal scales catching moonlight, massive wingspan, serpentine body, bioluminescent markings, cinematic wide shot, dramatic lighting, dark fantasy concept art
Gleiches Motiv. Sehr unterschiedliche Ergebnisse.
Probieren Sie es selbst — laden Sie ein beliebiges Bild hoch und erhalten Sie in Sekunden einen optimierten KI-Prompt.
Kostenlos testen →Den Unterschied sehen: Wie einzelne Wörter alles verändern
Die Kraft des Prompt Engineering wird am deutlichsten, wenn Sie genau ein Wort ändern und die Ergebnisse vergleichen. Hier sind fünf Paare, die zeigen, wie sehr ein einzelner Begriff das Ergebnis beeinflusst.
cinematic portrait

editorial portrait

Cinematic lenkt in Richtung dramatischer Filmbeleuchtung, tiefer Schatten und theatralischer Stimmung. Editorial signalisiert etwas Sauberes, Professionelles, Magazinreifes — in der Regel heller, kontrollierter, weniger atmosphärisch.
golden hour lighting

blue hour lighting

Golden Hour (kurz nach Sonnenaufgang oder vor Sonnenuntergang) erzeugt warmes orange-bernsteinfarbenes Licht mit langen Schatten. Blue Hour (kurz nach Sonnenuntergang) erzeugt weiches, kühles, diffuses blaues Licht fast ohne Schatten — ein völlig anderes emotionales Register.
oil painting

watercolor painting

Oil painting impliziert satte, gesättigte Farben, sichtbare Pinselstriche und ein Gefühl von Gewicht und Beständigkeit. Watercolor impliziert weiche Kanten, transparente Lavierungen, hellere Töne und zarte Linienführung — leichter und flüchtiger im Gesamteindruck.
wide angle shot

extreme close-up

Wide angle shot platziert Ihr Motiv im Kontext und zeigt die Umgebung. Extreme close-up eliminiert den Kontext vollständig und fokussiert auf ein einzelnes Detail. Das sind kompositorische Gegensätze, die bei gleichem Motiv grundlegend unterschiedliche Bilder erzeugen.
peaceful mood

ominous mood

Stimmungswörter beeinflussen Farbwahl, Lichtbehandlung und sogar den Ausdruck des Motivs. Peaceful tendiert zu weichem Licht, offenen Räumen und ruhigen Farben. Ominous tendiert zu dunkler Beleuchtung, tiefen Schatten und einem Gefühl der Bedrohung — selbst bei identischem Motiv.
Die fünf Säulen eines starken KI-Kunst-Prompts
1. Motiv — Was ist im Bild?
Das Motiv ist Ihr Ausgangspunkt: die Person, das Wesen, das Objekt oder die Szene, die Sie darstellen möchten. Seien Sie präzise:
- Schwach: «eine Frau»
- Stark: «eine japanische Kriegerin in ihren Dreißigern, die aufwendig gearbeitete zeremonielle Rüstung trägt und in einem Bambuswald steht»
Berücksichtigen Sie: physische Merkmale, Alter/Epoche, Kleidung, Ausdruck, Handlung, Beziehung zur Umgebung.
2. Stil — Wie soll es aussehen?
Der Stil teilt der KI mit, in welchem künstlerischen oder fotografischen Register sie arbeiten soll. Ohne diese Angabe entscheidet die KI selbst — üblicherweise etwas zwischen fotorealistisch und Concept Art.
Gängige Stilkategorien:
- Fotografisch:
cinematic photography,editorial portrait,documentary photography,macro photography - Malerei:
oil painting,watercolor illustration,impressionist painting,digital painting - Illustration:
concept art,anime style,comic book illustration,children's book illustration - 3D/Rendering:
octane render,unreal engine 5,CGI animation
Sie können auch bestimmte Künstler referenzieren (ethisch korrekt verwenden) oder ein erkennbares visuelles Genre beschreiben wie «Science-Fiction-Buchcover-Kunst der 1980er Jahre» oder «Art-Nouveau-Plakatdesign».
3. Beleuchtung — Was macht das Licht?
Beleuchtung ist wohl das mächtigste Element für Stimmung und Qualität. KI-Generatoren sind überraschend gut darin, spezifische Lichtbeschreibungen zu interpretieren.
Wichtige Beleuchtungs-Deskriptoren:
- Richtung: Frontlicht, Seitenlicht, Gegenlicht, Oberlicht, Unterlicht
- Qualität: weiches diffuses Licht, hartes direktes Licht, geflecktes Licht
- Tageszeit: Golden Hour, Blue Hour, Mittagssonne, bewölkt, Nacht
- Typ: natürliches Sonnenlicht, Studiobeleuchtung, Neonlichter, Kerzenlicht, Biolumineszenz, Feuerschein
- Benannte Licht-Setups: Rembrandt-Beleuchtung, Schmetterlings-Beleuchtung, Chiaroscuro
Ein schlecht beleuchtetes Bild mit einem großartigen Motiv wirkt trotzdem mittelmäßig. Eine gute Beleuchtung hebt alles auf ein höheres Niveau.
4. Komposition — Wie ist es gerahmt?
Die Komposition teilt der KI mit, wie sie Elemente innerhalb des Bildausschnitts anordnen soll. Ohne Anleitung wählt die KI standardmäßig das, was in ihren Trainingsdaten am häufigsten vorkam — üblicherweise ein zentrierter, neutraler Bildausschnitt.
Einstellungsgrößen (aus Film/Fotografie entlehnt):
extreme close-up— füllt den Rahmen mit einem Detail (ein Auge, eine Textur, ein Mund)close-up portrait— Gesicht und Schulternmedium shot— bis zur Taillefull body shot— Motiv von Kopf bis Fußwide shot— Motiv in voller Umgebungestablishing shot— große Umgebung, Motiv ist kleinaerial view/bird's eye view— Blick von oben nach untenworm's eye view— Blick von unten nach obenDutch angle— geneigte Kamera für Spannung
Kompositionstechniken:
rule of thirds— Motiv versetzt vom Zentrumcentered composition— symmetrisch, formalleading lines— Umgebungselemente führen den Blickbokeh / shallow depth of field— unscharfer Hintergrunddeep focus— alles scharf
5. Stimmung und Atmosphäre — Wie soll es sich anfühlen?
Die Stimmung kommuniziert das emotionale Register. Sie beeinflusst Farbwahl, Lichtbehandlung und das Gesamtgefühl des Bildes, selbst wenn Sie nicht jedes Detail angeben.
Nützliche Stimmungs-Deskriptoren:
- Geheimnisvoll, unheimlich, beunruhigend, verstörend
- Hoffnungsvoll, warm, nostalgisch, friedlich
- Episch, großartig, ehrfurchtgebietend, majestätisch
- Melancholisch, still, einsam, kontemplativ
- Angespannt, dringend, chaotisch, energisch
- Magisch, überirdisch, traumhaft, surreal
Anatomie eines professionellen Prompts
Sezieren wir einen vollständigen professionellen Prompt und kennzeichnen jede Komponente, um genau zu sehen, wie sie den fünf Säulen entspricht.
ancient sea dragon emerging from stormy ocean waves at night, dark fantasy concept art, digital painting, dramatic rim lighting, bioluminescent glow from below, deep navy blue and teal with warm orange accents, cinematic wide shot, low angle perspective, mysterious, awe-inspiring, powerful --ar 21:9 --v 6.1 --style raw --q 2
Jedes Element hat seine Berechtigung. Entfernen Sie «bioluminescent glow from below» und der Drache verliert seine übernatürliche Qualität. Entfernen Sie «low angle perspective» und das Gefühl für die Größe bricht zusammen. Professionelle Prompts sind nicht lang um der Länge willen — sie sind spezifisch, weil jeder Begriff Informationen hinzufügt, die die KI nutzen kann.
Qualitäts-Tags: Die zuverlässigen Verstärker
Viele KI-Generatoren reagieren auf qualitätssignalisierende Begriffe, die dem Modell mitteilen, sein bestes Ergebnis zu produzieren. Diese sind besonders wichtig in Stable Diffusion:
masterpiece,best quality,highly detailed8k resolution,ultra-high definitionsharp focus,professionalaward-winning photography
In Midjourney und Flux sind diese Tags weniger notwendig, da diese Modelle standardmäßig bereits auf hohe Qualität abzielen. In SD machen sie jedoch einen spürbaren Unterschied.
Negative Prompts: Was Sie nicht wollen
Stable Diffusion verfügt über ein separates Negativ-Prompt-Feld, in dem Sie Elemente auflisten, die Sie ausschließen möchten. Dies ist eine der leistungsstärksten Funktionen von SD.
Ein standardmäßiger negativer Basis-Prompt:
blurry, low quality, bad anatomy, deformed fingers, watermark, text, logo, cropped, out of frame, duplicate, ugly, amateur, jpeg artifacts
Fügen Sie modellspezifische Negativbegriffe für Ihren Checkpoint hinzu. Für Portraitgenerierung immer einschließen: bad hands, missing fingers, extra fingers, fused fingers, mutated hands
Midjourney handhabt dies mit --no [Begriff] am Ende Ihres Prompts, obwohl dies weniger mächtig ist als die SD-Implementierung.
Prompt-Vokabel-Spickzettel
Eine Referenztabelle der zuverlässigsten Prompt-Begriffe nach Kategorie. Setzen Sie ein Lesezeichen und nutzen Sie sie als Ausgangspunkt beim Erstellen neuer Prompts.
| Kategorie | Nützliche Begriffe |
|---|---|
| Beleuchtung | golden hour, blue hour, rim light, backlit, Rembrandt lighting, volumetric light, neon light, candlelight, overcast, harsh shadow, soft diffused light, chiaroscuro, bioluminescent |
| Stil | cinematic, editorial, concept art, oil painting, watercolor, anime style, photorealistic, hyperrealistic, minimalist, surrealist, impressionist, Art Nouveau, dark fantasy, retrofuturism |
| Stimmung | ethereal, dramatic, serene, ominous, nostalgic, whimsical, melancholic, epic, cozy, unsettling, mysterious, triumphant, desolate, magical |
| Komposition | close-up portrait, wide shot, bird's eye view, Dutch angle, rule of thirds, centered symmetrical, leading lines, negative space, shallow depth of field, deep focus, extreme close-up, establishing shot |
| Farbe | warm tones, cool tones, muted palette, vibrant saturated, monochromatic, complementary colors, pastel, earth tones, jewel tones, high contrast, desaturated |
| Qualität (SD) | masterpiece, best quality, highly detailed, 8k resolution, ultra HD, sharp focus, professional, award-winning photography |
| Kamera / Objektiv | 85mm f/1.4, 24mm wide angle, macro lens, Canon EOS R5, Hasselblad, film grain, bokeh, tilt-shift, anamorphic lens flare, shallow depth of field |
Einen Prompt entwickeln sehen: Vom Einfachen zum Professionellen
Der effektivste Weg, Prompt Engineering zu verstehen, ist zuzusehen, wie ein einzelner Prompt von vage zu präzise wächst. Jede Stufe fügt eine Informationsschicht hinzu.
Stufe 1 — Zu vage
a cat in a garden

Generisch. Die KI wählt den statistischen Durchschnitt von «Katze im Garten» — wahrscheinlich eine Hauskatze, wahrscheinlich bei Tageslicht, wahrscheinlich grüner Rasen. Nichts Besonderes.
Stufe 2 — Spezifisches Motiv und Umgebung
a fluffy orange tabby cat sitting among wildflowers in an English cottage garden

Besser. Jetzt haben wir die Rasse (orange Tabby), das Fell (flauschig), die Handlung (sitzend), die spezifische Umgebung (Wildblumen, englischer Cottage-Garten). Aber wir haben immer noch keine künstlerische Richtung.
Stufe 3 — Stil hinzufügen
a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework

Jetzt hat es eine künstlerische Richtung. Die Stilwörter geben der KI ein visuelles Register vor. Das Motiv ist dasselbe, aber die Technik verwandelt es.
Stufe 4 — Beleuchtung hinzufügen
a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework, golden hour sunlight, dappled light filtering through trees, warm amber tones

Die Beleuchtung verwandelt die Stimmung vollständig. Dieselbe Szene wirkt jetzt warm, nostalgisch und idyllisch. Beleuchtung ist oft die wirkungsvollste Ergänzung, die Sie an einem Prompt vornehmen können.
Stufe 5 — Komposition und Parameter hinzufügen
a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework, golden hour sunlight, dappled light filtering through trees, warm amber tones, shallow depth of field, rule of thirds composition --ar 3:2 --v 6.1

Professionelles Ergebnis. Die Kompositionsbegriffe lenken den Bildausschnitt der KI. Das Seitenverhältnis passt zum beabsichtigten Verwendungszweck. Es ist dasselbe Motiv wie in Stufe 1 — verwandelt durch fünf Schichten an Spezifizierung.
Prompt Engineering schnell lernen
Bestehende Prompts studieren
Websites wie PromptHero, Civitai und Lexica ermöglichen es Ihnen, KI-Kunst zusammen mit den Prompts zu durchstöbern, die sie erzeugt haben. Studieren Sie, welche Deskriptoren bestimmte Ergebnisse produzieren. Suchen Sie nach Mustern in den Prompts hinter Bildern, die Ihnen gefallen.
Bild-zu-Prompt-Konvertierung nutzen
Eine der besten Möglichkeiten zu lernen, ist die Analyse von Bildern, die Sie lieben. Laden Sie ein beliebiges Bild bei ImageToPrompt hoch und untersuchen Sie den generierten Prompt sorgfältig. Sie werden sehen, wie sich spezifische visuelle Qualitäten in Prompt-Sprache übersetzen. Machen Sie das mit 10 bis 20 Bildern und Sie werden das Vokabular schnell verinnerlichen.
Immer nur eine Sache ändern
Beim Experimentieren ändern Sie nur ein Element zwischen den Generierungen. Wenn Sie fünf Dinge ändern und das Ergebnis sich verbessert, wissen Sie nicht, welche Änderung geholfen hat. Wenn Sie nur eines ändern, lernen Sie genau, was es bewirkt.
Eine persönliche Prompt-Bibliothek aufbauen
Führen Sie ein Dokument mit Phrasen und Kombinationen, die gut für Sie funktionieren. «Golden hour backlit portrait» ist vielleicht etwas, das Sie in 30% Ihrer Prompts verwenden. Eine Bibliothek zuverlässiger Phrasen beschleunigt Ihren Workflow erheblich. Oder überspringen Sie das manuelle Schreiben von Prompts — nutzen Sie unseren Text-zu-Prompt-Generator, um jede Beschreibung sofort zu verbessern.
Der schnellste Weg zu guten Ergebnissen
Wenn Sie gerade erst anfangen und schnell gute Ergebnisse wollen, hier die Abkürzung:
- Finden Sie 3 bis 5 Bilder, die den Stil repräsentieren, den Sie erstellen möchten
- Laden Sie jedes auf ImageToPrompt hoch, um den Prompt zu extrahieren
- Identifizieren Sie die gemeinsamen Elemente in diesen Prompts — das sind Ihre Stil-Anker
- Erstellen Sie Ihren eigenen Prompt mit diesen Ankern als Grundlage
- Generieren, bewerten und passen Sie jeweils ein Element an
Dieser Ansatz überspringt monatelanges Ausprobieren, indem er Ihnen echtes Vokabular gibt, das in echten Prompts funktioniert — abgeleitet von Bildern, die Sie tatsächlich mögen.
3 Übungen zum Sofort-Ausprobieren
Über Prompt Engineering zu lesen, bringt Sie nur bedingt weiter. Diese Übungen bauen schnell echte Intuition auf.
Übung 1: Analysieren und Vergleichen
Laden Sie Ihr Lieblingsfoto bei ImageToPrompt hoch. Lesen Sie den generierten Prompt aufmerksam. Schließen Sie ihn dann und schreiben Sie Ihren eigenen Prompt für dasselbe Bild von Grund auf, ohne das KI-Ergebnis anzusehen. Vergleichen Sie die beiden — was haben Sie übersehen? Was hat die KI übersehen? Die Lücken in beiden Richtungen lehren Sie mehr als jedes Tutorial.
Übung 2: Das Ein-Wort-Spiel
Nehmen Sie einen funktionierenden Prompt und ändern Sie genau ein Wort. Generieren Sie beide Versionen und vergleichen Sie. Machen Sie das 5 Mal mit 5 verschiedenen Wörtern. Sie werden schnell lernen, welche Deskriptoren den größten visuellen Einfluss haben — und es wird Sie überraschen. Oft ist es ein Beleuchtungsbegriff oder ein einzelnes Stimmungswort, nicht die Motivbeschreibung, das den größten Unterschied macht.
Übung 3: Stilübertragung
Generieren Sie einen Prompt aus einem Landschaftsfoto mit ImageToPrompt. Behalten Sie nun ALLE Stil-, Beleuchtungs-, Farb- und Stimmungswörter aus diesem Prompt bei — aber ersetzen Sie das Motiv durch etwas völlig anderes (eine Person, ein Fahrzeug, ein Gebäude). Beobachten Sie, wie sich die visuelle Sprache überträgt. So bauen professionelle KI-Künstler einen konsistenten Stil über verschiedene Motive hinweg auf.
Lernen Sie durch die Analyse echter Bilder
Laden Sie ein beliebiges Bild bei ImageToPrompt hoch und sehen Sie genau, wie visuelle Qualitäten in Prompt-Sprache übersetzt werden. Der schnellste Weg, Prompt Engineering zu lernen.
Kostenlosen Bild-zu-Prompt-Generator testen →