Sie öffnen Midjourney zum ersten Mal, tippen «cooler Drache» ein und erhalten ein Ergebnis, das... okay ist. Generisch. Nichts, was auch nur annähernd dem entspricht, was Sie sich vorgestellt haben. Gleichzeitig tippt jemand anders einen ganzen Absatz spezifischer Beschreibungen ein und produziert etwas Atemberaubendes.
Der Unterschied ist Prompt Engineering — die Fähigkeit, klar und effektiv mit KI-Bildgeneratoren zu kommunizieren. Es ist keine Programmierung. Es ist keine Magie. Es ist ein erlernbares Handwerk, und dieser Leitfaden gibt Ihnen von Grund auf eine solide Basis.
Was ist ein Prompt?
Im Kontext der KI-Bildgenerierung ist ein Prompt die Textanweisung, die Sie einem KI-Modell geben, um ein Bild zu erzeugen. Die KI liest Ihren Text, interpretiert, was Sie meinen, und erzeugt Pixel, die versuchen, Ihrer Beschreibung zu entsprechen.
Die grundlegende Herausforderung: KI-Modelle werden mit Milliarden von Bildern und Beschriftungen trainiert. Sie haben Assoziationen zwischen Wörtern und visuellen Konzepten gelernt. Aber sie interpretieren Ihre Worte probabilistisch — jede Generierung ist leicht anders, und das Modell trifft unzählige Mikro-Entscheidungen darüber, was Sie «wirklich gemeint» haben.
Prompt Engineering ist die Praxis, Prompts so zu schreiben, dass diese Mikro-Entscheidungen in Richtung des Ergebnisses gelenkt werden, das Sie tatsächlich wollen.
Warum «Cooler Drache» nicht funktioniert
«Cooler Drache» ist maximal mehrdeutig. Die KI hat Tausende von Drachen gesehen, die als «cool» beschrieben wurden — westliche Drachen, östliche Drachen, Cartoon-Drachen, realistische Drachen, feuerspeiende Drachen, fliegende Drachen. Ohne zusätzliche Anleitung wählt sie etwas, das den Durchschnitt all dieser Bilder darstellt. Das Ergebnis wirkt generisch, weil es im Grunde genau das ist — der statistische Durchschnitt von «cooler Drache».
Je spezifischer Ihr Prompt, desto mehr hat die KI zu verarbeiten und desto markanter wird Ihr Ergebnis. Vergleichen Sie:
Schwach: cool dragon
Stark: ancient sea dragon emerging from stormy ocean waves at night, translucent teal scales catching moonlight, massive wingspan, serpentine body, bioluminescent markings, cinematic wide shot, dramatic lighting, dark fantasy concept art
Gleiches Motiv. Völlig verschiedene Ergebnisse.
Probieren Sie es selbst — laden Sie ein beliebiges Bild hoch und erhalten Sie in Sekunden einen optimierten KI-Prompt.
Kostenlos testen →So verändern einzelne Wörter alles
Die Kraft des Prompt Engineering wird am deutlichsten, wenn Sie genau ein Wort ändern und die Ergebnisse vergleichen. Hier sind fünf Paare, die zeigen, wie stark ein einzelner Begriff das Ergebnis beeinflusst.
cinematic portrait

editorial portrait

Cinematic drängt in Richtung dramatischer Filmbeleuchtung, tiefer Schatten und theatralischer Stimmung. Editorial signalisiert etwas Sauberes, Professionelles, Magazin-taugliches — typischerweise heller, kontrollierter, weniger atmosphärisch.
golden hour lighting

blue hour lighting

Golden Hour (kurz nach Sonnenaufgang oder vor Sonnenuntergang) erzeugt warmes Orange- und Bernsteinlicht mit langen Schatten. Blue Hour (kurz nach Sonnenuntergang) erzeugt weiches, kühles, diffuses Blaulicht mit fast keinen Schatten — ein völlig anderes emotionales Register.
oil painting

watercolor painting

Oil painting impliziert satte, gesättigte Farbe, sichtbare Pinselstriche und ein Gefühl von Gewicht und Dauerhaftigkeit. Watercolor impliziert weiche Kanten, transparente Lavierungen, hellere Töne und zarte Linien — leichter und flüchtiger im Eindruck.
wide angle shot

extreme close-up

Wide angle shot platziert Ihr Motiv im Kontext und zeigt die Umgebung. Extreme close-up eliminiert den Kontext vollständig und konzentriert sich auf ein einzelnes Detail. Diese sind kompositorische Gegensätze, die grundlegend verschiedene Bilder desselben Motivs erzeugen.
peaceful mood

ominous mood

Stimmungswörter beeinflussen Farbwahl, Lichtbehandlung und sogar den Gesichtsausdruck des Motivs. Peaceful tendiert zu weichem Licht, offenen Räumen und ruhigen Farben. Ominous tendiert zu gedämpfter Beleuchtung, tiefen Schatten und einem Gefühl der Bedrohung — selbst bei identischem Motiv.
Die fünf Säulen eines starken KI-Kunst-Prompts
1. Motiv — Was ist im Bild?
Das Motiv ist Ihr Ausgangspunkt: die Person, das Wesen, das Objekt oder die Szene, die Sie darstellen möchten. Seien Sie präzise:
- Schwach: «eine Frau»
- Stark: «eine japanische Kriegerin in ihren Dreißigern mit fein gearbeiteter zeremonieller Rüstung, stehend in einem Bambuswald»
Einbeziehen: physische Merkmale, Alter/Epoche, Kleidung, Ausdruck, Handlung, Beziehung zur Umgebung.
2. Stil — Wie soll es aussehen?
Der Stil gibt der KI an, in welchem künstlerischen oder fotografischen Register sie arbeiten soll. Ohne diese Angabe entscheidet die KI selbst — meist etwas zwischen fotorealistisch und Concept Art.
Verbreitete Stilkategorien:
- Fotografisch:
cinematic photography,editorial portrait,documentary photography,macro photography - Malerei:
oil painting,watercolor illustration,impressionist painting,digital painting - Illustration:
concept art,anime style,comic book illustration,children's book illustration - 3D/Rendering:
octane render,unreal engine 5,CGI animation
Sie können auch bestimmte Künstler referenzieren (ethisch verwenden) oder ein erkennbares visuelles Genre beschreiben wie «1980er-Science-Fiction-Coverkunst» oder «Jugendstil-Plakatdesign».
3. Beleuchtung — Was macht das Licht?
Beleuchtung ist wohl das wirkungsvollste Einzelelement für Stimmung und Qualität. KI-Generatoren sind überraschend gut darin, spezifische Beleuchtungsbeschreibungen zu interpretieren.
Wichtige Beleuchtungs-Deskriptoren:
- Richtung: front-lit, side-lit, backlit, top-lit, under-lit
- Qualität: soft diffused light, harsh direct light, dappled light
- Tageszeit: golden hour, blue hour, midday, overcast, night
- Typ: natural sunlight, studio lighting, neon lights, candlelight, bioluminescence, firelight
- Benannte Setups: Rembrandt lighting, butterfly lighting, chiaroscuro
Ein schlecht beleuchtetes Bild mit einem großartigen Motiv sieht trotzdem mittelmäßig aus. Gute Beleuchtung hebt alles.
4. Komposition — Wie ist es gerahmt?
Die Komposition sagt der KI, wie sie Elemente im Rahmen anordnen soll. Ohne Anleitung wählt die KI standardmäßig das, was in ihren Trainingsdaten am häufigsten war — meistens eine zentrierte, neutrale Rahmung.
Aufnahmetypen (aus Film/Fotografie entlehnt):
extreme close-up— füllt den Rahmen mit Detail (ein Auge, eine Textur, ein Mund)close-up portrait— Gesicht und Schulternmedium shot— bis zur Taillefull body shot— Motiv von Kopf bis Fußwide shot— Motiv in vollständiger Umgebungestablishing shot— große Umgebung, Motiv ist kleinaerial view/bird's eye view— Blick von oben nach untenworm's eye view— Blick von unten nach obenDutch angle— gekippte Kamera für Spannung
Kompositionstechniken:
rule of thirds— Motiv vom Zentrum versetztcentered composition— symmetrisch, formalleading lines— Umgebungselemente führen den Blickbokeh / shallow depth of field— unscharfer Hintergrunddeep focus— alles scharf
5. Stimmung und Atmosphäre — Wie soll es sich anfühlen?
Die Stimmung kommuniziert das emotionale Register. Sie beeinflusst Farbwahl, Lichtbehandlung und das Gesamtgefühl des Bildes, selbst wenn Sie nicht jedes Detail angeben.
Nützliche Stimmungs-Deskriptoren:
- Mysterious, ominous, eerie, unsettling
- Hopeful, warm, nostalgic, peaceful
- Epic, grand, awe-inspiring, majestic
- Melancholic, quiet, lonely, contemplative
- Tense, urgent, chaotic, energetic
- Magical, otherworldly, dreamlike, surreal
Anatomie eines professionellen Prompts
Sezieren wir einen kompletten professionellen Prompt und beschriften jede Komponente, um zu sehen, wie sie den fünf Säulen entspricht.
ancient sea dragon emerging from stormy ocean waves at night, dark fantasy concept art, digital painting, dramatic rim lighting, bioluminescent glow from below, deep navy blue and teal with warm orange accents, cinematic wide shot, low angle perspective, mysterious, awe-inspiring, powerful --ar 21:9 --v 6.1 --style raw --q 2
Jedes Element hat seine Daseinsberechtigung. Entfernen Sie «bioluminescent glow from below» und der Drache verliert seine übernatürliche Qualität. Entfernen Sie «low angle perspective» und das Gefühl für die Größe bricht zusammen. Professionelle Prompts sind nicht lang um der Länge willen — sie sind spezifisch, weil jeder Begriff Informationen hinzufügt, die die KI nutzen kann.
Qualitäts-Tokens: Die zuverlässigen Booster
Viele KI-Generatoren reagieren auf qualitätssignalisierende Begriffe, die dem Modell sagen, seine beste Ausgabe zu produzieren. Diese sind besonders wichtig in Stable Diffusion:
masterpiece,best quality,highly detailed8k resolution,ultra-high definitionsharp focus,professionalaward-winning photography
In Midjourney und Flux sind diese Tokens weniger notwendig, da diese Modelle bereits standardmäßig hohe Qualität anstreben. Aber in SD machen sie einen spürbaren Unterschied.
Negative Prompts: Was Sie nicht wollen
Stable Diffusion hat ein separates Negativ-Prompt-Feld, in dem Sie Elemente auflisten, die ausgeschlossen werden sollen. Dies ist eine der mächtigsten Funktionen von SD.
Ein Standard-Negativ-Prompt als Basis:
blurry, low quality, bad anatomy, deformed fingers, watermark, text, logo, cropped, out of frame, duplicate, ugly, amateur, jpeg artifacts
Fügen Sie modellspezifische Negative für Ihren Checkpoint hinzu. Für Porträt-Generierung immer einbeziehen: bad hands, missing fingers, extra fingers, fused fingers, mutated hands
Midjourney handhabt dies mit --no [Begriff] am Ende Ihres Prompts, obwohl es weniger mächtig ist als die SD-Implementierung.
Prompt-Vokabel-Spickzettel
Eine Referenztabelle der zuverlässigsten Prompt-Begriffe nach Kategorie. Speichern Sie diese als Lesezeichen und nutzen Sie sie als Ausgangspunkt beim Erstellen neuer Prompts.
| Kategorie | Nützliche Begriffe |
|---|---|
| Beleuchtung | golden hour, blue hour, rim light, backlit, Rembrandt lighting, volumetric light, neon light, candlelight, overcast, harsh shadow, soft diffused light, chiaroscuro, bioluminescent |
| Stil | cinematic, editorial, concept art, oil painting, watercolor, anime style, photorealistic, hyperrealistic, minimalist, surrealist, impressionist, Art Nouveau, dark fantasy, retrofuturism |
| Stimmung | ethereal, dramatic, serene, ominous, nostalgic, whimsical, melancholic, epic, cozy, unsettling, mysterious, triumphant, desolate, magical |
| Komposition | close-up portrait, wide shot, bird's eye view, Dutch angle, rule of thirds, centered symmetrical, leading lines, negative space, shallow depth of field, deep focus, extreme close-up, establishing shot |
| Farbe | warm tones, cool tones, muted palette, vibrant saturated, monochromatic, complementary colors, pastel, earth tones, jewel tones, high contrast, desaturated |
| Qualität (SD) | masterpiece, best quality, highly detailed, 8k resolution, ultra HD, sharp focus, professional, award-winning photography |
| Kamera / Objektiv | 85mm f/1.4, 24mm wide angle, macro lens, Canon EOS R5, Hasselblad, film grain, bokeh, tilt-shift, anamorphic lens flare, shallow depth of field |
Beobachten Sie die Entwicklung eines Prompts: Vom Einfachen zum Professionellen
Der effektivste Weg, Prompt Engineering zu verstehen, ist, einen einzelnen Prompt wachsen zu sehen — vom Vagen zum Präzisen. Jede Stufe fügt eine Informationsschicht hinzu.
Stufe 1 — Zu vage
a cat in a garden

Generisch. Die KI wählt den statistischen Durchschnitt von «Katze im Garten» — wahrscheinlich eine Hauskatze, wahrscheinlich tagsüber, wahrscheinlich grüner Rasen. Nichts Besonderes.
Stufe 2 — Spezifisches Motiv und Umgebung
a fluffy orange tabby cat sitting among wildflowers in an English cottage garden

Besser. Jetzt haben wir Rasse (orange Tabby), Fell (flauschig), Handlung (sitzend), spezifische Umgebung (Wildblumen, englischer Cottage-Garten). Aber wir haben noch keine künstlerische Richtung.
Stufe 3 — Stil hinzufügen
a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework

Jetzt hat es eine künstlerische Richtung. Die Stilwörter geben der KI ein visuelles Register. Das Motiv ist dasselbe, aber die Technik verwandelt es.
Stufe 4 — Beleuchtung hinzufügen
a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework, golden hour sunlight, dappled light filtering through trees, warm amber tones

Beleuchtung transformiert die Stimmung komplett. Die gleiche Szene wirkt jetzt warm, nostalgisch und idyllisch. Beleuchtung ist oft die wirkungsvollste Ergänzung, die Sie an einem Prompt vornehmen können.
Stufe 5 — Komposition und Parameter hinzufügen
a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework, golden hour sunlight, dappled light filtering through trees, warm amber tones, shallow depth of field, rule of thirds composition --ar 3:2 --v 6.1

Professionelles Ergebnis. Die Kompositionsbegriffe steuern den Bildausschnitt der KI. Das Seitenverhältnis passt zum beabsichtigten Verwendungszweck. Das gleiche Motiv wie in Stufe 1 — verwandelt durch fünf Schichten an Spezifizierung.
Prompt Engineering schnell lernen
Bestehende Prompts studieren
Websites wie PromptHero, Civitai und Lexica erlauben es Ihnen, KI-Kunst zusammen mit den Prompts zu durchstöbern, die sie erzeugt haben. Studieren Sie, welche Deskriptoren bestimmte Ergebnisse erzeugen. Suchen Sie nach Mustern in den Prompts hinter Bildern, die Ihnen gefallen.
Image-to-Prompt-Konvertierung nutzen
Eine der besten Lernmethoden ist die Analyse von Bildern, die Sie lieben. Laden Sie ein beliebiges Bild auf ImageToPrompt hoch und untersuchen Sie den generierten Prompt sorgfältig. Sie werden sehen, wie spezifische visuelle Qualitäten in Prompt-Sprache übersetzt werden. Tun Sie das mit 10–20 Bildern und Sie werden das Vokabular schnell verinnerlichen.
Immer nur eine Sache ändern
Beim Experimentieren ändern Sie zwischen den Generierungen nur ein Element. Wenn Sie fünf Dinge ändern und das Ergebnis sich verbessert, wissen Sie nicht, welche Änderung geholfen hat. Wenn Sie eine ändern, lernen Sie genau, was sie bewirkt.
Eine persönliche Prompt-Bibliothek aufbauen
Führen Sie ein Dokument mit Phrasen und Kombinationen, die gut für Sie funktionieren. «Golden hour backlit portrait» ist vielleicht etwas, das Sie in 30% Ihrer Prompts verwenden. Eine Bibliothek zuverlässiger Phrasen beschleunigt Ihren Workflow erheblich.
Der schnellste Weg zu guten Ergebnissen
Wenn Sie gerade anfangen und schnell gute Ergebnisse wollen, hier die Abkürzung:
- Finden Sie 3–5 Bilder, die den Stil repräsentieren, den Sie erstellen möchten
- Laden Sie jedes auf ImageToPrompt hoch, um den Prompt zu extrahieren
- Identifizieren Sie die gemeinsamen Elemente in diesen Prompts — das sind Ihre Stil-Anker
- Erstellen Sie Ihren eigenen Prompt unter Verwendung dieser Anker als Fundament
- Generieren, evaluieren und ein Element nach dem anderen anpassen
Dieser Ansatz überspringt Monate von Versuch und Irrtum, indem er Ihnen echtes Vokabular gibt, das in echten Prompts funktioniert und aus Bildern abgeleitet ist, die Ihnen tatsächlich gefallen.
3 Übungen zum sofortigen Ausprobieren
Über Prompt Engineering nur zu lesen reicht nicht. Diese Übungen bauen schnell echte Intuition auf.
Übung 1: Analysieren und Vergleichen
Laden Sie Ihr Lieblingsfoto auf ImageToPrompt hoch. Lesen Sie den generierten Prompt aufmerksam. Schließen Sie ihn dann und schreiben Sie von Grund auf Ihren eigenen Prompt für dasselbe Bild, ohne die KI-Ausgabe zu betrachten. Vergleichen Sie die beiden — was haben Sie übersehen? Was hat die KI übersehen? Die Lücken in beiden Richtungen lehren Sie mehr als jedes Tutorial.
Übung 2: Das Ein-Wort-Spiel
Nehmen Sie einen funktionierenden Prompt und ändern Sie genau ein Wort. Generieren Sie beide Versionen und vergleichen Sie. Tun Sie das 5-mal mit 5 verschiedenen Wörtern. Sie werden schnell lernen, welche Deskriptoren den größten visuellen Einfluss haben — und es wird Sie überraschen. Oft ist es ein Beleuchtungsbegriff oder ein einzelnes Stimmungswort, nicht die Motivbeschreibung, der den größten Unterschied macht.
Übung 3: Stilübertragung
Generieren Sie einen Prompt aus einer Landschaftsfotografie mit ImageToPrompt. Behalten Sie jetzt ALLE Stil-, Beleuchtungs-, Farb- und Stimmungswörter dieses Prompts bei — aber tauschen Sie das Motiv durch etwas völlig anderes aus (eine Person, ein Fahrzeug, ein Gebäude). Beobachten Sie, wie sich die visuelle Sprache überträgt. So bauen professionelle KI-Künstler einen konsistenten Stil über verschiedene Motive auf.
Lernen durch Analyse echter Bilder
Laden Sie ein beliebiges Bild auf ImageToPrompt hoch und sehen Sie genau, wie visuelle Qualitäten in Prompt-Sprache übersetzt werden. Der schnellste Weg, Prompt Engineering zu lernen.
Kostenlosen KI-Prompt-Generator testen →