Sie öffnen Midjourney zum ersten Mal, tippen «cooler Drache» und erhalten ein Ergebnis, das... in Ordnung ist. Generisch. Nichts, was auch nur annähernd dem entspricht, was Sie sich vorgestellt hatten. Gleichzeitig tippt jemand anderes einen ganzen Absatz spezifischer Beschreibungen ein und erzeugt etwas Atemberaubendes.

Der Unterschied ist Prompt Engineering — die Fähigkeit, klar und effektiv mit KI-Bildgeneratoren zu kommunizieren. Es ist keine Programmierung. Es ist keine Magie. Es ist ein erlernbares Handwerk, und dieser Leitfaden gibt Ihnen eine solide Grundlage von Anfang an.

Was ist ein Prompt?

Im Kontext der KI-Bildgenerierung ist ein Prompt die Textanweisung, die Sie einem KI-Modell geben, um ein Bild zu erzeugen. Die KI liest Ihren Text, interpretiert, was Sie meinen, und erzeugt Pixel, die versuchen, Ihrer Beschreibung zu entsprechen.

Die grundlegende Herausforderung: KI-Modelle wurden mit Milliarden von Bildern und Bildunterschriften trainiert. Sie haben Zusammenhänge zwischen Wörtern und visuellen Konzepten gelernt. Aber sie interpretieren Ihre Worte probabilistisch — jede Generierung ist leicht unterschiedlich, und das Modell trifft unzählige Mikro-Entscheidungen darüber, was Sie «wirklich meinten».

Prompt Engineering ist die Praxis, Prompts so zu schreiben, dass diese Mikro-Entscheidungen in Richtung des Ergebnisses gelenkt werden, das Sie tatsächlich wollen.

Warum «Cooler Drache» nicht funktioniert

«Cooler Drache» ist maximal mehrdeutig. Die KI hat Tausende von Drachen gesehen, die als «cool» beschrieben wurden — westliche Drachen, östliche Drachen, Cartoon-Drachen, realistische Drachen, feuerspeiende Drachen, fliegende Drachen. Ohne zusätzliche Orientierung wählt sie etwas, das den Durchschnitt all dessen darstellt. Das Ergebnis wirkt generisch, weil es im Grunde genau das ist — der statistische Durchschnitt von «cooler Drache».

Je spezifischer Ihr Prompt ist, desto mehr hat die KI zum Arbeiten, und desto unverwechselbarer wird Ihr Ergebnis. Vergleichen Sie:

Schwach: cool dragon

Stark: ancient sea dragon emerging from stormy ocean waves at night, translucent teal scales catching moonlight, massive wingspan, serpentine body, bioluminescent markings, cinematic wide shot, dramatic lighting, dark fantasy concept art

Gleiches Motiv. Sehr unterschiedliche Ergebnisse.

Probieren Sie es selbst — laden Sie ein beliebiges Bild hoch und erhalten Sie in Sekunden einen optimierten KI-Prompt.

Kostenlos testen →

Den Unterschied sehen: Wie einzelne Wörter alles verändern

Die Kraft des Prompt Engineering wird am deutlichsten, wenn Sie genau ein Wort ändern und die Ergebnisse vergleichen. Hier sind fünf Paare, die zeigen, wie sehr ein einzelner Begriff das Ergebnis beeinflusst.

cinematic portrait Cinematic Portrait — dramatische filmartige Beleuchtung und Stimmung für KI-Kunst-Prompt-Vergleich
VS
editorial portrait Editorial Portrait — sauberer professioneller magazinreifer Stil, Ein-Wort-Änderung im KI-Prompt

Cinematic lenkt in Richtung dramatischer Filmbeleuchtung, tiefer Schatten und theatralischer Stimmung. Editorial signalisiert etwas Sauberes, Professionelles, Magazinreifes — in der Regel heller, kontrollierter, weniger atmosphärisch.

golden hour lighting Golden-Hour-Beleuchtung — warme orange-bernsteinfarbene Töne bei Sonnenuntergang, Prompt-Engineering-Beispiel
VS
blue hour lighting Blue-Hour-Beleuchtung — kühle weiche Blautöne in der Dämmerung, Ein-Wort-Prompt-Änderung

Golden Hour (kurz nach Sonnenaufgang oder vor Sonnenuntergang) erzeugt warmes orange-bernsteinfarbenes Licht mit langen Schatten. Blue Hour (kurz nach Sonnenuntergang) erzeugt weiches, kühles, diffuses blaues Licht fast ohne Schatten — ein völlig anderes emotionales Register.

oil painting Ölgemälde-KI-Kunststil — satte gesättigte Farben mit sichtbarer Pinselstrichtextur
VS
watercolor painting Aquarell-KI-Kunststil — weiche Kanten und transparente Lavierungen, Prompt-Wort-Vergleich

Oil painting impliziert satte, gesättigte Farben, sichtbare Pinselstriche und ein Gefühl von Gewicht und Beständigkeit. Watercolor impliziert weiche Kanten, transparente Lavierungen, hellere Töne und zarte Linienführung — leichter und flüchtiger im Gesamteindruck.

wide angle shot Weitwinkelaufnahme — Motiv im vollen Umgebungskontext gezeigt, Kompositions-Prompt-Wort
VS
extreme close-up Extreme Nahaufnahme — Detail füllt das gesamte Bild, Ein-Wort-Prompt-Änderung

Wide angle shot platziert Ihr Motiv im Kontext und zeigt die Umgebung. Extreme close-up eliminiert den Kontext vollständig und fokussiert auf ein einzelnes Detail. Das sind kompositorische Gegensätze, die bei gleichem Motiv grundlegend unterschiedliche Bilder erzeugen.

peaceful mood Friedliche Stimmung in KI-Kunst — ruhige gelassene Szene mit weichem Licht, Stimmungswort-Prompt-Beispiel
VS
ominous mood Unheimliche Stimmung in KI-Kunst — dunkle bedrohliche Szene, Prompt-Wort-Effekt

Stimmungswörter beeinflussen Farbwahl, Lichtbehandlung und sogar den Ausdruck des Motivs. Peaceful tendiert zu weichem Licht, offenen Räumen und ruhigen Farben. Ominous tendiert zu dunkler Beleuchtung, tiefen Schatten und einem Gefühl der Bedrohung — selbst bei identischem Motiv.

Die fünf Säulen eines starken KI-Kunst-Prompts

1. Motiv — Was ist im Bild?

Das Motiv ist Ihr Ausgangspunkt: die Person, das Wesen, das Objekt oder die Szene, die Sie darstellen möchten. Seien Sie präzise:

Berücksichtigen Sie: physische Merkmale, Alter/Epoche, Kleidung, Ausdruck, Handlung, Beziehung zur Umgebung.

2. Stil — Wie soll es aussehen?

Der Stil teilt der KI mit, in welchem künstlerischen oder fotografischen Register sie arbeiten soll. Ohne diese Angabe entscheidet die KI selbst — üblicherweise etwas zwischen fotorealistisch und Concept Art.

Gängige Stilkategorien:

Sie können auch bestimmte Künstler referenzieren (ethisch korrekt verwenden) oder ein erkennbares visuelles Genre beschreiben wie «Science-Fiction-Buchcover-Kunst der 1980er Jahre» oder «Art-Nouveau-Plakatdesign».

3. Beleuchtung — Was macht das Licht?

Beleuchtung ist wohl das mächtigste Element für Stimmung und Qualität. KI-Generatoren sind überraschend gut darin, spezifische Lichtbeschreibungen zu interpretieren.

Wichtige Beleuchtungs-Deskriptoren:

Ein schlecht beleuchtetes Bild mit einem großartigen Motiv wirkt trotzdem mittelmäßig. Eine gute Beleuchtung hebt alles auf ein höheres Niveau.

4. Komposition — Wie ist es gerahmt?

Die Komposition teilt der KI mit, wie sie Elemente innerhalb des Bildausschnitts anordnen soll. Ohne Anleitung wählt die KI standardmäßig das, was in ihren Trainingsdaten am häufigsten vorkam — üblicherweise ein zentrierter, neutraler Bildausschnitt.

Einstellungsgrößen (aus Film/Fotografie entlehnt):

Kompositionstechniken:

5. Stimmung und Atmosphäre — Wie soll es sich anfühlen?

Die Stimmung kommuniziert das emotionale Register. Sie beeinflusst Farbwahl, Lichtbehandlung und das Gesamtgefühl des Bildes, selbst wenn Sie nicht jedes Detail angeben.

Nützliche Stimmungs-Deskriptoren:

Anatomie eines professionellen Prompts

Sezieren wir einen vollständigen professionellen Prompt und kennzeichnen jede Komponente, um genau zu sehen, wie sie den fünf Säulen entspricht.

ancient sea dragon emerging from stormy ocean waves at night, dark fantasy concept art, digital painting, dramatic rim lighting, bioluminescent glow from below, deep navy blue and teal with warm orange accents, cinematic wide shot, low angle perspective, mysterious, awe-inspiring, powerful --ar 21:9 --v 6.1 --style raw --q 2

Motiv Stil Beleuchtung Farbe Komposition Stimmung Parameter

Jedes Element hat seine Berechtigung. Entfernen Sie «bioluminescent glow from below» und der Drache verliert seine übernatürliche Qualität. Entfernen Sie «low angle perspective» und das Gefühl für die Größe bricht zusammen. Professionelle Prompts sind nicht lang um der Länge willen — sie sind spezifisch, weil jeder Begriff Informationen hinzufügt, die die KI nutzen kann.

Qualitäts-Tags: Die zuverlässigen Verstärker

Viele KI-Generatoren reagieren auf qualitätssignalisierende Begriffe, die dem Modell mitteilen, sein bestes Ergebnis zu produzieren. Diese sind besonders wichtig in Stable Diffusion:

In Midjourney und Flux sind diese Tags weniger notwendig, da diese Modelle standardmäßig bereits auf hohe Qualität abzielen. In SD machen sie jedoch einen spürbaren Unterschied.

Negative Prompts: Was Sie nicht wollen

Stable Diffusion verfügt über ein separates Negativ-Prompt-Feld, in dem Sie Elemente auflisten, die Sie ausschließen möchten. Dies ist eine der leistungsstärksten Funktionen von SD.

Ein standardmäßiger negativer Basis-Prompt:

blurry, low quality, bad anatomy, deformed fingers, watermark, text, logo, cropped, out of frame, duplicate, ugly, amateur, jpeg artifacts

Fügen Sie modellspezifische Negativbegriffe für Ihren Checkpoint hinzu. Für Portraitgenerierung immer einschließen: bad hands, missing fingers, extra fingers, fused fingers, mutated hands

Midjourney handhabt dies mit --no [Begriff] am Ende Ihres Prompts, obwohl dies weniger mächtig ist als die SD-Implementierung.

Prompt-Vokabel-Spickzettel

Eine Referenztabelle der zuverlässigsten Prompt-Begriffe nach Kategorie. Setzen Sie ein Lesezeichen und nutzen Sie sie als Ausgangspunkt beim Erstellen neuer Prompts.

KategorieNützliche Begriffe
Beleuchtunggolden hour, blue hour, rim light, backlit, Rembrandt lighting, volumetric light, neon light, candlelight, overcast, harsh shadow, soft diffused light, chiaroscuro, bioluminescent
Stilcinematic, editorial, concept art, oil painting, watercolor, anime style, photorealistic, hyperrealistic, minimalist, surrealist, impressionist, Art Nouveau, dark fantasy, retrofuturism
Stimmungethereal, dramatic, serene, ominous, nostalgic, whimsical, melancholic, epic, cozy, unsettling, mysterious, triumphant, desolate, magical
Kompositionclose-up portrait, wide shot, bird's eye view, Dutch angle, rule of thirds, centered symmetrical, leading lines, negative space, shallow depth of field, deep focus, extreme close-up, establishing shot
Farbewarm tones, cool tones, muted palette, vibrant saturated, monochromatic, complementary colors, pastel, earth tones, jewel tones, high contrast, desaturated
Qualität (SD)masterpiece, best quality, highly detailed, 8k resolution, ultra HD, sharp focus, professional, award-winning photography
Kamera / Objektiv85mm f/1.4, 24mm wide angle, macro lens, Canon EOS R5, Hasselblad, film grain, bokeh, tilt-shift, anamorphic lens flare, shallow depth of field

Einen Prompt entwickeln sehen: Vom Einfachen zum Professionellen

Der effektivste Weg, Prompt Engineering zu verstehen, ist zuzusehen, wie ein einzelner Prompt von vage zu präzise wächst. Jede Stufe fügt eine Informationsschicht hinzu.

1

Stufe 1 — Zu vage

a cat in a garden
Ergebnis Stufe 1: generische Katze im Garten — vager KI-Prompt erzeugt durchschnittliches Ergebnis

Generisch. Die KI wählt den statistischen Durchschnitt von «Katze im Garten» — wahrscheinlich eine Hauskatze, wahrscheinlich bei Tageslicht, wahrscheinlich grüner Rasen. Nichts Besonderes.

2

Stufe 2 — Spezifisches Motiv und Umgebung

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden
Ergebnis Stufe 2: flauschige orangefarbene Tabby-Katze im englischen Cottage-Garten mit Wildblumen

Besser. Jetzt haben wir die Rasse (orange Tabby), das Fell (flauschig), die Handlung (sitzend), die spezifische Umgebung (Wildblumen, englischer Cottage-Garten). Aber wir haben immer noch keine künstlerische Richtung.

3

Stufe 3 — Stil hinzufügen

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework
Ergebnis Stufe 3: Aquarell-Illustrationsstil einer Tabby im Cottage-Garten

Jetzt hat es eine künstlerische Richtung. Die Stilwörter geben der KI ein visuelles Register vor. Das Motiv ist dasselbe, aber die Technik verwandelt es.

4

Stufe 4 — Beleuchtung hinzufügen

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework, golden hour sunlight, dappled light filtering through trees, warm amber tones
Ergebnis Stufe 4: Aquarell-Katze im Garten mit Golden-Hour-Licht und warmen Bernsteintönen

Die Beleuchtung verwandelt die Stimmung vollständig. Dieselbe Szene wirkt jetzt warm, nostalgisch und idyllisch. Beleuchtung ist oft die wirkungsvollste Ergänzung, die Sie an einem Prompt vornehmen können.

5

Stufe 5 — Komposition und Parameter hinzufügen

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework, golden hour sunlight, dappled light filtering through trees, warm amber tones, shallow depth of field, rule of thirds composition --ar 3:2 --v 6.1
Ergebnis Stufe 5: professionelles Aquarell-Katzenportrait mit Drittelregel-Komposition und geringer Schärfentiefe

Professionelles Ergebnis. Die Kompositionsbegriffe lenken den Bildausschnitt der KI. Das Seitenverhältnis passt zum beabsichtigten Verwendungszweck. Es ist dasselbe Motiv wie in Stufe 1 — verwandelt durch fünf Schichten an Spezifizierung.

Prompt Engineering schnell lernen

Bestehende Prompts studieren

Websites wie PromptHero, Civitai und Lexica ermöglichen es Ihnen, KI-Kunst zusammen mit den Prompts zu durchstöbern, die sie erzeugt haben. Studieren Sie, welche Deskriptoren bestimmte Ergebnisse produzieren. Suchen Sie nach Mustern in den Prompts hinter Bildern, die Ihnen gefallen.

Bild-zu-Prompt-Konvertierung nutzen

Eine der besten Möglichkeiten zu lernen, ist die Analyse von Bildern, die Sie lieben. Laden Sie ein beliebiges Bild bei ImageToPrompt hoch und untersuchen Sie den generierten Prompt sorgfältig. Sie werden sehen, wie sich spezifische visuelle Qualitäten in Prompt-Sprache übersetzen. Machen Sie das mit 10 bis 20 Bildern und Sie werden das Vokabular schnell verinnerlichen.

Immer nur eine Sache ändern

Beim Experimentieren ändern Sie nur ein Element zwischen den Generierungen. Wenn Sie fünf Dinge ändern und das Ergebnis sich verbessert, wissen Sie nicht, welche Änderung geholfen hat. Wenn Sie nur eines ändern, lernen Sie genau, was es bewirkt.

Eine persönliche Prompt-Bibliothek aufbauen

Führen Sie ein Dokument mit Phrasen und Kombinationen, die gut für Sie funktionieren. «Golden hour backlit portrait» ist vielleicht etwas, das Sie in 30% Ihrer Prompts verwenden. Eine Bibliothek zuverlässiger Phrasen beschleunigt Ihren Workflow erheblich. Oder überspringen Sie das manuelle Schreiben von Prompts — nutzen Sie unseren Text-zu-Prompt-Generator, um jede Beschreibung sofort zu verbessern.

Der schnellste Weg zu guten Ergebnissen

Wenn Sie gerade erst anfangen und schnell gute Ergebnisse wollen, hier die Abkürzung:

  1. Finden Sie 3 bis 5 Bilder, die den Stil repräsentieren, den Sie erstellen möchten
  2. Laden Sie jedes auf ImageToPrompt hoch, um den Prompt zu extrahieren
  3. Identifizieren Sie die gemeinsamen Elemente in diesen Prompts — das sind Ihre Stil-Anker
  4. Erstellen Sie Ihren eigenen Prompt mit diesen Ankern als Grundlage
  5. Generieren, bewerten und passen Sie jeweils ein Element an

Dieser Ansatz überspringt monatelanges Ausprobieren, indem er Ihnen echtes Vokabular gibt, das in echten Prompts funktioniert — abgeleitet von Bildern, die Sie tatsächlich mögen.

3 Übungen zum Sofort-Ausprobieren

Über Prompt Engineering zu lesen, bringt Sie nur bedingt weiter. Diese Übungen bauen schnell echte Intuition auf.

Übung 1: Analysieren und Vergleichen

Laden Sie Ihr Lieblingsfoto bei ImageToPrompt hoch. Lesen Sie den generierten Prompt aufmerksam. Schließen Sie ihn dann und schreiben Sie Ihren eigenen Prompt für dasselbe Bild von Grund auf, ohne das KI-Ergebnis anzusehen. Vergleichen Sie die beiden — was haben Sie übersehen? Was hat die KI übersehen? Die Lücken in beiden Richtungen lehren Sie mehr als jedes Tutorial.

Übung 2: Das Ein-Wort-Spiel

Nehmen Sie einen funktionierenden Prompt und ändern Sie genau ein Wort. Generieren Sie beide Versionen und vergleichen Sie. Machen Sie das 5 Mal mit 5 verschiedenen Wörtern. Sie werden schnell lernen, welche Deskriptoren den größten visuellen Einfluss haben — und es wird Sie überraschen. Oft ist es ein Beleuchtungsbegriff oder ein einzelnes Stimmungswort, nicht die Motivbeschreibung, das den größten Unterschied macht.

Übung 3: Stilübertragung

Generieren Sie einen Prompt aus einem Landschaftsfoto mit ImageToPrompt. Behalten Sie nun ALLE Stil-, Beleuchtungs-, Farb- und Stimmungswörter aus diesem Prompt bei — aber ersetzen Sie das Motiv durch etwas völlig anderes (eine Person, ein Fahrzeug, ein Gebäude). Beobachten Sie, wie sich die visuelle Sprache überträgt. So bauen professionelle KI-Künstler einen konsistenten Stil über verschiedene Motive hinweg auf.

Lernen Sie durch die Analyse echter Bilder

Laden Sie ein beliebiges Bild bei ImageToPrompt hoch und sehen Sie genau, wie visuelle Qualitäten in Prompt-Sprache übersetzt werden. Der schnellste Weg, Prompt Engineering zu lernen.

Kostenlosen Bild-zu-Prompt-Generator testen →