Sie öffnen Midjourney zum ersten Mal, tippen «cooler Drache» und erhalten ein Ergebnis, das... in Ordnung ist. Generisch. Nichts, was auch nur annähernd dem entspricht, was Sie sich vorgestellt hatten. Gleichzeitig tippt jemand anderes einen ganzen Absatz spezifischer Beschreibungen ein und erzeugt etwas Atemberaubendes.

Der Unterschied ist Prompt Engineering — die Fähigkeit, klar und effektiv mit KI-Bildgeneratoren zu kommunizieren. Es ist keine Programmierung. Es ist keine Magie. Es ist ein erlernbares Handwerk, und dieser Leitfaden gibt Ihnen eine solide Grundlage von Anfang an.

Was ist ein Prompt?

Im Kontext der KI-Bildgenerierung ist ein Prompt die Textanweisung, die Sie einem KI-Modell geben, um ein Bild zu erzeugen. Die KI liest Ihren Text, interpretiert, was Sie meinen, und erzeugt Pixel, die versuchen, Ihrer Beschreibung zu entsprechen.

Die grundlegende Herausforderung: KI-Modelle wurden mit Milliarden von Bildern und Bildunterschriften trainiert. Sie haben Zusammenhänge zwischen Wörtern und visuellen Konzepten gelernt. Aber sie interpretieren Ihre Worte probabilistisch — jede Generierung ist leicht unterschiedlich, und das Modell trifft unzählige Mikro-Entscheidungen darüber, was Sie «wirklich meinten».

Prompt Engineering ist die Praxis, Prompts so zu schreiben, dass diese Mikro-Entscheidungen in Richtung des Ergebnisses gelenkt werden, das Sie tatsächlich wollen.

Warum «Cooler Drache» nicht funktioniert

«Cooler Drache» ist maximal mehrdeutig. Die KI hat Tausende von Drachen gesehen, die als «cool» beschrieben wurden — westliche Drachen, östliche Drachen, Cartoon-Drachen, realistische Drachen, feuerspeiende Drachen, fliegende Drachen. Ohne zusätzliche Orientierung wählt sie etwas, das den Durchschnitt all dessen darstellt. Das Ergebnis wirkt generisch, weil es im Grunde genau das ist — der statistische Durchschnitt von «cooler Drache».

Je spezifischer Ihr Prompt ist, desto mehr hat die KI zum Arbeiten, und desto unverwechselbarer wird Ihr Ergebnis. Vergleichen Sie:

Schwach: cool dragon

Stark: ancient sea dragon emerging from stormy ocean waves at night, translucent teal scales catching moonlight, massive wingspan, serpentine body, bioluminescent markings, cinematic wide shot, dramatic lighting, dark fantasy concept art

Gleiches Motiv. Sehr unterschiedliche Ergebnisse.

Probieren Sie es selbst — laden Sie ein beliebiges Bild hoch und erhalten Sie in Sekunden einen optimierten KI-Prompt.

Kostenlos testen →

Den Unterschied sehen: Wie einzelne Wörter alles verändern

Die Kraft des Prompt Engineering wird am deutlichsten, wenn Sie genau ein Wort ändern und die Ergebnisse vergleichen. Hier sind fünf Paare, die zeigen, wie sehr ein einzelner Begriff das Ergebnis beeinflusst.

cinematic portrait

editorial portrait

Cinematic lenkt in Richtung dramatischer Filmbeleuchtung, tiefer Schatten und theatralischer Stimmung. Editorial signalisiert etwas Sauberes, Professionelles, Magazinreifes — in der Regel heller, kontrollierter, weniger atmosphärisch.

golden hour lighting

Golden-Hour-Beleuchtung — warme orange-bernsteinfarbene Töne bei Sonnenuntergang, Prompt-Engineering-Beispiel

blue hour lighting

Blue-Hour-Beleuchtung — kühle weiche Blautöne in der Dämmerung, Ein-Wort-Prompt-Änderung

Golden Hour (kurz nach Sonnenaufgang oder vor Sonnenuntergang) erzeugt warmes orange-bernsteinfarbenes Licht mit langen Schatten. Blue Hour (kurz nach Sonnenuntergang) erzeugt weiches, kühles, diffuses blaues Licht fast ohne Schatten — ein völlig anderes emotionales Register.

oil painting

Ölgemälde-KI-Kunststil — satte gesättigte Farben mit sichtbarer Pinselstrichtextur

watercolor painting

Aquarell-KI-Kunststil — weiche Kanten und transparente Lavierungen, Prompt-Wort-Vergleich

Oil painting impliziert satte, gesättigte Farben, sichtbare Pinselstriche und ein Gefühl von Gewicht und Beständigkeit. Watercolor impliziert weiche Kanten, transparente Lavierungen, hellere Töne und zarte Linienführung — leichter und flüchtiger im Gesamteindruck.

wide angle shot

Weitwinkelaufnahme — Motiv im vollen Umgebungskontext gezeigt, Kompositions-Prompt-Wort

extreme close-up

Extreme Nahaufnahme — Detail füllt das gesamte Bild, Ein-Wort-Prompt-Änderung

Wide angle shot platziert Ihr Motiv im Kontext und zeigt die Umgebung. Extreme close-up eliminiert den Kontext vollständig und fokussiert auf ein einzelnes Detail. Das sind kompositorische Gegensätze, die bei gleichem Motiv grundlegend unterschiedliche Bilder erzeugen.

peaceful mood

Friedliche Stimmung in KI-Kunst — ruhige gelassene Szene mit weichem Licht, Stimmungswort-Prompt-Beispiel

ominous mood

Unheimliche Stimmung in KI-Kunst — dunkle bedrohliche Szene, Prompt-Wort-Effekt

Stimmungswörter beeinflussen Farbwahl, Lichtbehandlung und sogar den Ausdruck des Motivs. Peaceful tendiert zu weichem Licht, offenen Räumen und ruhigen Farben. Ominous tendiert zu dunkler Beleuchtung, tiefen Schatten und einem Gefühl der Bedrohung — selbst bei identischem Motiv.

Die fünf Säulen eines starken KI-Kunst-Prompts

1. Motiv — Was ist im Bild?

Das Motiv ist Ihr Ausgangspunkt: die Person, das Wesen, das Objekt oder die Szene, die Sie darstellen möchten. Seien Sie präzise:

Schwach: «eine Frau»
Stark: «eine japanische Kriegerin in ihren Dreißigern, die aufwendig gearbeitete zeremonielle Rüstung trägt und in einem Bambuswald steht»

Berücksichtigen Sie: physische Merkmale, Alter/Epoche, Kleidung, Ausdruck, Handlung, Beziehung zur Umgebung.

2. Stil — Wie soll es aussehen?

Der Stil teilt der KI mit, in welchem künstlerischen oder fotografischen Register sie arbeiten soll. Ohne diese Angabe entscheidet die KI selbst — üblicherweise etwas zwischen fotorealistisch und Concept Art.

Gängige Stilkategorien:

Fotografisch: cinematic photography, editorial portrait, documentary photography, macro photography
Malerei: oil painting, watercolor illustration, impressionist painting, digital painting
Illustration: concept art, anime style, comic book illustration, children's book illustration
3D/Rendering: octane render, unreal engine 5, CGI animation

Sie können auch bestimmte Künstler referenzieren (ethisch korrekt verwenden) oder ein erkennbares visuelles Genre beschreiben wie «Science-Fiction-Buchcover-Kunst der 1980er Jahre» oder «Art-Nouveau-Plakatdesign».

3. Beleuchtung — Was macht das Licht?

Beleuchtung ist wohl das mächtigste Element für Stimmung und Qualität. KI-Generatoren sind überraschend gut darin, spezifische Lichtbeschreibungen zu interpretieren.

Wichtige Beleuchtungs-Deskriptoren:

Richtung: Frontlicht, Seitenlicht, Gegenlicht, Oberlicht, Unterlicht
Qualität: weiches diffuses Licht, hartes direktes Licht, geflecktes Licht
Tageszeit: Golden Hour, Blue Hour, Mittagssonne, bewölkt, Nacht
Typ: natürliches Sonnenlicht, Studiobeleuchtung, Neonlichter, Kerzenlicht, Biolumineszenz, Feuerschein
Benannte Licht-Setups: Rembrandt-Beleuchtung, Schmetterlings-Beleuchtung, Chiaroscuro

Ein schlecht beleuchtetes Bild mit einem großartigen Motiv wirkt trotzdem mittelmäßig. Eine gute Beleuchtung hebt alles auf ein höheres Niveau.

4. Komposition — Wie ist es gerahmt?

Die Komposition teilt der KI mit, wie sie Elemente innerhalb des Bildausschnitts anordnen soll. Ohne Anleitung wählt die KI standardmäßig das, was in ihren Trainingsdaten am häufigsten vorkam — üblicherweise ein zentrierter, neutraler Bildausschnitt.

Einstellungsgrößen (aus Film/Fotografie entlehnt):

extreme close-up — füllt den Rahmen mit einem Detail (ein Auge, eine Textur, ein Mund)
close-up portrait — Gesicht und Schultern
medium shot — bis zur Taille
full body shot — Motiv von Kopf bis Fuß
wide shot — Motiv in voller Umgebung
establishing shot — große Umgebung, Motiv ist klein
aerial view / bird's eye view — Blick von oben nach unten
worm's eye view — Blick von unten nach oben
Dutch angle — geneigte Kamera für Spannung

Kompositionstechniken:

rule of thirds — Motiv versetzt vom Zentrum
centered composition — symmetrisch, formal
leading lines — Umgebungselemente führen den Blick
bokeh / shallow depth of field — unscharfer Hintergrund
deep focus — alles scharf

5. Stimmung und Atmosphäre — Wie soll es sich anfühlen?

Die Stimmung kommuniziert das emotionale Register. Sie beeinflusst Farbwahl, Lichtbehandlung und das Gesamtgefühl des Bildes, selbst wenn Sie nicht jedes Detail angeben.

Nützliche Stimmungs-Deskriptoren:

Geheimnisvoll, unheimlich, beunruhigend, verstörend
Hoffnungsvoll, warm, nostalgisch, friedlich
Episch, großartig, ehrfurchtgebietend, majestätisch
Melancholisch, still, einsam, kontemplativ
Angespannt, dringend, chaotisch, energisch
Magisch, überirdisch, traumhaft, surreal

Anatomie eines professionellen Prompts

Sezieren wir einen vollständigen professionellen Prompt und kennzeichnen jede Komponente, um genau zu sehen, wie sie den fünf Säulen entspricht.

ancient sea dragon emerging from stormy ocean waves at night, dark fantasy concept art, digital painting, dramatic rim lighting, bioluminescent glow from below, deep navy blue and teal with warm orange accents, cinematic wide shot, low angle perspective, mysterious, awe-inspiring, powerful --ar 21:9 --v 6.1 --style raw --q 2

Motiv Stil Beleuchtung Farbe Komposition Stimmung Parameter

Jedes Element hat seine Berechtigung. Entfernen Sie «bioluminescent glow from below» und der Drache verliert seine übernatürliche Qualität. Entfernen Sie «low angle perspective» und das Gefühl für die Größe bricht zusammen. Professionelle Prompts sind nicht lang um der Länge willen — sie sind spezifisch, weil jeder Begriff Informationen hinzufügt, die die KI nutzen kann.

Qualitäts-Tags: Die zuverlässigen Verstärker

Viele KI-Generatoren reagieren auf qualitätssignalisierende Begriffe, die dem Modell mitteilen, sein bestes Ergebnis zu produzieren. Diese sind besonders wichtig in Stable Diffusion:

masterpiece, best quality, highly detailed
8k resolution, ultra-high definition
sharp focus, professional
award-winning photography

In Midjourney und Flux sind diese Tags weniger notwendig, da diese Modelle standardmäßig bereits auf hohe Qualität abzielen. In SD machen sie jedoch einen spürbaren Unterschied.

Negative Prompts: Was Sie nicht wollen

Stable Diffusion verfügt über ein separates Negativ-Prompt-Feld, in dem Sie Elemente auflisten, die Sie ausschließen möchten. Dies ist eine der leistungsstärksten Funktionen von SD.

Ein standardmäßiger negativer Basis-Prompt:

blurry, low quality, bad anatomy, deformed fingers, watermark, text, logo, cropped, out of frame, duplicate, ugly, amateur, jpeg artifacts

Fügen Sie modellspezifische Negativbegriffe für Ihren Checkpoint hinzu. Für Portraitgenerierung immer einschließen: bad hands, missing fingers, extra fingers, fused fingers, mutated hands

Midjourney handhabt dies mit --no [Begriff] am Ende Ihres Prompts, obwohl dies weniger mächtig ist als die SD-Implementierung.

Prompt-Vokabel-Spickzettel

Eine Referenztabelle der zuverlässigsten Prompt-Begriffe nach Kategorie. Setzen Sie ein Lesezeichen und nutzen Sie sie als Ausgangspunkt beim Erstellen neuer Prompts.

Kategorie	Nützliche Begriffe
Beleuchtung	golden hour, blue hour, rim light, backlit, Rembrandt lighting, volumetric light, neon light, candlelight, overcast, harsh shadow, soft diffused light, chiaroscuro, bioluminescent
Stil	cinematic, editorial, concept art, oil painting, watercolor, anime style, photorealistic, hyperrealistic, minimalist, surrealist, impressionist, Art Nouveau, dark fantasy, retrofuturism
Stimmung	ethereal, dramatic, serene, ominous, nostalgic, whimsical, melancholic, epic, cozy, unsettling, mysterious, triumphant, desolate, magical
Komposition	close-up portrait, wide shot, bird's eye view, Dutch angle, rule of thirds, centered symmetrical, leading lines, negative space, shallow depth of field, deep focus, extreme close-up, establishing shot
Farbe	warm tones, cool tones, muted palette, vibrant saturated, monochromatic, complementary colors, pastel, earth tones, jewel tones, high contrast, desaturated
Qualität (SD)	masterpiece, best quality, highly detailed, 8k resolution, ultra HD, sharp focus, professional, award-winning photography
Kamera / Objektiv	85mm f/1.4, 24mm wide angle, macro lens, Canon EOS R5, Hasselblad, film grain, bokeh, tilt-shift, anamorphic lens flare, shallow depth of field

Einen Prompt entwickeln sehen: Vom Einfachen zum Professionellen

Der effektivste Weg, Prompt Engineering zu verstehen, ist zuzusehen, wie ein einzelner Prompt von vage zu präzise wächst. Jede Stufe fügt eine Informationsschicht hinzu.

Stufe 1 — Zu vage

a cat in a garden

Ergebnis Stufe 1: generische Katze im Garten — vager KI-Prompt erzeugt durchschnittliches Ergebnis

Generisch. Die KI wählt den statistischen Durchschnitt von «Katze im Garten» — wahrscheinlich eine Hauskatze, wahrscheinlich bei Tageslicht, wahrscheinlich grüner Rasen. Nichts Besonderes.

Stufe 2 — Spezifisches Motiv und Umgebung

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden

Ergebnis Stufe 2: flauschige orangefarbene Tabby-Katze im englischen Cottage-Garten mit Wildblumen

Besser. Jetzt haben wir die Rasse (orange Tabby), das Fell (flauschig), die Handlung (sitzend), die spezifische Umgebung (Wildblumen, englischer Cottage-Garten). Aber wir haben immer noch keine künstlerische Richtung.

Stufe 3 — Stil hinzufügen

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework

Ergebnis Stufe 3: Aquarell-Illustrationsstil einer Tabby im Cottage-Garten

Jetzt hat es eine künstlerische Richtung. Die Stilwörter geben der KI ein visuelles Register vor. Das Motiv ist dasselbe, aber die Technik verwandelt es.

Stufe 4 — Beleuchtung hinzufügen

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework, golden hour sunlight, dappled light filtering through trees, warm amber tones

Ergebnis Stufe 4: Aquarell-Katze im Garten mit Golden-Hour-Licht und warmen Bernsteintönen

Die Beleuchtung verwandelt die Stimmung vollständig. Dieselbe Szene wirkt jetzt warm, nostalgisch und idyllisch. Beleuchtung ist oft die wirkungsvollste Ergänzung, die Sie an einem Prompt vornehmen können.

Stufe 5 — Komposition und Parameter hinzufügen

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework, golden hour sunlight, dappled light filtering through trees, warm amber tones, shallow depth of field, rule of thirds composition --ar 3:2 --v 6.1

Ergebnis Stufe 5: professionelles Aquarell-Katzenportrait mit Drittelregel-Komposition und geringer Schärfentiefe

Professionelles Ergebnis. Die Kompositionsbegriffe lenken den Bildausschnitt der KI. Das Seitenverhältnis passt zum beabsichtigten Verwendungszweck. Es ist dasselbe Motiv wie in Stufe 1 — verwandelt durch fünf Schichten an Spezifizierung.

Prompt Engineering schnell lernen

Bestehende Prompts studieren

Websites wie PromptHero, Civitai und Lexica ermöglichen es Ihnen, KI-Kunst zusammen mit den Prompts zu durchstöbern, die sie erzeugt haben. Studieren Sie, welche Deskriptoren bestimmte Ergebnisse produzieren. Suchen Sie nach Mustern in den Prompts hinter Bildern, die Ihnen gefallen.

Bild-zu-Prompt-Konvertierung nutzen

Eine der besten Möglichkeiten zu lernen, ist die Analyse von Bildern, die Sie lieben. Laden Sie ein beliebiges Bild bei ImageToPrompt hoch und untersuchen Sie den generierten Prompt sorgfältig. Sie werden sehen, wie sich spezifische visuelle Qualitäten in Prompt-Sprache übersetzen. Machen Sie das mit 10 bis 20 Bildern und Sie werden das Vokabular schnell verinnerlichen.

Immer nur eine Sache ändern

Beim Experimentieren ändern Sie nur ein Element zwischen den Generierungen. Wenn Sie fünf Dinge ändern und das Ergebnis sich verbessert, wissen Sie nicht, welche Änderung geholfen hat. Wenn Sie nur eines ändern, lernen Sie genau, was es bewirkt.

Eine persönliche Prompt-Bibliothek aufbauen

Führen Sie ein Dokument mit Phrasen und Kombinationen, die gut für Sie funktionieren. «Golden hour backlit portrait» ist vielleicht etwas, das Sie in 30% Ihrer Prompts verwenden. Eine Bibliothek zuverlässiger Phrasen beschleunigt Ihren Workflow erheblich. Oder überspringen Sie das manuelle Schreiben von Prompts — nutzen Sie unseren Text-zu-Prompt-Generator, um jede Beschreibung sofort zu verbessern.

Der schnellste Weg zu guten Ergebnissen

Wenn Sie gerade erst anfangen und schnell gute Ergebnisse wollen, hier die Abkürzung:

Finden Sie 3 bis 5 Bilder, die den Stil repräsentieren, den Sie erstellen möchten
Laden Sie jedes auf ImageToPrompt hoch, um den Prompt zu extrahieren
Identifizieren Sie die gemeinsamen Elemente in diesen Prompts — das sind Ihre Stil-Anker
Erstellen Sie Ihren eigenen Prompt mit diesen Ankern als Grundlage
Generieren, bewerten und passen Sie jeweils ein Element an

Dieser Ansatz überspringt monatelanges Ausprobieren, indem er Ihnen echtes Vokabular gibt, das in echten Prompts funktioniert — abgeleitet von Bildern, die Sie tatsächlich mögen.

3 Übungen zum Sofort-Ausprobieren

Über Prompt Engineering zu lesen, bringt Sie nur bedingt weiter. Diese Übungen bauen schnell echte Intuition auf.

Übung 1: Analysieren und Vergleichen

Laden Sie Ihr Lieblingsfoto bei ImageToPrompt hoch. Lesen Sie den generierten Prompt aufmerksam. Schließen Sie ihn dann und schreiben Sie Ihren eigenen Prompt für dasselbe Bild von Grund auf, ohne das KI-Ergebnis anzusehen. Vergleichen Sie die beiden — was haben Sie übersehen? Was hat die KI übersehen? Die Lücken in beiden Richtungen lehren Sie mehr als jedes Tutorial.

Übung 2: Das Ein-Wort-Spiel

Nehmen Sie einen funktionierenden Prompt und ändern Sie genau ein Wort. Generieren Sie beide Versionen und vergleichen Sie. Machen Sie das 5 Mal mit 5 verschiedenen Wörtern. Sie werden schnell lernen, welche Deskriptoren den größten visuellen Einfluss haben — und es wird Sie überraschen. Oft ist es ein Beleuchtungsbegriff oder ein einzelnes Stimmungswort, nicht die Motivbeschreibung, das den größten Unterschied macht.

Übung 3: Stilübertragung

Generieren Sie einen Prompt aus einem Landschaftsfoto mit ImageToPrompt. Behalten Sie nun ALLE Stil-, Beleuchtungs-, Farb- und Stimmungswörter aus diesem Prompt bei — aber ersetzen Sie das Motiv durch etwas völlig anderes (eine Person, ein Fahrzeug, ein Gebäude). Beobachten Sie, wie sich die visuelle Sprache überträgt. So bauen professionelle KI-Künstler einen konsistenten Stil über verschiedene Motive hinweg auf.

Lernen Sie durch die Analyse echter Bilder

Laden Sie ein beliebiges Bild bei ImageToPrompt hoch und sehen Sie genau, wie visuelle Qualitäten in Prompt-Sprache übersetzt werden. Der schnellste Weg, Prompt Engineering zu lernen.

Kostenlosen Bild-zu-Prompt-Generator testen →