Flux.1 hat das Spiel verändert, als Black Forest Labs es Mitte 2024 veröffentlichte, und bis 2026 ist es zum bevorzugten Generator für Nutzer geworden, die fotorealistische Ergebnisse mit besserer Textwiedergabe und treuerer Prompt-Befolgung als bei der Konkurrenz wünschen. Doch Flux' Stärke — sein ausgefeiltes natürliches Sprachverständnis — bringt auch Nutzer ins Stolpern, die von Midjourney oder Stable Diffusion mit Gewohnheiten des Tag-basierten Promptings kommen. Dieser Leitfaden zeigt Ihnen genau, wie Flux denkt und wie Sie Prompts schreiben, die durchgehend beeindruckende Ergebnisse liefern.

Wir behandeln den Architekturunterschied, der Flux anders arbeiten lässt, das spezifische Vokabular, auf das es am besten reagiert, 10 vollständig analysierte Beispiel-Prompts und wie Sie ImageToPrompt nutzen können, um automatisch Flux-optimierte Prompts aus jedem Referenzbild zu generieren.

Flux.1-Varianten: Dev, Pro und Schnell

Black Forest Labs veröffentlichte drei Varianten von Flux.1, jeweils mit einer unterschiedlichen Balance aus Qualität, Geschwindigkeit und Zugänglichkeit. Zu verstehen, welche Variante Sie verwenden, ist wichtig, da sie leicht unterschiedliche Prompt-Empfindlichkeiten haben.

Variante Geschwindigkeit Qualität Lizenz Bester Anwendungsfall Typische Schritte
Flux.1 Dev ~20–40s (GPU) ★★★★★ Nicht-kommerziell Hochwertige persönliche Projekte, Experimente 20–50 Schritte
Flux.1 Pro ~15–30s (API) ★★★★★ Kommerziell (API) Produktionsarbeiten, kommerzielle Projekte API-verwaltet
Flux.1 Schnell ~2–5s (GPU) ★★★★☆ Apache 2.0 (offen) Schnelles Prototyping, Massenproduktion 4 Schritte

Für die meiste kreative Arbeit ist Flux.1 Dev der Sweet Spot — es liefert Qualität vergleichbar mit Pro ohne API-Kosten pro Bild bei lokaler Ausführung. Flux.1 Schnell ist bemerkenswert für seine Geschwindigkeit (4 Inferenzschritte vs. 50 bei den meisten Modellen), produziert aber etwas weichere Details und reagiert weniger auf subtile Prompt-Nuancen. Pro ist die Wahl für kommerzielle Produktionspipelines, bei denen die Lizenzierung wichtig ist.

Alle drei Varianten teilen die gleiche grundlegende Prompting-Logik — die Unterschiede liegen in der Generierungsqualität und -geschwindigkeit, nicht in der Textverarbeitung.

Warum Flux natürliche Sprache nutzt (und warum das wichtig ist)

Flux.1 basiert auf einer Diffusion-Transformer-Architektur (DiT) statt der UNet-Architektur von Stable Diffusion 1.5 und SDXL. Entscheidend ist, dass Flux einen T5-XXL-Textencoder verwendet — den gleichen Typ von großem Sprachmodell wie in Googles Forschung — statt CLIP.

CLIP wurde hauptsächlich darauf trainiert, Bilder kurzen Bildunterschriften zuzuordnen. Es funktioniert gut mit kurzen, beschreibenden Tags, hat aber Schwierigkeiten mit komplexen Beziehungen, langen Sätzen und nuancierten Kompositionsanweisungen. T5-XXL wurde auf massiven Textkorpora trainiert und versteht Syntax, Grammatik, Satzstruktur und Kontext.

Dieser Architekturunterschied ist der Grund, warum:

Flux Prompt-Struktur: Die Drei-Teile-Formel

Die zuverlässigsten Flux-Prompts folgen einer dreiteiligen Struktur: Motiv und Szene, dann technische fotografische Details, dann Stil und Stimmung. Dies spiegelt wider, wie ein professioneller Fotograf oder Kameramann ein Aufnahme-Briefing beschreiben würde.

[MOTIV- UND SZENENBESCHREIBUNG] + [KAMERA- UND TECHNISCHE DETAILS] + [STIL UND STIMMUNG]

Ein konkretes Beispiel:

A middle-aged Japanese chef in a traditional white uniform carefully plating a bowl of ramen in a small Tokyo restaurant, steam rising from the broth, warm incandescent light overhead, other diners blurred in the background. Shot on Sony A7R V with 85mm f/1.4 lens, shallow depth of field, natural documentary lighting. Warm amber color grading, intimate storytelling mood, photojournalism style.

Lassen Sie uns aufschlüsseln, warum das funktioniert:

Kamera-Terminologie die in Flux funktioniert

Die Angabe realer Kameraausrüstung ist eine der wirksamsten Flux-Techniken. Der T5-Encoder erkennt spezifische Kameramodelle und ihre assoziierten visuellen Eigenschaften — Sensorgröße, Dynamikumfang, Farbwiedergabe — und wendet diese Qualitäten auf die Ausgabe an.

Kameragehäuse

Objektive und ihre Effekte

Kameraeinstellungen

Beleuchtungsbeschreibungen die Flux-Ergebnisse verbessern

Beleuchtung ist wohl das wirkungsvollste Element in fotografischen Prompts. Flux' Training mit fotografischen und kinematografischen Inhalten bedeutet, dass es ein reichhaltiges Vokabular für Lichtverhältnisse besitzt.

Natürliches Licht

Künstliches und Studiolicht

Kinematografische Beleuchtung

Stil-Beschreibungen die in Flux gut funktionieren

Anders als Stable Diffusion, das Checkpoint-spezifische Stil-Token benötigt, versteht Flux stilistische Beschreibungen über sein Sprachmodell. Diese Beschreibungen liefern durchgehend erkennbare Ergebnisse:

Fotografie-Stile

Kunst- und Illustrationsstile

Kinematografische Stile

Was man NICHT in Flux-Prompts tun sollte

Von Stable Diffusion oder Midjourney kommend, werden diese Gewohnheiten Ihre Flux-Ergebnisse verschlechtern:

Die Kehrseite: Flux verarbeitet auch sehr lange, detaillierte Prompts besser als jedes frühere Modell. Scheuen Sie sich nicht vor 100+ Wort-Prompts, die sich wie detaillierte Regieanweisungen lesen — Flux wird ihnen genau folgen.

Flux.1 Dev Ausgabe — Landschaftsszene mit fotorealistischem Rendering und präzisen Details durch natürlichen Sprach-Prompt
Flux.1 Dev: fotorealistisch, detailgenau
Flux.1 Dev Ausgabe — Architekturszene mit scharfer Geometrie und präziser räumlicher Darstellung
Flux verarbeitet komplexe räumliche Anweisungen präzise

Flux Dev vs Pro vs Schnell Vergleich

Aspekt Flux Dev Flux Pro Flux Schnell
Qualität Ausgezeichnet Ausgezeichnet Sehr gut
Geschwindigkeit 20–40 Sek. 15–30 Sek. 2–5 Sek.
Prompt-Nuancen Hoch Am höchsten Moderat
Lizenz Nicht-kommerziell Kommerziell Apache 2.0

10 Beispiel-Prompts mit Analyse

1. Porträtfotografie

A 30-year-old woman with natural red hair sits by a rain-streaked window in a coffee shop, looking contemplative, hands wrapped around a ceramic mug. Late afternoon, overcast daylight from the left side, warm tungsten interior lights creating a color contrast. Shot on Fujifilm GFX 100S, 110mm f/2 equivalent, shallow depth of field. Kodak Portra 400 film emulation, slightly desaturated greens, intimate documentary feel.

Warum es funktioniert: Spezifische Motivbeschreibung, präzises Beleuchtungs-Setup mit Lichtrichtung, benannter Filmtyp für Farbanleitung, Stimmungsbeschreibung am Ende.

2. Architekturfotografie

The interior of a modernist cathedral, concrete brutalist architecture, shafts of light cutting through narrow vertical windows high on the walls, casting long geometric shadows on the textured concrete floor. Shot on Canon EOS R5, 17mm tilt-shift lens, all vertical lines corrected, f/11, everything in sharp focus. Monochromatic, high contrast black and white, fine art architectural photography.

3. Fantasy-Landschaft

A vast alien landscape at twilight: twin moons rising over a plateau covered in bioluminescent blue-purple vegetation, a lone explorer in a spacesuit standing at the edge, small against the scale of the environment. The atmosphere is thick and hazy, creating atmospheric perspective and layered depth. Painted in a style combining photorealistic digital art with concept art looseness, cinematic composition, epic scale, ultra-detailed foreground plants.

4. Straßenfotografie

A crowded Tokyo crossing at rush hour, motion blur on the pedestrians suggesting movement, one sharply focused businessman in the center looking directly at the camera, surprised expression. Heavy rain, reflected neon signs on wet pavement, shallow depth. Shot on Leica Q3, 28mm f/1.7, ISO 6400, available light only. Black and white with deep shadows, photojournalism aesthetic.

5. Produktfotografie

A single glass bottle of amber whiskey on a dark walnut table, dramatic side lighting from a single spotlight source creating a strong specular highlight on the glass, warm amber liquid glowing. Dark background fading to black. Shot on Phase One IQ4, 120mm macro, f/8. Commercial product photography, ultra-clean, advertising quality, every glass bubble and label detail sharp.

6. Wildlife-Fotografie

A Bengal tiger wading through shallow water in a misty forest, early morning light filtering through dense canopy, water droplets frozen mid-splash around its legs. The tiger is alert, head turned slightly toward the camera. Shot on Nikon Z9, 500mm f/4 telephoto, 1/2000s to freeze motion, natural forest light. National Geographic quality wildlife photography, tack-sharp eyes, motion-blurred water.

7. Food-Fotografie

A bowl of handmade pasta with cherry tomatoes, basil, and olive oil on a rough linen tablecloth, afternoon light from a kitchen window at 45 degrees, casting soft shadows. Steam rising from the pasta. Overhead angle, 45-degree composition. Shot on Sony A7R V, 90mm macro f/2.8. Warm editorial food photography, slightly desaturated background to make the food pop, Bon Appétit magazine aesthetic.

8. Sci-Fi Concept Art

Interior of a colossal generation ship, showing the agricultural rings with forests and fields curving upward in the centrifugal section, sunlight simulated by a central light tube, people as small figures walking between trees. The scale is breathtaking — the curvature of the interior visible. Detailed digital concept art, matte painting quality, warm environmental lighting, realistic atmospheric haze for scale, inspired by classic sci-fi illustration.

9. Modefotografie

A model in a dramatic black structured coat stands in an empty white marble corridor, strong directional light from a large window to the right, creating graphic shadows across the floor. Editorial, minimal composition, confident pose with coat flowing slightly. Shot on Hasselblad X2D, 80mm f/2.8, balanced ambient and natural light. High fashion editorial, Vogue quality, exceptional tonal range, no distracting elements.

10. Makro-Natur

Extreme macro photography of a single dewdrop on a spider web strand, inside the dewdrop a perfectly formed reflection of the surrounding forest and morning sky visible. Overcast soft light, maximum detail in the water surface tension and web filaments. Shot on Canon MP-E 65mm 5x macro, f/11, focus-stacked for complete depth of field. Scientific illustration quality, razor-sharp details, magical natural world mood.

ImageToPrompt nutzen, um Flux-Prompts aus Referenzbildern zu generieren

Das manuelle Erstellen von Flux-Prompts erfordert die Kenntnis dieses spezifischen Vokabulars — Kameramodelle, Beleuchtungsbegriffe, Stilreferenzen. Wenn Sie ein Referenzbild haben und etwas Ähnliches in Flux generieren möchten, übernimmt ImageToPrompt.dev die Vokabelübersetzung automatisch.

Wenn Sie Flux als Ihr Zielmodell in ImageToPrompt auswählen:

  1. Das Tool analysiert Ihr Referenzbild mit Claude Vision
  2. Es identifiziert die fotografischen Eigenschaften: scheinbare Brennweite, Beleuchtungs-Setup, Tiefenschärfe, Farbgebung
  3. Es ordnet diese Eigenschaften dem passenden Flux-Vokabular zu: spezifische Kameraausrüstung, Beleuchtungsterminologie, Stilbeschreibungen
  4. Es formatiert die Ausgabe als kohärenten natürlichsprachlichen Absatz, nicht als Tag-Liste

Ein Referenzfoto eines nebligen Waldes bei Sonnenaufgang, analysiert durch ImageToPrompt mit Flux-Ziel, könnte Folgendes ergeben:

A dense Pacific Northwest forest in early morning, shafts of golden light cutting through mist between towering Douglas firs, the ground covered in soft green moss and fallen needles, a narrow dirt path disappearing into the fog. Shot on Sony A7R V, 35mm f/8, deep depth of field capturing both foreground moss texture and distant hazy trees. Moody and meditative, ethereal morning light, fine art landscape photography, muted cool shadows contrasting with warm light beams.

Häufige Flux-Anfängerfehler

  1. Flux wie Midjourney behandeln. Keine --ar Flags, keine --style Parameter, kein --v 6.1. Flux braucht reinen beschreibenden Text.
  2. Flux wie Stable Diffusion behandeln. Keine (quality:1.4) Token, keine Komma-Tag-Listen, kein Negativ-Prompt-Feld.
  3. Die Szene unterbeschreiben. „A beautiful landscape“ gibt Flux sehr wenig Material. „A rocky coastal cliff at dawn, tide pools reflecting the pink sky, a lone lighthouse in the distance“ gibt Flux eine Szene zum Konstruieren.
  4. Seitenverhältnis nicht in den UI-Einstellungen festlegen. Flux bestimmt das Seitenverhältnis aus den Einstellungen, nicht aus dem Prompt. Wenn Sie ein Hochformat-Porträt möchten, setzen Sie 9:16 in Ihren Generierungseinstellungen — schreiben Sie es nicht in den Prompt-Text.
  5. Sofortige Perfektion erwarten. Selbst mit exzellenten Prompts profitieren Flux-Generierungen von 3–5 Variationen. Die stochastische Natur der Diffusion bedeutet, dass die Qualität zwischen Seeds variiert.
  6. Guidance Scale (CFG) ignorieren. Flux Dev funktioniert gut mit CFG-Werten von 3,5–4,0. Höhere Werte (7,0+), die bei SD funktionieren, erzeugen bei Flux übersättigte, artefaktreiche Ergebnisse.
  7. Künstlernamen als Stil-Abkürzungen verwenden ohne Beschreibung. „by Greg Rutkowski“ ist für Flux mehrdeutiger als „epic fantasy concept art with warm lighting and dramatic composition“ — obwohl die Kombination beider oft am besten funktioniert.

Flux-Prompts automatisch generieren

Laden Sie ein Bild hoch oder beschreiben Sie Ihre Idee und erhalten Sie in Sekunden einen optimierten Flux-Prompt.

Flux Prompt-Generator →

Häufig gestellte Fragen

Wie schreibt man die besten Prompts für Flux AI?

Flux AI reagiert am besten auf detaillierte natürliche Sprache statt auf kommagetrennte Tags. Beschreiben Sie Ihre Szene als Absatz, einschließlich Motiv, Bildausschnitt, Beleuchtung, Optik (z.B. Canon 85mm f/1.4) und Stimmung.

Unterstützt Flux negative Prompts?

Nein, Flux unterstützt keine negativen Prompts im Gegensatz zu Stable Diffusion. Um unerwünschte Elemente zu vermeiden, formulieren Sie Ihren Prompt positiv und präzise, indem Sie genau beschreiben, was Sie sehen möchten.

Was ist der Unterschied zwischen Flux Dev und Flux Pro?

Flux Dev ist das kostenlose Open-Source-Modell mit etwas geringerer Qualität. Flux Pro ist das kommerzielle Modell mit besserer Konsistenz, besserem Befolgen von Anweisungen und höherer Auflösung. Die Prompting-Techniken sind für beide identisch.

Machen Kameraspezifikationen in Flux-Prompts wirklich einen Unterschied?

Ja, Flux versteht technische Kameraspezifikationen sehr gut. Die Angabe eines Objektivs wie Canon 85mm f/1.4 erzeugt realistisches Bokeh, während ein 24mm f/8 ein schärferes Bild mit mehr Tiefenschärfe ergibt.