Flux.1 hat das Spiel verändert, als Black Forest Labs es Mitte 2024 veröffentlichte, und bis 2026 ist es zum bevorzugten Generator für Nutzer geworden, die fotorealistische Ergebnisse mit besserer Textwiedergabe und treuerer Prompt-Befolgung als bei der Konkurrenz wünschen. Doch Flux' Stärke — sein ausgefeiltes natürliches Sprachverständnis — bringt auch Nutzer ins Stolpern, die von Midjourney oder Stable Diffusion mit Gewohnheiten des Tag-basierten Promptings kommen. Dieser Leitfaden zeigt Ihnen genau, wie Flux denkt und wie Sie Prompts schreiben, die durchgehend beeindruckende Ergebnisse liefern.
Wir behandeln den Architekturunterschied, der Flux anders arbeiten lässt, das spezifische Vokabular, auf das es am besten reagiert, 10 vollständig analysierte Beispiel-Prompts und wie Sie ImageToPrompt nutzen können, um automatisch Flux-optimierte Prompts aus jedem Referenzbild zu generieren.
Flux.1-Varianten: Dev, Pro und Schnell
Black Forest Labs veröffentlichte drei Varianten von Flux.1, jeweils mit einer unterschiedlichen Balance aus Qualität, Geschwindigkeit und Zugänglichkeit. Zu verstehen, welche Variante Sie verwenden, ist wichtig, da sie leicht unterschiedliche Prompt-Empfindlichkeiten haben.
| Variante | Geschwindigkeit | Qualität | Lizenz | Bester Anwendungsfall | Typische Schritte |
|---|---|---|---|---|---|
| Flux.1 Dev | ~20–40s (GPU) | ★★★★★ | Nicht-kommerziell | Hochwertige persönliche Projekte, Experimente | 20–50 Schritte |
| Flux.1 Pro | ~15–30s (API) | ★★★★★ | Kommerziell (API) | Produktionsarbeiten, kommerzielle Projekte | API-verwaltet |
| Flux.1 Schnell | ~2–5s (GPU) | ★★★★☆ | Apache 2.0 (offen) | Schnelles Prototyping, Massenproduktion | 4 Schritte |
Für die meiste kreative Arbeit ist Flux.1 Dev der Sweet Spot — es liefert Qualität vergleichbar mit Pro ohne API-Kosten pro Bild bei lokaler Ausführung. Flux.1 Schnell ist bemerkenswert für seine Geschwindigkeit (4 Inferenzschritte vs. 50 bei den meisten Modellen), produziert aber etwas weichere Details und reagiert weniger auf subtile Prompt-Nuancen. Pro ist die Wahl für kommerzielle Produktionspipelines, bei denen die Lizenzierung wichtig ist.
Alle drei Varianten teilen die gleiche grundlegende Prompting-Logik — die Unterschiede liegen in der Generierungsqualität und -geschwindigkeit, nicht in der Textverarbeitung.
Warum Flux natürliche Sprache nutzt (und warum das wichtig ist)
Flux.1 basiert auf einer Diffusion-Transformer-Architektur (DiT) statt der UNet-Architektur von Stable Diffusion 1.5 und SDXL. Entscheidend ist, dass Flux einen T5-XXL-Textencoder verwendet — den gleichen Typ von großem Sprachmodell wie in Googles Forschung — statt CLIP.
CLIP wurde hauptsächlich darauf trainiert, Bilder kurzen Bildunterschriften zuzuordnen. Es funktioniert gut mit kurzen, beschreibenden Tags, hat aber Schwierigkeiten mit komplexen Beziehungen, langen Sätzen und nuancierten Kompositionsanweisungen. T5-XXL wurde auf massiven Textkorpora trainiert und versteht Syntax, Grammatik, Satzstruktur und Kontext.
Dieser Architekturunterschied ist der Grund, warum:
- Flux Text in Bildern präzise rendern kann (eine historische Schwäche aller Diffusionsmodelle)
- Flux komplexe, mehrteilige Kompositionsanweisungen befolgt
- Flux relationale Sprache versteht: „eine Person, die links neben einem roten Auto steht“
- Flux NICHT von kommaseparierten Tags profitiert wie SD-1.5-Modelle
- Flux NICHT von (Schlüsselwort:Gewicht)-Syntax profitiert — es ignoriert die Gewichtsmarkierungen
Flux Prompt-Struktur: Die Drei-Teile-Formel
Die zuverlässigsten Flux-Prompts folgen einer dreiteiligen Struktur: Motiv und Szene, dann technische fotografische Details, dann Stil und Stimmung. Dies spiegelt wider, wie ein professioneller Fotograf oder Kameramann ein Aufnahme-Briefing beschreiben würde.
[MOTIV- UND SZENENBESCHREIBUNG] + [KAMERA- UND TECHNISCHE DETAILS] + [STIL UND STIMMUNG]
Ein konkretes Beispiel:
A middle-aged Japanese chef in a traditional white uniform carefully plating a bowl of ramen in a small Tokyo restaurant, steam rising from the broth, warm incandescent light overhead, other diners blurred in the background. Shot on Sony A7R V with 85mm f/1.4 lens, shallow depth of field, natural documentary lighting. Warm amber color grading, intimate storytelling mood, photojournalism style.
Lassen Sie uns aufschlüsseln, warum das funktioniert:
- „carefully plating“ — das Adverb erfasst Pose und Aktion besser als nur „plating“
- „steam rising from the broth“ — atmosphärisches Detail, das Flux wörtlich rendert
- „other diners blurred in the background“ — Flux versteht dies als Tiefenschärfe-Anweisung
- Kamera-/Objektivspezifikation — signalisiert fotorealistische Absicht und spezifische Bokeh-Eigenschaften
- „intimate storytelling mood“ — kompositorische und tonale Anweisung
Kamera-Terminologie die in Flux funktioniert
Die Angabe realer Kameraausrüstung ist eine der wirksamsten Flux-Techniken. Der T5-Encoder erkennt spezifische Kameramodelle und ihre assoziierten visuellen Eigenschaften — Sensorgröße, Dynamikumfang, Farbwiedergabe — und wendet diese Qualitäten auf die Ausgabe an.
Kameragehäuse
Sony A7R V— hohe Auflösung, detailliert, neutrale FarbwiedergabeCanon EOS R5— warm, angenehme Hauttöne, natürliches RenderingNikon Z9— kräftiger Kontrast, starker DynamikumfangFujifilm X-T5— filmähnliche Farben, Fujifilm-Farbwiedergabe (besonders mit Filmsimulationsnamen)Hasselblad X2D— Mittelformat-Look, außergewöhnliche TonwertabstufungLeica M11— klassisch, leicht gedämpft, dokumentarische ÄsthetikPhase One IQ4— Ultra-High-End-Kommerz-/Fashion-Look
Objektive und ihre Effekte
24mm f/1.4 wide angle— Umgebungskontext, leichte Randverzerrung, dramatische Perspektive35mm f/2— klassische Straßenfotografie, natürliche Perspektive50mm f/1.2— neutrale Perspektive, exzellentes Bokeh, vielseitig85mm f/1.4— schmeichelhafte Porträtkompression, cremiger Hintergrund135mm f/2— starke Kompression, isoliertes Motiv, malerisches Bokeh200mm f/2.8 telephoto— komprimierter Hintergrund, Sport-/Wildlife-Ästhetikmacro lens, 1:1— extreme Nahaufnahme, hohe Detailtreue
Kameraeinstellungen
ISO 3200, high grain— fügt filmähnliches Rauschen für körnige/dokumentarische Ästhetik hinzulong exposure, motion blur— erfasst Bewegung, Lichtspurenf/22, deep depth of field, everything in focus— Landschafts-/Architektur-Lookf/1.2, razor-thin focus plane— extreme Trennung zwischen Motiv und Hintergrund
Beleuchtungsbeschreibungen die Flux-Ergebnisse verbessern
Beleuchtung ist wohl das wirkungsvollste Element in fotografischen Prompts. Flux' Training mit fotografischen und kinematografischen Inhalten bedeutet, dass es ein reichhaltiges Vokabular für Lichtverhältnisse besitzt.
Natürliches Licht
golden hour light— warmes, gerichtetes Sonnenlicht in flachem Winkel, lange Schattenblue hour— weiches, kühles Dämmerungslicht direkt nach Sonnenuntergangovercast diffused light— gleichmäßig, schattenlos, weich — ideal für Porträtsharsh midday sun, high contrast shadows— dramatisch, sommerliche Hitze-Ästhetikdappled light through tree canopy— Waldlicht, bewegte Schattenmusterwindow light, one-sided illumination— klassische Indoor-Porträtbeleuchtung
Künstliches und Studiolicht
Rembrandt lighting— gekennzeichnet durch ein Lichtdreieck unter einem Auge; klassische Porträtbeleuchtungsplit lighting, half shadow— dramatisch, eine Seite voll beleuchtet, eine im Schattenring light, flat frontal lighting— Fashion-/Beauty-Look, Reflexionen in den Augenneon sign reflections, colored light— urbane Nachtfotografiecandlelight, single flame source— warm, flackernd, intimbioluminescent glow— kühle Blau- und Grüntöne, Sci-Fi oder Fantasy
Kinematografische Beleuchtung
volumetric light, god rays— sichtbare Lichtstrahlen durch Atmosphäre/Dunstchiaroscuro— extremer Kontrast zwischen hellen und dunklen Bereichen, malerischpractical lighting from below— Horror-/Thriller-Look, unvorteilhafte Schattenmotivated lighting, warm practical sources— realistische Innenraum-Kinematografie
Stil-Beschreibungen die in Flux gut funktionieren
Anders als Stable Diffusion, das Checkpoint-spezifische Stil-Token benötigt, versteht Flux stilistische Beschreibungen über sein Sprachmodell. Diese Beschreibungen liefern durchgehend erkennbare Ergebnisse:
Fotografie-Stile
photojournalism, documentary stylefashion editorial, high-end commercialstreet photography, candid momentfine art photography, gallery print qualityanalog film photography, 35mm grainmedium format film, Kodak Portra 400 colors
Kunst- und Illustrationsstile
oil painting, visible brushwork, museum qualitywatercolor illustration, soft edges, paper texturedigital concept art, highly detailed, ArtStation qualitygraphic novel illustration, bold lines, flat colorArt Nouveau style, ornamental, flowing lines
Kinematografische Stile
cinematic film still, anamorphic lens flaremovie poster compositionin the visual style of a Wes Anderson film— symmetrisch, pastellfarben, flachnoir film aesthetic, black and white, hard shadows
Was man NICHT in Flux-Prompts tun sollte
Von Stable Diffusion oder Midjourney kommend, werden diese Gewohnheiten Ihre Flux-Ergebnisse verschlechtern:
- Verwenden Sie NICHT die (Schlüsselwort:Gewicht)-Syntax. Flux ignoriert Gewichtsmodifikatoren in Klammern vollständig.
(beautiful:1.4)undbeautifulerzeugen identische Ergebnisse in Flux. - Verwenden Sie NICHT --ar, --v, --style Flags. Das sind Midjourney-spezifische Parameter. Sie erscheinen als wörtlicher Text in Flux-Ausgaben.
- Verwenden Sie KEINE negativen Prompts in Flux Dev/Schnell. Standard-Flux unterstützt keine negativen Prompts wie SD. Verwenden Sie stattdessen beschreibende positive Sprache: Sagen Sie „clean, sharp background“ statt zu versuchen, „blurry background“ negativ zu prompten.
- Stellen Sie KEINE Qualitäts-Token voran. „masterpiece, best quality, ultra detailed, 1girl“ ist SD-Syntax. Flux interpretiert dies als wörtlichen Satz und könnte ein Bild mit der Beschriftung „masterpiece“ generieren.
- Schreiben Sie KEINE extrem kurzen Prompts. Flux' T5-Encoder arbeitet besser mit reichhaltigeren Kontextinformationen. Ein 50-Wort-Prompt übertrifft in der Regel einen 10-Wort-Prompt für komplexe Szenen.
- Listen Sie KEINE kommaseparierten Tags ohne grammatische Struktur auf. „woman, forest, sunlight, beautiful, high quality“ gibt Flux weniger Informationen als „a woman standing in a sunlit forest, late afternoon, high quality photograph.“
Die Kehrseite: Flux verarbeitet auch sehr lange, detaillierte Prompts besser als jedes frühere Modell. Scheuen Sie sich nicht vor 100+ Wort-Prompts, die sich wie detaillierte Regieanweisungen lesen — Flux wird ihnen genau folgen.


Flux Dev vs Pro vs Schnell Vergleich
| Aspekt | Flux Dev | Flux Pro | Flux Schnell |
|---|---|---|---|
| Qualität | Ausgezeichnet | Ausgezeichnet | Sehr gut |
| Geschwindigkeit | 20–40 Sek. | 15–30 Sek. | 2–5 Sek. |
| Prompt-Nuancen | Hoch | Am höchsten | Moderat |
| Lizenz | Nicht-kommerziell | Kommerziell | Apache 2.0 |
10 Beispiel-Prompts mit Analyse
1. Porträtfotografie
A 30-year-old woman with natural red hair sits by a rain-streaked window in a coffee shop, looking contemplative, hands wrapped around a ceramic mug. Late afternoon, overcast daylight from the left side, warm tungsten interior lights creating a color contrast. Shot on Fujifilm GFX 100S, 110mm f/2 equivalent, shallow depth of field. Kodak Portra 400 film emulation, slightly desaturated greens, intimate documentary feel.
Warum es funktioniert: Spezifische Motivbeschreibung, präzises Beleuchtungs-Setup mit Lichtrichtung, benannter Filmtyp für Farbanleitung, Stimmungsbeschreibung am Ende.
2. Architekturfotografie
The interior of a modernist cathedral, concrete brutalist architecture, shafts of light cutting through narrow vertical windows high on the walls, casting long geometric shadows on the textured concrete floor. Shot on Canon EOS R5, 17mm tilt-shift lens, all vertical lines corrected, f/11, everything in sharp focus. Monochromatic, high contrast black and white, fine art architectural photography.
3. Fantasy-Landschaft
A vast alien landscape at twilight: twin moons rising over a plateau covered in bioluminescent blue-purple vegetation, a lone explorer in a spacesuit standing at the edge, small against the scale of the environment. The atmosphere is thick and hazy, creating atmospheric perspective and layered depth. Painted in a style combining photorealistic digital art with concept art looseness, cinematic composition, epic scale, ultra-detailed foreground plants.
4. Straßenfotografie
A crowded Tokyo crossing at rush hour, motion blur on the pedestrians suggesting movement, one sharply focused businessman in the center looking directly at the camera, surprised expression. Heavy rain, reflected neon signs on wet pavement, shallow depth. Shot on Leica Q3, 28mm f/1.7, ISO 6400, available light only. Black and white with deep shadows, photojournalism aesthetic.
5. Produktfotografie
A single glass bottle of amber whiskey on a dark walnut table, dramatic side lighting from a single spotlight source creating a strong specular highlight on the glass, warm amber liquid glowing. Dark background fading to black. Shot on Phase One IQ4, 120mm macro, f/8. Commercial product photography, ultra-clean, advertising quality, every glass bubble and label detail sharp.
6. Wildlife-Fotografie
A Bengal tiger wading through shallow water in a misty forest, early morning light filtering through dense canopy, water droplets frozen mid-splash around its legs. The tiger is alert, head turned slightly toward the camera. Shot on Nikon Z9, 500mm f/4 telephoto, 1/2000s to freeze motion, natural forest light. National Geographic quality wildlife photography, tack-sharp eyes, motion-blurred water.
7. Food-Fotografie
A bowl of handmade pasta with cherry tomatoes, basil, and olive oil on a rough linen tablecloth, afternoon light from a kitchen window at 45 degrees, casting soft shadows. Steam rising from the pasta. Overhead angle, 45-degree composition. Shot on Sony A7R V, 90mm macro f/2.8. Warm editorial food photography, slightly desaturated background to make the food pop, Bon Appétit magazine aesthetic.
8. Sci-Fi Concept Art
Interior of a colossal generation ship, showing the agricultural rings with forests and fields curving upward in the centrifugal section, sunlight simulated by a central light tube, people as small figures walking between trees. The scale is breathtaking — the curvature of the interior visible. Detailed digital concept art, matte painting quality, warm environmental lighting, realistic atmospheric haze for scale, inspired by classic sci-fi illustration.
9. Modefotografie
A model in a dramatic black structured coat stands in an empty white marble corridor, strong directional light from a large window to the right, creating graphic shadows across the floor. Editorial, minimal composition, confident pose with coat flowing slightly. Shot on Hasselblad X2D, 80mm f/2.8, balanced ambient and natural light. High fashion editorial, Vogue quality, exceptional tonal range, no distracting elements.
10. Makro-Natur
Extreme macro photography of a single dewdrop on a spider web strand, inside the dewdrop a perfectly formed reflection of the surrounding forest and morning sky visible. Overcast soft light, maximum detail in the water surface tension and web filaments. Shot on Canon MP-E 65mm 5x macro, f/11, focus-stacked for complete depth of field. Scientific illustration quality, razor-sharp details, magical natural world mood.
ImageToPrompt nutzen, um Flux-Prompts aus Referenzbildern zu generieren
Das manuelle Erstellen von Flux-Prompts erfordert die Kenntnis dieses spezifischen Vokabulars — Kameramodelle, Beleuchtungsbegriffe, Stilreferenzen. Wenn Sie ein Referenzbild haben und etwas Ähnliches in Flux generieren möchten, übernimmt ImageToPrompt.dev die Vokabelübersetzung automatisch.
Wenn Sie Flux als Ihr Zielmodell in ImageToPrompt auswählen:
- Das Tool analysiert Ihr Referenzbild mit Claude Vision
- Es identifiziert die fotografischen Eigenschaften: scheinbare Brennweite, Beleuchtungs-Setup, Tiefenschärfe, Farbgebung
- Es ordnet diese Eigenschaften dem passenden Flux-Vokabular zu: spezifische Kameraausrüstung, Beleuchtungsterminologie, Stilbeschreibungen
- Es formatiert die Ausgabe als kohärenten natürlichsprachlichen Absatz, nicht als Tag-Liste
Ein Referenzfoto eines nebligen Waldes bei Sonnenaufgang, analysiert durch ImageToPrompt mit Flux-Ziel, könnte Folgendes ergeben:
A dense Pacific Northwest forest in early morning, shafts of golden light cutting through mist between towering Douglas firs, the ground covered in soft green moss and fallen needles, a narrow dirt path disappearing into the fog. Shot on Sony A7R V, 35mm f/8, deep depth of field capturing both foreground moss texture and distant hazy trees. Moody and meditative, ethereal morning light, fine art landscape photography, muted cool shadows contrasting with warm light beams.
Häufige Flux-Anfängerfehler
- Flux wie Midjourney behandeln. Keine --ar Flags, keine --style Parameter, kein --v 6.1. Flux braucht reinen beschreibenden Text.
- Flux wie Stable Diffusion behandeln. Keine (quality:1.4) Token, keine Komma-Tag-Listen, kein Negativ-Prompt-Feld.
- Die Szene unterbeschreiben. „A beautiful landscape“ gibt Flux sehr wenig Material. „A rocky coastal cliff at dawn, tide pools reflecting the pink sky, a lone lighthouse in the distance“ gibt Flux eine Szene zum Konstruieren.
- Seitenverhältnis nicht in den UI-Einstellungen festlegen. Flux bestimmt das Seitenverhältnis aus den Einstellungen, nicht aus dem Prompt. Wenn Sie ein Hochformat-Porträt möchten, setzen Sie 9:16 in Ihren Generierungseinstellungen — schreiben Sie es nicht in den Prompt-Text.
- Sofortige Perfektion erwarten. Selbst mit exzellenten Prompts profitieren Flux-Generierungen von 3–5 Variationen. Die stochastische Natur der Diffusion bedeutet, dass die Qualität zwischen Seeds variiert.
- Guidance Scale (CFG) ignorieren. Flux Dev funktioniert gut mit CFG-Werten von 3,5–4,0. Höhere Werte (7,0+), die bei SD funktionieren, erzeugen bei Flux übersättigte, artefaktreiche Ergebnisse.
- Künstlernamen als Stil-Abkürzungen verwenden ohne Beschreibung. „by Greg Rutkowski“ ist für Flux mehrdeutiger als „epic fantasy concept art with warm lighting and dramatic composition“ — obwohl die Kombination beider oft am besten funktioniert.
Flux-Prompts automatisch generieren
Laden Sie ein Bild hoch oder beschreiben Sie Ihre Idee und erhalten Sie in Sekunden einen optimierten Flux-Prompt.
Flux Prompt-Generator →Häufig gestellte Fragen
Wie schreibt man die besten Prompts für Flux AI?
Flux AI reagiert am besten auf detaillierte natürliche Sprache statt auf kommagetrennte Tags. Beschreiben Sie Ihre Szene als Absatz, einschließlich Motiv, Bildausschnitt, Beleuchtung, Optik (z.B. Canon 85mm f/1.4) und Stimmung.
Unterstützt Flux negative Prompts?
Nein, Flux unterstützt keine negativen Prompts im Gegensatz zu Stable Diffusion. Um unerwünschte Elemente zu vermeiden, formulieren Sie Ihren Prompt positiv und präzise, indem Sie genau beschreiben, was Sie sehen möchten.
Was ist der Unterschied zwischen Flux Dev und Flux Pro?
Flux Dev ist das kostenlose Open-Source-Modell mit etwas geringerer Qualität. Flux Pro ist das kommerzielle Modell mit besserer Konsistenz, besserem Befolgen von Anweisungen und höherer Auflösung. Die Prompting-Techniken sind für beide identisch.
Machen Kameraspezifikationen in Flux-Prompts wirklich einen Unterschied?
Ja, Flux versteht technische Kameraspezifikationen sehr gut. Die Angabe eines Objektivs wie Canon 85mm f/1.4 erzeugt realistisches Bokeh, während ein 24mm f/8 ein schärferes Bild mit mehr Tiefenschärfe ergibt.