O Flux.1 mudou o jogo quando a Black Forest Labs o lançou em meados de 2024, e em 2026 tornou-se o gerador preferido de usuários que buscam resultados fotorrealistas com melhor renderização de texto e maior fidelidade aos prompts do que os concorrentes. Mas a força do Flux — sua sofisticada compreensão de linguagem natural — também confunde usuários que chegam do Midjourney ou Stable Diffusion com hábitos construídos em torno de prompts baseados em tags. Este guia mostra exatamente como o Flux pensa e como escrever prompts que produzam resultados impressionantes de forma consistente.
Vamos abordar a diferença de arquitetura que faz o Flux se comportar de forma diferente, o vocabulário específico ao qual ele responde melhor, 10 exemplos de prompts totalmente analisados e como usar o ImageToPrompt para gerar automaticamente prompts otimizados para Flux a partir de qualquer imagem de referência.
Variantes do Flux.1: Dev, Pro e Schnell
A Black Forest Labs lançou três variantes do Flux.1, cada uma com um equilíbrio diferente entre qualidade, velocidade e acessibilidade. Entender qual variante você está usando é importante porque elas têm sensibilidades de prompt ligeiramente diferentes.
| Variante | Velocidade | Qualidade | Licença | Melhor Uso | Steps Típicos |
|---|---|---|---|---|---|
| Flux.1 Dev | ~20–40s (GPU) | ★★★★★ | Não comercial | Projetos pessoais de alta qualidade, experimentação | 20–50 steps |
| Flux.1 Pro | ~15–30s (API) | ★★★★★ | Comercial (API) | Trabalho profissional, projetos comerciais | API gerenciada |
| Flux.1 Schnell | ~2–5s (GPU) | ★★★★☆ | Apache 2.0 (aberta) | Prototipagem rápida, geração em grande volume | 4 steps |
Para a maioria dos trabalhos criativos, o Flux.1 Dev é o melhor custo-benefício — produz qualidade comparável ao Pro sem custo por imagem via API quando rodado localmente. O Flux.1 Schnell é notável por sua velocidade (4 steps de inferência vs. 50 para a maioria dos modelos), mas produz detalhes ligeiramente mais suaves e é menos responsivo a nuances sutis de prompt. O Pro é a escolha para pipelines de produção comercial onde o licenciamento importa.
As três variantes compartilham a mesma lógica fundamental de prompting — as diferenças estão na qualidade e velocidade de geração, não na forma como processam texto.
Por Que o Flux Usa Linguagem Natural (E Por Que Isso Importa)
O Flux.1 é construído em uma arquitetura Diffusion Transformer (DiT) ao invés da arquitetura UNet usada pelo Stable Diffusion 1.5 e SDXL. Crucialmente, o Flux usa um codificador de texto T5-XXL — o mesmo tipo de modelo de linguagem grande usado na pesquisa do Google — em vez do CLIP.
O CLIP foi treinado principalmente para associar imagens a legendas curtas. Funciona bem com tags breves e descritivas, mas tem dificuldade com relações complexas, frases longas e instruções composicionais nuanceadas. O T5-XXL foi treinado em corpora de texto massivos e compreende sintaxe, gramática, estrutura de frases e contexto.
Essa diferença arquitetural é o motivo pelo qual:
- O Flux consegue renderizar texto com precisão em imagens (uma fraqueza histórica de todos os modelos de difusão)
- O Flux segue instruções composicionais complexas com múltiplas cláusulas
- O Flux entende linguagem relacional: “uma pessoa em pé à esquerda de um carro vermelho”
- O Flux NÃO se beneficia de tags separadas por vírgulas como os modelos SD 1.5
- O Flux NÃO se beneficia da sintaxe
(keyword:weight)— ele ignora os marcadores de peso
Estrutura de Prompt do Flux: A Fórmula de Três Partes
Os prompts mais confiáveis para o Flux seguem uma estrutura de três partes: assunto e cena, depois detalhes técnicos fotográficos, depois estilo e clima. Isso espelha como um fotógrafo ou cinéasta profissional descreveria um briefing de tomada.
[DESCRIÇÃO DO ASSUNTO E CENA] + [CÂMERA E DETALHES TÉCNICOS] + [ESTILO E CLIMA]
Um exemplo concreto:
A middle-aged Japanese chef in a traditional white uniform carefully plating a bowl of ramen in a small Tokyo restaurant, steam rising from the broth, warm incandescent light overhead, other diners blurred in the background. Shot on Sony A7R V with 85mm f/1.4 lens, shallow depth of field, natural documentary lighting. Warm amber color grading, intimate storytelling mood, photojournalism style.
Vamos analisar por que isso funciona:
- “carefully plating” — o advérbio captura a pose e a ação melhor do que apenas “plating”
- “steam rising from the broth” — detalhe atmosférico que o Flux renderiza literalmente
- “other diners blurred in the background” — o Flux entende isso como uma instrução de profundidade de campo
- Especificação de câmera/lente — sinaliza intenção fotorrealista e características específicas de bokeh
- “intimate storytelling mood” — instrução composicional e tonal
Terminologia de Câmera que Funciona no Flux
Especificar equipamento real de câmera é uma das técnicas mais poderosas do Flux. O codificador T5 reconhece modelos de câmera específicos e suas características visuais associadas — tamanho do sensor, faixa dinâmica, ciência de cores — e aplica essas qualidades à saída.
Corpos de Câmera
Sony A7R V— alta resolução, detalhado, ciência de cores neutraCanon EOS R5— quente, tons de pele agradáveis, renderização naturalNikon Z9— contraste marcante, forte faixa dinâmicaFujifilm X-T5— cores como filme, ciência de cores Fujifilm (especialmente com nomes de simulação de filme)Hasselblad X2D— visual de médio formato, gradação tonal excepcionalLeica M11— clássica, levemente contida, estética documentalPhase One IQ4— visual comercial/moda de altíssima qualidade
Lentes e Seus Efeitos
24mm f/1.4 wide angle— contexto ambiental, leve distorção nas bordas, perspectiva dramática35mm f/2— fotografia de rua clássica, perspectiva natural50mm f/1.2— perspectiva neutra, excelente bokeh, versátil85mm f/1.4— compressão de retrato favorecedora, desfoque de fundo cremoso135mm f/2— forte compressão, sujeito isolado, bokeh pictorialista200mm f/2.8 telephoto— fundo comprimido, estética de esporte/vida selvagemmacro lens, 1:1— close-up extremo, alto nível de detalhe
Configurações de Câmera
ISO 3200, high grain— adiciona textura de granulação tipo filme para estética documentallong exposure, motion blur— captura movimento, trilhas de luzf/22, deep depth of field, everything in focus— visual de paisagem/arquiteturaf/1.2, razor-thin focus plane— separação extrema entre sujeito e fundo
Descritores de Iluminação que Elevam os Resultados do Flux
A iluminação é sem dúvida o elemento mais impactante em prompts fotográficos. O treinamento do Flux com conteúdo fotográfico e cinematográfico significa que ele tem um vocabulário rico para condições de iluminação.
Luz Natural
golden hour light— luz solar quente, direcional e de ângulo baixo, sombras longasblue hour— crepúsculo suave e frio logo após o pôr do solovercast diffused light— luz uniforme, sem sombras, suave — ideal para retratosharsh midday sun, high contrast shadows— dramático, estética de calor de verãodappled light through tree canopy— luz de floresta, padrões de sombra em movimentowindow light, one-sided illumination— iluminação clássica de retrato interior
Luz Artificial e de Estúdio
Rembrandt lighting— caracterizada por um triângulo de luz sob um olho; iluminação clássica de retratosplit lighting, half shadow— dramática, um lado totalmente iluminado, outro na sombraring light, flat frontal lighting— visual de moda/beleza, reflexos nos olhosneon sign reflections, colored light— fotografia noturna urbanacandlelight, single flame source— quente, cintilante, íntimabioluminescent glow— azuis e verdes frios, sci-fi ou fantasia
Iluminação Cinemática
volumetric light, god rays— feixes de luz visíveis através da atmosfera/névoachiaroscuro— contraste extremo entre áreas claras e escuras, pictorialistapractical lighting from below— visual de horror/suspense, sombras desfavorecedorasmotivated lighting, warm practical sources— cinematografia realista de interiores
Descritores de Estilo que Funcionam Bem no Flux
Diferentemente do Stable Diffusion, que precisa de tokens de estilo específicos de checkpoint, o Flux entende descrições estilísticas através de seu modelo de linguagem. Estes descritores produzem resultados reconhecíveis de forma consistente:
Estilos Fotográficos
photojournalism, documentary stylefashion editorial, high-end commercialstreet photography, candid momentfine art photography, gallery print qualityanalog film photography, 35mm grainmedium format film, Kodak Portra 400 colors
Estilos de Arte e Ilustração
oil painting, visible brushwork, museum qualitywatercolor illustration, soft edges, paper texturedigital concept art, highly detailed, ArtStation qualitygraphic novel illustration, bold lines, flat colorArt Nouveau style, ornamental, flowing lines
Estilos Cinematográficos
cinematic film still, anamorphic lens flaremovie poster compositionin the visual style of a Wes Anderson film— simétrico, pastel, planonoir film aesthetic, black and white, hard shadows
O Que NÃO Fazer nos Prompts do Flux
Vindo do Stable Diffusion ou Midjourney, estes hábitos prejudicarão seus resultados no Flux:
- NÃO use a sintaxe (keyword:weight). O Flux ignora completamente os modificadores de peso entre parênteses.
(beautiful:1.4)ebeautifulproduzem resultados idênticos no Flux. - NÃO use flags --ar, --v, --style. Esses são parâmetros específicos do Midjourney. Eles aparecerão como texto literal nas saídas do Flux.
- NÃO use prompts negativos no Flux Dev/Schnell. O Flux padrão não suporta prompts negativos como o SD. Use linguagem positiva descritiva: diga “clean, sharp background” em vez de tentar usar prompt negativo para “blurry background”.
- NÃO coloque tokens de qualidade no início. “masterpiece, best quality, ultra detailed, 1girl” é sintaxe de SD. O Flux interpreta isso como uma frase literal e pode gerar uma imagem rotulada como “masterpiece”.
- NÃO escreva prompts extremamente curtos. O codificador T5 do Flux funciona melhor com informações contextuais mais ricas. Um prompt de 50 palavras geralmente supera um de 10 palavras para cenas complexas.
- NÃO liste tags separadas por vírgulas sem estrutura gramatical. “woman, forest, sunlight, beautiful, high quality” dá ao Flux menos informação do que “a woman standing in a sunlit forest, late afternoon, high quality photograph”.
O outro lado: O Flux também lida com prompts muito longos e detalhados melhor do que qualquer modelo anterior. Não tenha medo de prompts com mais de 100 palavras que leiam como direção detalhada de cena — o Flux vai segui-los com precisão.


10 Exemplos de Prompts com Análise
1. Fotografia de Retrato
A 30-year-old woman with natural red hair sits by a rain-streaked window in a coffee shop, looking contemplative, hands wrapped around a ceramic mug. Late afternoon, overcast daylight from the left side, warm tungsten interior lights creating a color contrast. Shot on Fujifilm GFX 100S, 110mm f/2 equivalent, shallow depth of field. Kodak Portra 400 film emulation, slightly desaturated greens, intimate documentary feel.
Por que funciona: Descrição específica do sujeito, configuração de iluminação precisa com direção da luz indicada, filme nomeado para orientação de coloração, descritor de clima no final.
2. Fotografia de Arquitetura
The interior of a modernist cathedral, concrete brutalist architecture, shafts of light cutting through narrow vertical windows high on the walls, casting long geometric shadows on the textured concrete floor. Shot on Canon EOS R5, 17mm tilt-shift lens, all vertical lines corrected, f/11, everything in sharp focus. Monochromatic, high contrast black and white, fine art architectural photography.
3. Paisagem de Fantasia
A vast alien landscape at twilight: twin moons rising over a plateau covered in bioluminescent blue-purple vegetation, a lone explorer in a spacesuit standing at the edge, small against the scale of the environment. The atmosphere is thick and hazy, creating atmospheric perspective and layered depth. Painted in a style combining photorealistic digital art with concept art looseness, cinematic composition, epic scale, ultra-detailed foreground plants.
4. Fotografia de Rua
A crowded Tokyo crossing at rush hour, motion blur on the pedestrians suggesting movement, one sharply focused businessman in the center looking directly at the camera, surprised expression. Heavy rain, reflected neon signs on wet pavement, shallow depth. Shot on Leica Q3, 28mm f/1.7, ISO 6400, available light only. Black and white with deep shadows, photojournalism aesthetic.
5. Fotografia de Produto
A single glass bottle of amber whiskey on a dark walnut table, dramatic side lighting from a single spotlight source creating a strong specular highlight on the glass, warm amber liquid glowing. Dark background fading to black. Shot on Phase One IQ4, 120mm macro, f/8. Commercial product photography, ultra-clean, advertising quality, every glass bubble and label detail sharp.
6. Fotografia de Vida Selvagem
A Bengal tiger wading through shallow water in a misty forest, early morning light filtering through dense canopy, water droplets frozen mid-splash around its legs. The tiger is alert, head turned slightly toward the camera. Shot on Nikon Z9, 500mm f/4 telephoto, 1/2000s to freeze motion, natural forest light. National Geographic quality wildlife photography, tack-sharp eyes, motion-blurred water.
7. Fotografia Gastronômica
A bowl of handmade pasta with cherry tomatoes, basil, and olive oil on a rough linen tablecloth, afternoon light from a kitchen window at 45 degrees, casting soft shadows. Steam rising from the pasta. Overhead angle, 45-degree composition. Shot on Sony A7R V, 90mm macro f/2.8. Warm editorial food photography, slightly desaturated background to make the food pop, Bon Appétit magazine aesthetic.
8. Concept Art Sci-Fi
Interior of a colossal generation ship, showing the agricultural rings with forests and fields curving upward in the centrifugal section, sunlight simulated by a central light tube, people as small figures walking between trees. The scale is breathtaking — the curvature of the interior visible. Detailed digital concept art, matte painting quality, warm environmental lighting, realistic atmospheric haze for scale, inspired by classic sci-fi illustration.
9. Fotografia de Moda
A model in a dramatic black structured coat stands in an empty white marble corridor, strong directional light from a large window to the right, creating graphic shadows across the floor. Editorial, minimal composition, confident pose with coat flowing slightly. Shot on Hasselblad X2D, 80mm f/2.8, balanced ambient and natural light. High fashion editorial, Vogue quality, exceptional tonal range, no distracting elements.
10. Macro Natureza
Extreme macro photography of a single dewdrop on a spider web strand, inside the dewdrop a perfectly formed reflection of the surrounding forest and morning sky visible. Overcast soft light, maximum detail in the water surface tension and web filaments. Shot on Canon MP-E 65mm 5x macro, f/11, focus-stacked for complete depth of field. Scientific illustration quality, razor-sharp details, magical natural world mood.
Usando o ImageToPrompt para Gerar Prompts Flux a partir de Imagens de Referência
Elaborar prompts para o Flux manualmente exige conhecer esse vocabulário específico — modelos de câmera, termos de iluminação, referências de estilo. Quando você tem uma imagem de referência e quer gerar algo semelhante no Flux, o ImageToPrompt.dev faz a tradução de vocabulário automaticamente.
Quando você seleciona Flux como modelo alvo no ImageToPrompt:
- A ferramenta analisa sua imagem de referência usando Claude Vision
- Identifica as características fotográficas: distância focal aparente, configuração de iluminação, profundidade de campo, coloração
- Associa essas características ao vocabulário apropriado do Flux: equipamento específico de câmera, terminologia de iluminação, descritores de estilo
- Formata a saída como um parágrafo coerente em linguagem natural, não uma lista de tags
Uma fotografia de referência de um nascer do sol em floresta nublada, analisada pelo ImageToPrompt com alvo Flux, poderia produzir:
A dense Pacific Northwest forest in early morning, shafts of golden light cutting through mist between towering Douglas firs, the ground covered in soft green moss and fallen needles, a narrow dirt path disappearing into the fog. Shot on Sony A7R V, 35mm f/8, deep depth of field capturing both foreground moss texture and distant hazy trees. Moody and meditative, ethereal morning light, fine art landscape photography, muted cool shadows contrasting with warm light beams.
Erros Comuns de Iniciantes no Flux
- Tratar o Flux como Midjourney. Sem flags --ar, sem parâmetros --style, sem --v 6.1. O Flux precisa de texto puramente descritivo.
- Tratar o Flux como Stable Diffusion. Sem tokens
(quality:1.4), sem listas de tags separadas por vírgula, sem campo de prompt negativo. - Descrever a cena de forma insuficiente. “A beautiful landscape” dá ao Flux muito pouco para trabalhar. “A rocky coastal cliff at dawn, tide pools reflecting the pink sky, a lone lighthouse in the distance” dá ao Flux uma cena para construir.
- Não especificar a proporção nas configurações da interface. O Flux determina a proporção a partir das configurações, não do prompt. Se você quer um retrato vertical, defina 9:16 nas configurações de geração — não coloque isso no texto do prompt.
- Esperar perfeição imediata. Mesmo com excelentes prompts, as gerações do Flux se beneficiam de 3–5 variações. A natureza estocástica da difusão significa que a qualidade varia entre seeds.
- Ignorar o guidance scale (CFG). O Flux Dev funciona bem com valores de CFG de 3,5–4,0. Valores mais altos (7,0+) que funcionam no SD produzirão resultados supersaturados e cheios de artefatos no Flux.
- Usar nomes de artistas como atalhos de estilo sem descrição. “by Greg Rutkowski” é mais ambíguo para o Flux do que “epic fantasy concept art with warm lighting and dramatic composition” — embora combinar ambos frequentemente funcione melhor.
Gere Prompts Flux Automaticamente
Envie uma imagem ou descreva sua ideia e obtenha um prompt Flux otimizado em segundos.
Gerador de Prompts Flux →Perguntas Frequentes
Qual é a melhor forma de escrever prompts para o Flux AI?
O Flux AI responde melhor a linguagem natural detalhada do que a tags separadas por vírgulas. Descreva sua cena como um parágrafo, incluindo o assunto, o enquadramento, a iluminação, a óptica (ex: Canon 85mm f/1.4) e a atmosfera.
O Flux suporta prompts negativos?
Não, o Flux não suporta prompts negativos ao contrário do Stable Diffusion. Para evitar elementos indesejados, formule seu prompt de maneira positiva e precisa, descrevendo exatamente o que você quer ver.
Qual é a diferença entre Flux Dev e Flux Pro?
O Flux Dev é o modelo open-source gratuito com qualidade ligeiramente inferior. O Flux Pro é o modelo comercial com melhor consistência, melhor seguimento de instruções e resolução superior. As técnicas de prompting são idênticas para ambos.
As especificações de câmera nos prompts do Flux realmente fazem diferença?
Sim, o Flux compreende muito bem as especificações técnicas de câmera. Mencionar uma lente como Canon 85mm f/1.4 produz um bokeh realista, enquanto uma 24mm f/8 resultará em uma imagem mais nítida com mais profundidade de campo.