O Flux.1 mudou o jogo quando a Black Forest Labs o lançou em meados de 2024, e em 2026 tornou-se o gerador preferido de usuários que buscam resultados fotorrealistas com melhor renderização de texto e maior fidelidade aos prompts do que os concorrentes. Mas a força do Flux — sua sofisticada compreensão de linguagem natural — também confunde usuários que chegam do Midjourney ou Stable Diffusion com hábitos construídos em torno de prompts baseados em tags. Este guia mostra exatamente como o Flux pensa e como escrever prompts que produzam resultados impressionantes de forma consistente.

Vamos abordar a diferença de arquitetura que faz o Flux se comportar de forma diferente, o vocabulário específico ao qual ele responde melhor, 10 exemplos de prompts totalmente analisados e como usar o ImageToPrompt para gerar automaticamente prompts otimizados para Flux a partir de qualquer imagem de referência.

Variantes do Flux.1: Dev, Pro e Schnell

A Black Forest Labs lançou três variantes do Flux.1, cada uma com um equilíbrio diferente entre qualidade, velocidade e acessibilidade. Entender qual variante você está usando é importante porque elas têm sensibilidades de prompt ligeiramente diferentes.

Variante Velocidade Qualidade Licença Melhor Uso Steps Típicos
Flux.1 Dev ~20–40s (GPU) ★★★★★ Não comercial Projetos pessoais de alta qualidade, experimentação 20–50 steps
Flux.1 Pro ~15–30s (API) ★★★★★ Comercial (API) Trabalho profissional, projetos comerciais API gerenciada
Flux.1 Schnell ~2–5s (GPU) ★★★★☆ Apache 2.0 (aberta) Prototipagem rápida, geração em grande volume 4 steps

Para a maioria dos trabalhos criativos, o Flux.1 Dev é o melhor custo-benefício — produz qualidade comparável ao Pro sem custo por imagem via API quando rodado localmente. O Flux.1 Schnell é notável por sua velocidade (4 steps de inferência vs. 50 para a maioria dos modelos), mas produz detalhes ligeiramente mais suaves e é menos responsivo a nuances sutis de prompt. O Pro é a escolha para pipelines de produção comercial onde o licenciamento importa.

As três variantes compartilham a mesma lógica fundamental de prompting — as diferenças estão na qualidade e velocidade de geração, não na forma como processam texto.

Por Que o Flux Usa Linguagem Natural (E Por Que Isso Importa)

O Flux.1 é construído em uma arquitetura Diffusion Transformer (DiT) ao invés da arquitetura UNet usada pelo Stable Diffusion 1.5 e SDXL. Crucialmente, o Flux usa um codificador de texto T5-XXL — o mesmo tipo de modelo de linguagem grande usado na pesquisa do Google — em vez do CLIP.

O CLIP foi treinado principalmente para associar imagens a legendas curtas. Funciona bem com tags breves e descritivas, mas tem dificuldade com relações complexas, frases longas e instruções composicionais nuanceadas. O T5-XXL foi treinado em corpora de texto massivos e compreende sintaxe, gramática, estrutura de frases e contexto.

Essa diferença arquitetural é o motivo pelo qual:

Estrutura de Prompt do Flux: A Fórmula de Três Partes

Os prompts mais confiáveis para o Flux seguem uma estrutura de três partes: assunto e cena, depois detalhes técnicos fotográficos, depois estilo e clima. Isso espelha como um fotógrafo ou cinéasta profissional descreveria um briefing de tomada.

[DESCRIÇÃO DO ASSUNTO E CENA] + [CÂMERA E DETALHES TÉCNICOS] + [ESTILO E CLIMA]

Um exemplo concreto:

A middle-aged Japanese chef in a traditional white uniform carefully plating a bowl of ramen in a small Tokyo restaurant, steam rising from the broth, warm incandescent light overhead, other diners blurred in the background. Shot on Sony A7R V with 85mm f/1.4 lens, shallow depth of field, natural documentary lighting. Warm amber color grading, intimate storytelling mood, photojournalism style.

Vamos analisar por que isso funciona:

Terminologia de Câmera que Funciona no Flux

Especificar equipamento real de câmera é uma das técnicas mais poderosas do Flux. O codificador T5 reconhece modelos de câmera específicos e suas características visuais associadas — tamanho do sensor, faixa dinâmica, ciência de cores — e aplica essas qualidades à saída.

Corpos de Câmera

Lentes e Seus Efeitos

Configurações de Câmera

Descritores de Iluminação que Elevam os Resultados do Flux

A iluminação é sem dúvida o elemento mais impactante em prompts fotográficos. O treinamento do Flux com conteúdo fotográfico e cinematográfico significa que ele tem um vocabulário rico para condições de iluminação.

Luz Natural

Luz Artificial e de Estúdio

Iluminação Cinemática

Descritores de Estilo que Funcionam Bem no Flux

Diferentemente do Stable Diffusion, que precisa de tokens de estilo específicos de checkpoint, o Flux entende descrições estilísticas através de seu modelo de linguagem. Estes descritores produzem resultados reconhecíveis de forma consistente:

Estilos Fotográficos

Estilos de Arte e Ilustração

Estilos Cinematográficos

O Que NÃO Fazer nos Prompts do Flux

Vindo do Stable Diffusion ou Midjourney, estes hábitos prejudicarão seus resultados no Flux:

O outro lado: O Flux também lida com prompts muito longos e detalhados melhor do que qualquer modelo anterior. Não tenha medo de prompts com mais de 100 palavras que leiam como direção detalhada de cena — o Flux vai segui-los com precisão.

Saída do Flux.1 Dev — cena paisagística demonstrando renderização fotorrealista com detalhes precisos e prompt em linguagem natural
Flux.1 Dev: resultados fotorrealistas e precisos em detalhes
Saída do Flux.1 Dev — cena de arquitetura mostrando geometria nítida e renderização espacial precisa a partir de prompt descritivo
O Flux lida com instruções espaciais complexas com precisão

10 Exemplos de Prompts com Análise

1. Fotografia de Retrato

A 30-year-old woman with natural red hair sits by a rain-streaked window in a coffee shop, looking contemplative, hands wrapped around a ceramic mug. Late afternoon, overcast daylight from the left side, warm tungsten interior lights creating a color contrast. Shot on Fujifilm GFX 100S, 110mm f/2 equivalent, shallow depth of field. Kodak Portra 400 film emulation, slightly desaturated greens, intimate documentary feel.

Por que funciona: Descrição específica do sujeito, configuração de iluminação precisa com direção da luz indicada, filme nomeado para orientação de coloração, descritor de clima no final.

2. Fotografia de Arquitetura

The interior of a modernist cathedral, concrete brutalist architecture, shafts of light cutting through narrow vertical windows high on the walls, casting long geometric shadows on the textured concrete floor. Shot on Canon EOS R5, 17mm tilt-shift lens, all vertical lines corrected, f/11, everything in sharp focus. Monochromatic, high contrast black and white, fine art architectural photography.

3. Paisagem de Fantasia

A vast alien landscape at twilight: twin moons rising over a plateau covered in bioluminescent blue-purple vegetation, a lone explorer in a spacesuit standing at the edge, small against the scale of the environment. The atmosphere is thick and hazy, creating atmospheric perspective and layered depth. Painted in a style combining photorealistic digital art with concept art looseness, cinematic composition, epic scale, ultra-detailed foreground plants.

4. Fotografia de Rua

A crowded Tokyo crossing at rush hour, motion blur on the pedestrians suggesting movement, one sharply focused businessman in the center looking directly at the camera, surprised expression. Heavy rain, reflected neon signs on wet pavement, shallow depth. Shot on Leica Q3, 28mm f/1.7, ISO 6400, available light only. Black and white with deep shadows, photojournalism aesthetic.

5. Fotografia de Produto

A single glass bottle of amber whiskey on a dark walnut table, dramatic side lighting from a single spotlight source creating a strong specular highlight on the glass, warm amber liquid glowing. Dark background fading to black. Shot on Phase One IQ4, 120mm macro, f/8. Commercial product photography, ultra-clean, advertising quality, every glass bubble and label detail sharp.

6. Fotografia de Vida Selvagem

A Bengal tiger wading through shallow water in a misty forest, early morning light filtering through dense canopy, water droplets frozen mid-splash around its legs. The tiger is alert, head turned slightly toward the camera. Shot on Nikon Z9, 500mm f/4 telephoto, 1/2000s to freeze motion, natural forest light. National Geographic quality wildlife photography, tack-sharp eyes, motion-blurred water.

7. Fotografia Gastronômica

A bowl of handmade pasta with cherry tomatoes, basil, and olive oil on a rough linen tablecloth, afternoon light from a kitchen window at 45 degrees, casting soft shadows. Steam rising from the pasta. Overhead angle, 45-degree composition. Shot on Sony A7R V, 90mm macro f/2.8. Warm editorial food photography, slightly desaturated background to make the food pop, Bon Appétit magazine aesthetic.

8. Concept Art Sci-Fi

Interior of a colossal generation ship, showing the agricultural rings with forests and fields curving upward in the centrifugal section, sunlight simulated by a central light tube, people as small figures walking between trees. The scale is breathtaking — the curvature of the interior visible. Detailed digital concept art, matte painting quality, warm environmental lighting, realistic atmospheric haze for scale, inspired by classic sci-fi illustration.

9. Fotografia de Moda

A model in a dramatic black structured coat stands in an empty white marble corridor, strong directional light from a large window to the right, creating graphic shadows across the floor. Editorial, minimal composition, confident pose with coat flowing slightly. Shot on Hasselblad X2D, 80mm f/2.8, balanced ambient and natural light. High fashion editorial, Vogue quality, exceptional tonal range, no distracting elements.

10. Macro Natureza

Extreme macro photography of a single dewdrop on a spider web strand, inside the dewdrop a perfectly formed reflection of the surrounding forest and morning sky visible. Overcast soft light, maximum detail in the water surface tension and web filaments. Shot on Canon MP-E 65mm 5x macro, f/11, focus-stacked for complete depth of field. Scientific illustration quality, razor-sharp details, magical natural world mood.

Usando o ImageToPrompt para Gerar Prompts Flux a partir de Imagens de Referência

Elaborar prompts para o Flux manualmente exige conhecer esse vocabulário específico — modelos de câmera, termos de iluminação, referências de estilo. Quando você tem uma imagem de referência e quer gerar algo semelhante no Flux, o ImageToPrompt.dev faz a tradução de vocabulário automaticamente.

Quando você seleciona Flux como modelo alvo no ImageToPrompt:

  1. A ferramenta analisa sua imagem de referência usando Claude Vision
  2. Identifica as características fotográficas: distância focal aparente, configuração de iluminação, profundidade de campo, coloração
  3. Associa essas características ao vocabulário apropriado do Flux: equipamento específico de câmera, terminologia de iluminação, descritores de estilo
  4. Formata a saída como um parágrafo coerente em linguagem natural, não uma lista de tags

Uma fotografia de referência de um nascer do sol em floresta nublada, analisada pelo ImageToPrompt com alvo Flux, poderia produzir:

A dense Pacific Northwest forest in early morning, shafts of golden light cutting through mist between towering Douglas firs, the ground covered in soft green moss and fallen needles, a narrow dirt path disappearing into the fog. Shot on Sony A7R V, 35mm f/8, deep depth of field capturing both foreground moss texture and distant hazy trees. Moody and meditative, ethereal morning light, fine art landscape photography, muted cool shadows contrasting with warm light beams.

Erros Comuns de Iniciantes no Flux

  1. Tratar o Flux como Midjourney. Sem flags --ar, sem parâmetros --style, sem --v 6.1. O Flux precisa de texto puramente descritivo.
  2. Tratar o Flux como Stable Diffusion. Sem tokens (quality:1.4), sem listas de tags separadas por vírgula, sem campo de prompt negativo.
  3. Descrever a cena de forma insuficiente. “A beautiful landscape” dá ao Flux muito pouco para trabalhar. “A rocky coastal cliff at dawn, tide pools reflecting the pink sky, a lone lighthouse in the distance” dá ao Flux uma cena para construir.
  4. Não especificar a proporção nas configurações da interface. O Flux determina a proporção a partir das configurações, não do prompt. Se você quer um retrato vertical, defina 9:16 nas configurações de geração — não coloque isso no texto do prompt.
  5. Esperar perfeição imediata. Mesmo com excelentes prompts, as gerações do Flux se beneficiam de 3–5 variações. A natureza estocástica da difusão significa que a qualidade varia entre seeds.
  6. Ignorar o guidance scale (CFG). O Flux Dev funciona bem com valores de CFG de 3,5–4,0. Valores mais altos (7,0+) que funcionam no SD produzirão resultados supersaturados e cheios de artefatos no Flux.
  7. Usar nomes de artistas como atalhos de estilo sem descrição. “by Greg Rutkowski” é mais ambíguo para o Flux do que “epic fantasy concept art with warm lighting and dramatic composition” — embora combinar ambos frequentemente funcione melhor.

Gere Prompts Flux Automaticamente

Envie uma imagem ou descreva sua ideia e obtenha um prompt Flux otimizado em segundos.

Gerador de Prompts Flux →

Perguntas Frequentes

Qual é a melhor forma de escrever prompts para o Flux AI?

O Flux AI responde melhor a linguagem natural detalhada do que a tags separadas por vírgulas. Descreva sua cena como um parágrafo, incluindo o assunto, o enquadramento, a iluminação, a óptica (ex: Canon 85mm f/1.4) e a atmosfera.

O Flux suporta prompts negativos?

Não, o Flux não suporta prompts negativos ao contrário do Stable Diffusion. Para evitar elementos indesejados, formule seu prompt de maneira positiva e precisa, descrevendo exatamente o que você quer ver.

Qual é a diferença entre Flux Dev e Flux Pro?

O Flux Dev é o modelo open-source gratuito com qualidade ligeiramente inferior. O Flux Pro é o modelo comercial com melhor consistência, melhor seguimento de instruções e resolução superior. As técnicas de prompting são idênticas para ambos.

As especificações de câmera nos prompts do Flux realmente fazem diferença?

Sim, o Flux compreende muito bem as especificações técnicas de câmera. Mencionar uma lente como Canon 85mm f/1.4 produz um bokeh realista, enquanto uma 24mm f/8 resultará em uma imagem mais nítida com mais profundidade de campo.