O Stable Diffusion é o gerador de imagens IA mais flexível e mais técnico. Diferente do Midjourney ou do DALL-E 3, que simplificam a experiência do usuário, o Stable Diffusion dá a você controle granular sobre cada aspecto da geração — mas isso exige dominar uma sintaxe de prompt específica e parâmetros técnicos que os outros modelos não utilizam.
Gerador automático: Nosso gerador de prompts Stable Diffusion cria prompts otimizados com a sintaxe ponderada, quality tags e prompts negativos adaptados à sua versão de SD. Faça upload de uma imagem de referência para começar.
A Sintaxe Ponderada Explicada
A sintaxe ponderada é o que torna o Stable Diffusion único entre os geradores de imagens IA. Ela permite que você aumente ou diminua a importância relativa de cada termo no seu prompt.
Sintaxe Básica
O formato é (termo:peso) onde o peso é um número decimal. O valor padrão é 1.0.
(golden hour:1.3)— aumenta a importância de "golden hour" em 30%(bokeh:0.7)— reduz a importância de "bokeh" em 30%(masterpiece:1.2), (best quality:1.1)— quality tags com ponderação
Atalhos de Ponderação
O Stable Diffusion também suporta atalhos com parênteses múltiplos:
(termo)=(termo:1.1)((termo))=(termo:1.21)(((termo)))=(termo:1.33)[termo]=(termo:0.9)— reduz o peso
Regras de Ponderação
A ponderação é uma ferramenta poderosa, mas deve ser usada com discernimento:
- Mantenha entre 0.5 e 1.5: Além disso, você arrisca artefatos visuais e distorções
- Pondere poucos termos: Se tudo está ponderado em 1.3, nada é realmente destacado
- Use a ponderação para resolver problemas: Se um elemento não aparece, aumente seu peso. Se domina demais, reduza-o
Exemplo Completo
(masterpiece:1.2), (best quality:1.1), 1girl, (flowing red hair:1.2), green eyes, (medieval dress:1.1), standing in a (enchanted forest:1.3), (golden hour lighting:1.2), (bokeh:0.8), detailed face, soft shadows
Dominando os Prompts Negativos
Os prompts negativos são uma funcionalidade exclusiva do Stable Diffusion (e dos modelos derivados). Eles indicam ao modelo o que você NÃO quer ver na imagem. Muitas vezes, é a diferença entre um resultado amador e um resultado profissional.
Prompt Negativo Universal
Este prompt negativo funciona bem como base para a maioria das gerações:
(worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, username, blurry, deformed, jpeg artifacts
Prompts Negativos Especializados
Para retratos:
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra fingers, mutated hands, poorly drawn face, ugly, disfigured, cross-eyed, asymmetric face, extra limbs, fused fingers
Para paisagens:
(worst quality:1.4), (low quality:1.4), blurry, watermark, text, logo, oversaturated, distorted horizon, unnatural colors
Para anime:
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra digits, missing fingers, poorly drawn face, simple background, flat colors, bad proportions
Tags de Qualidade Essenciais
As quality tags são palavras-chave que melhoram a qualidade geral da imagem. Sua eficácia varia conforme a versão do Stable Diffusion e o checkpoint utilizado.
Tags Mais Eficazes
| Tag | Efeito | Eficaz em |
|---|---|---|
masterpiece |
Qualidade máxima, composição cuidadosa | SD 1.5, alguns SDXL |
best quality |
Detalhes finos, renderização limpa | SD 1.5, SDXL |
highly detailed |
Aumenta o nível de detalhes | Todos |
sharp focus |
Nitidez aprimorada | Todos |
8k uhd |
Alta resolução aparente | SD 1.5, variável no SDXL |
intricate details |
Detalhes complexos e finos | Todos |
Diferenças entre SD 1.5, SDXL e SD 3.5
SD 1.5
A versão mais madura, com o maior ecossistema de checkpoints e LoRAs. Os prompts do SD 1.5 dependem fortemente de quality tags e da sintaxe ponderada. Resolução nativa: 512x512.
Prompt tipo: (masterpiece:1.2), (best quality:1.1), highly detailed, 1girl, long blonde hair, blue eyes, white dress, standing in flower field, golden hour, (bokeh:0.8), sharp focus
SDXL
Resolução nativa de 1024x1024 com compreensão aprimorada de linguagem natural. O SDXL necessita menos quality tags, mas ainda se beneficia da ponderação para controle preciso. O sistema de dois codificadores de texto (CLIP ViT-L e OpenCLIP ViT-bigG) proporciona melhor compreensão semântica.
Prompt tipo: beautiful young woman with long blonde hair, wearing an elegant white dress, standing in a sunlit wildflower meadow, (golden hour:1.2), soft bokeh background, detailed skin texture, professional photography
SD 3.5
A versão mais recente utiliza uma arquitetura MMDiT (Multi-Modal Diffusion Transformer) que compreende muito melhor a linguagem natural. As quality tags tradicionais têm menos impacto. Descrições detalhadas em linguagem natural funcionam melhor.
Prompt tipo: A beautiful young woman with flowing blonde hair and bright blue eyes stands in a vast field of wildflowers during golden hour. She wears an elegant white summer dress that catches the warm breeze. The background is softly blurred with warm amber tones. Professional portrait photography with detailed skin texture and natural soft lighting.
Compatibilidade com Checkpoints
Os checkpoints (modelos personalizados) são um dos maiores trunfos do Stable Diffusion. Cada checkpoint foi treinado com preferências de prompt específicas.
- Realistic Vision: Excelente com prompts fotográficos detalhados e termos de câmera (
Canon EOS R5, 85mm f/1.4, RAW photo) - DreamShaper: Versátil, funciona bem com prompts mistos de arte/foto
- Anything V5: Otimizado para anime, usa tags danbooru (
1girl, long_hair, blue_eyes, school_uniform) - Juggernaut XL: Checkpoint SDXL popular, favorece linguagem natural com quality tags moderadas
Dica importante: sempre leia a página do checkpoint no CivitAI para conhecer os prompts recomendados e as quality tags preferidas. Um prompt perfeito para um checkpoint pode ser ineficaz para outro.
CFG Scale, Steps e Samplers
CFG Scale (Classifier-Free Guidance)
O CFG Scale controla a fidelidade ao prompt. É um parâmetro fundamental que muitos iniciantes negligenciam.
- CFG 3-5: Criativo, livre — o modelo toma liberdades com seu prompt
- CFG 7-9: Equilibrado — bom equilíbrio entre criatividade e fidelidade (recomendado)
- CFG 10-15: Rigoroso — segue o prompt de perto, mas pode supersaturar
- CFG 15+: Não recomendado — artefatos frequentes e cores artificiais
Steps (Etapas de difusão)
O número de steps influencia o tempo de geração e a qualidade do resultado:
- 15-20 steps: Rápido, qualidade aceitável para testes
- 25-35 steps: Bom equilíbrio qualidade/velocidade (recomendado)
- 40-50 steps: Alta qualidade, tempo de geração mais longo
- 50+ steps: Retornos decrescentes — raramente necessário
Samplers
A escolha do sampler afeta a qualidade e o estilo do resultado. Os mais populares em 2026:
- DPM++ 2M Karras: O padrão — rápido e de boa qualidade
- Euler a: Criativo, bom para composições artísticas
- DPM++ SDE Karras: Excelente para detalhes finos e texturas
- UniPC: Rápido e eficiente, bom para prototipagem
Templates de Prompts Avançados
Retrato Fotorrealista (SD 1.5)
Prompt: (masterpiece:1.2), (best quality:1.1), (RAW photo:1.2), portrait of a 30 year old woman, (detailed skin texture:1.2), natural skin, freckles, green eyes, auburn hair, (natural lighting:1.1), f/2.8, Canon EOS R5, 85mm lens, shallow depth of field
Negativo: (worst quality:1.4), (low quality:1.4), bad anatomy, deformed iris, extra fingers, poorly drawn face, airbrushed skin, plastic skin, doll-like
Paisagem Fantasia (SDXL)
Prompt: majestic fantasy landscape, ancient ruins overgrown with luminescent plants, (floating islands:1.2) in a purple twilight sky, waterfalls cascading into mist, (volumetric lighting:1.3), ethereal atmosphere, concept art quality, highly detailed, 8k
Negativo: (worst quality:1.4), blurry, watermark, text, oversaturated, flat lighting
Anime (Anything V5)
Prompt: (masterpiece:1.2), (best quality:1.1), 1girl, long silver hair, violet eyes, detailed eyes, (fantasy armor:1.2), glowing runes, dynamic pose, magical particles, night sky background, (bloom:0.8), detailed face
Negativo: (worst quality:1.4), (low quality:1.4), bad anatomy, extra limbs, poorly drawn hands, simple background, flat shading
Gere Prompts Stable Diffusion Otimizados
Faça upload de uma imagem de referência e obtenha um prompt Stable Diffusion completo com sintaxe ponderada, quality tags e prompt negativo.
Experimentar o Gerador SD →Perguntas Frequentes
Como funciona a sintaxe ponderada no Stable Diffusion?
A sintaxe ponderada usa parênteses e dois-pontos para aumentar ou diminuir a importância de um termo. (termo:1.3) aumenta o peso em 30%, (termo:0.7) reduz em 30%. O valor padrão é 1.0. Evite pesos acima de 1.5, que causam artefatos visuais e distorções.
Quais são os melhores prompts negativos para Stable Diffusion?
Um bom prompt negativo universal: (worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, blurry, deformed. Para retratos, adicione termos específicos como extra fingers, mutated hands, poorly drawn face. Adapte conforme o checkpoint utilizado.
Qual a diferença entre SD 1.5, SDXL e SD 3.5 para prompts?
SD 1.5 necessita prompts muito estruturados com quality tags e responde bem à sintaxe ponderada. SDXL compreende melhor a linguagem natural e requer menos quality tags. SD 3.5 utiliza um novo sistema que favorece descrições naturais detalhadas, semelhante ao Flux, com menos dependência de tags técnicas.
Como escolher o CFG Scale certo para meus prompts Stable Diffusion?
O CFG Scale controla a fidelidade ao prompt. Valores baixos (3-5) dão resultados criativos, porém menos fiéis. Valores médios (7-9) oferecem o melhor equilíbrio — é o ponto ideal para a maioria dos casos. Valores altos (10-15) seguem fielmente o prompt, mas arriscam supersaturação. Comece em 7 e ajuste conforme os resultados.