Stable Diffusion es el generador de imágenes IA más flexible y técnico. A diferencia de Midjourney o DALL-E 3 que simplifican la experiencia del usuario, Stable Diffusion te da un control granular sobre cada aspecto de la generación — pero esto requiere dominar una sintaxis de prompt específica y parámetros técnicos que otros modelos no utilizan.
Generador automático: Nuestro generador de prompts para Stable Diffusion crea prompts optimizados con la sintaxis ponderada, los quality tags y los prompts negativos adaptados a tu versión de SD. Sube una imagen de referencia para empezar.
La Sintaxis Ponderada Explicada
La sintaxis ponderada es lo que hace único a Stable Diffusion entre los generadores de imágenes IA. Te permite aumentar o disminuir la importancia relativa de cada término en tu prompt.
Sintaxis Básica
El formato es (término:peso) donde el peso es un número decimal. El valor por defecto es 1.0.
(golden hour:1.3)— aumenta la importancia de «golden hour» en un 30%(bokeh:0.7)— reduce la importancia de «bokeh» en un 30%(masterpiece:1.2), (best quality:1.1)— quality tags con ponderación
Atajos de Ponderación
Stable Diffusion también soporta atajos con paréntesis múltiples:
(término)=(término:1.1)((término))=(término:1.21)(((término)))=(término:1.33)[término]=(término:0.9)— reduce el peso
Reglas de Ponderación
La ponderación es una herramienta poderosa, pero hay que usarla con criterio:
- Mantén entre 0.5 y 1.5: Más allá, corres el riesgo de artefactos visuales y distorsiones
- Pondera pocos términos: Si todo está ponderado a 1.3, nada destaca realmente
- Usa la ponderación para resolver problemas: Si un elemento no aparece, aumenta su peso. Si domina demasiado, redúcelo
Ejemplo Completo
(masterpiece:1.2), (best quality:1.1), 1girl, (flowing red hair:1.2), green eyes, (medieval dress:1.1), standing in a (enchanted forest:1.3), (golden hour lighting:1.2), (bokeh:0.8), detailed face, soft shadows
Dominar los Prompts Negativos
Los prompts negativos son una funcionalidad exclusiva de Stable Diffusion (y de los modelos derivados). Le indican al modelo lo que NO quieres ver en la imagen. A menudo es la diferencia entre un resultado amateur y uno profesional.
Prompt Negativo Universal
Este prompt negativo funciona bien como base para la mayoría de las generaciones:
(worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, username, blurry, deformed, jpeg artifacts
Prompts Negativos Especializados
Para retratos:
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra fingers, mutated hands, poorly drawn face, ugly, disfigured, cross-eyed, asymmetric face, extra limbs, fused fingers
Para paisajes:
(worst quality:1.4), (low quality:1.4), blurry, watermark, text, logo, oversaturated, distorted horizon, unnatural colors
Para anime:
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra digits, missing fingers, poorly drawn face, simple background, flat colors, bad proportions
Tags de Calidad Esenciales
Los quality tags son palabras clave que mejoran la calidad general de la imagen. Su eficacia varía según la versión de Stable Diffusion y el checkpoint utilizado.
Tags Más Eficaces
| Tag | Efecto | Eficaz en |
|---|---|---|
masterpiece |
Calidad máxima, composición cuidada | SD 1.5, algunos SDXL |
best quality |
Detalles finos, renderizado limpio | SD 1.5, SDXL |
highly detailed |
Aumenta el nivel de detalle | Todos |
sharp focus |
Mayor nitidez | Todos |
8k uhd |
Alta resolución aparente | SD 1.5, variable en SDXL |
intricate details |
Detalles complejos y finos | Todos |
Diferencias entre SD 1.5, SDXL y SD 3.5
SD 1.5
La versión más madura con el mayor ecosistema de checkpoints y LoRAs. Los prompts de SD 1.5 dependen mucho de los quality tags y de la sintaxis ponderada. Resolución nativa: 512x512.
Prompt tipo: (masterpiece:1.2), (best quality:1.1), highly detailed, 1girl, long blonde hair, blue eyes, white dress, standing in flower field, golden hour, (bokeh:0.8), sharp focus
SDXL
Resolución nativa de 1024x1024 con una comprensión mejorada del lenguaje natural. SDXL necesita menos quality tags pero sigue beneficiándose de la ponderación para un control preciso. El sistema de dos codificadores de texto (CLIP ViT-L y OpenCLIP ViT-bigG) proporciona una mejor comprensión semántica.
Prompt tipo: beautiful young woman with long blonde hair, wearing an elegant white dress, standing in a sunlit wildflower meadow, (golden hour:1.2), soft bokeh background, detailed skin texture, professional photography
SD 3.5
La última versión utiliza una arquitectura MMDiT (Multi-Modal Diffusion Transformer) que comprende mucho mejor el lenguaje natural. Los quality tags tradicionales tienen menos impacto. Las descripciones detalladas en lenguaje natural funcionan mejor.
Prompt tipo: A beautiful young woman with flowing blonde hair and bright blue eyes stands in a vast field of wildflowers during golden hour. She wears an elegant white summer dress that catches the warm breeze. The background is softly blurred with warm amber tones. Professional portrait photography with detailed skin texture and natural soft lighting.
Compatibilidad con los Checkpoints
Los checkpoints (modelos personalizados) son una fuerza clave de Stable Diffusion. Cada checkpoint ha sido entrenado con preferencias de prompt específicas.
- Realistic Vision: Sobresale con prompts fotográficos detallados y términos de cámara (
Canon EOS R5, 85mm f/1.4, RAW photo) - DreamShaper: Versátil, funciona bien con prompts mixtos de arte/foto
- Anything V5: Optimizado para anime, utiliza tags danbooru (
1girl, long_hair, blue_eyes, school_uniform) - Juggernaut XL: Checkpoint SDXL popular, favorece el lenguaje natural con quality tags moderados
Consejo clave: lee siempre la página del checkpoint en CivitAI para conocer los prompts recomendados y los quality tags preferidos. Un prompt perfecto para un checkpoint puede ser ineficaz para otro.
CFG Scale, Steps y Samplers
CFG Scale (Classifier-Free Guidance)
El CFG Scale controla la fidelidad al prompt. Es un parámetro fundamental que muchos principiantes pasan por alto.
- CFG 3-5: Creativo, libre — el modelo se toma libertades con tu prompt
- CFG 7-9: Equilibrado — buen compromiso entre creatividad y fidelidad (recomendado)
- CFG 10-15: Estricto — sigue el prompt de cerca pero puede sobresaturar
- CFG 15+: No recomendado — artefactos frecuentes y colores artificiales
Steps (Pasos de difusión)
El número de steps influye en el tiempo de generación y la calidad del resultado:
- 15-20 steps: Rápido, calidad aceptable para pruebas
- 25-35 steps: Buen equilibrio calidad/velocidad (recomendado)
- 40-50 steps: Alta calidad, tiempo de generación más largo
- 50+ steps: Rendimientos decrecientes — raramente necesario
Samplers
La elección del sampler afecta la calidad y el estilo del resultado. Los más populares en 2026:
- DPM++ 2M Karras: El estándar — rápido y de buena calidad
- Euler a: Creativo, bueno para composiciones artísticas
- DPM++ SDE Karras: Excelente para detalles finos y texturas
- UniPC: Rápido y eficiente, bueno para prototipado
Templates de Prompts Avanzados
Retrato Fotorrealista (SD 1.5)
Prompt: (masterpiece:1.2), (best quality:1.1), (RAW photo:1.2), portrait of a 30 year old woman, (detailed skin texture:1.2), natural skin, freckles, green eyes, auburn hair, (natural lighting:1.1), f/2.8, Canon EOS R5, 85mm lens, shallow depth of field
Negativo: (worst quality:1.4), (low quality:1.4), bad anatomy, deformed iris, extra fingers, poorly drawn face, airbrushed skin, plastic skin, doll-like
Paisaje Fantasy (SDXL)
Prompt: majestic fantasy landscape, ancient ruins overgrown with luminescent plants, (floating islands:1.2) in a purple twilight sky, waterfalls cascading into mist, (volumetric lighting:1.3), ethereal atmosphere, concept art quality, highly detailed, 8k
Negativo: (worst quality:1.4), blurry, watermark, text, oversaturated, flat lighting
Anime (Anything V5)
Prompt: (masterpiece:1.2), (best quality:1.1), 1girl, long silver hair, violet eyes, detailed eyes, (fantasy armor:1.2), glowing runes, dynamic pose, magical particles, night sky background, (bloom:0.8), detailed face
Negativo: (worst quality:1.4), (low quality:1.4), bad anatomy, extra limbs, poorly drawn hands, simple background, flat shading
Genera Prompts Optimizados para Stable Diffusion
Sube una imagen de referencia y obtén un prompt completo para Stable Diffusion con sintaxis ponderada, quality tags y prompt negativo.
Probar el Generador SD →Preguntas Frecuentes
¿Cómo funciona la sintaxis ponderada en Stable Diffusion?
La sintaxis ponderada utiliza paréntesis y dos puntos para aumentar o disminuir la importancia de un término. (término:1.3) aumenta el peso en un 30%, (término:0.7) lo reduce en un 30%. El valor por defecto es 1.0. Evita pesos superiores a 1.5 que causan artefactos visuales y distorsiones.
¿Cuáles son los mejores prompts negativos para Stable Diffusion?
Un buen prompt negativo universal: (worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, blurry, deformed. Para retratos, añade términos específicos como extra fingers, mutated hands, poorly drawn face. Adapta según el checkpoint utilizado.
¿Cuál es la diferencia entre SD 1.5, SDXL y SD 3.5 para los prompts?
SD 1.5 requiere prompts muy estructurados con quality tags y responde bien a la sintaxis ponderada. SDXL comprende mejor el lenguaje natural y necesita menos quality tags. SD 3.5 usa un nuevo sistema que favorece las descripciones naturales detalladas, similar a Flux, con menos dependencia de los tags técnicos.
¿Cómo elegir el CFG Scale correcto para mis prompts de Stable Diffusion?
El CFG Scale controla la fidelidad al prompt. Los valores bajos (3-5) dan resultados creativos pero menos fieles. Los valores medios (7-9) ofrecen el mejor equilibrio — es el punto ideal para la mayoría de los usos. Los valores altos (10-15) siguen muy fielmente el prompt pero pueden sobresaturar. Comienza en 7 y ajusta según tus resultados.