Stable Diffusion es el generador de imágenes IA más flexible y técnico. A diferencia de Midjourney o DALL-E 3 que simplifican la experiencia del usuario, Stable Diffusion te da un control granular sobre cada aspecto de la generación — pero esto requiere dominar una sintaxis de prompt específica y parámetros técnicos que otros modelos no utilizan.

Generador automático: Nuestro generador de prompts para Stable Diffusion crea prompts optimizados con la sintaxis ponderada, los quality tags y los prompts negativos adaptados a tu versión de SD. Sube una imagen de referencia para empezar.

La Sintaxis Ponderada Explicada

La sintaxis ponderada es lo que hace único a Stable Diffusion entre los generadores de imágenes IA. Te permite aumentar o disminuir la importancia relativa de cada término en tu prompt.

Sintaxis Básica

El formato es (término:peso) donde el peso es un número decimal. El valor por defecto es 1.0.

Atajos de Ponderación

Stable Diffusion también soporta atajos con paréntesis múltiples:

Reglas de Ponderación

La ponderación es una herramienta poderosa, pero hay que usarla con criterio:

Ejemplo Completo

(masterpiece:1.2), (best quality:1.1), 1girl, (flowing red hair:1.2), green eyes, (medieval dress:1.1), standing in a (enchanted forest:1.3), (golden hour lighting:1.2), (bokeh:0.8), detailed face, soft shadows

Dominar los Prompts Negativos

Los prompts negativos son una funcionalidad exclusiva de Stable Diffusion (y de los modelos derivados). Le indican al modelo lo que NO quieres ver en la imagen. A menudo es la diferencia entre un resultado amateur y uno profesional.

Prompt Negativo Universal

Este prompt negativo funciona bien como base para la mayoría de las generaciones:

(worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, username, blurry, deformed, jpeg artifacts

Prompts Negativos Especializados

Para retratos:

(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra fingers, mutated hands, poorly drawn face, ugly, disfigured, cross-eyed, asymmetric face, extra limbs, fused fingers

Para paisajes:

(worst quality:1.4), (low quality:1.4), blurry, watermark, text, logo, oversaturated, distorted horizon, unnatural colors

Para anime:

(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra digits, missing fingers, poorly drawn face, simple background, flat colors, bad proportions

Tags de Calidad Esenciales

Los quality tags son palabras clave que mejoran la calidad general de la imagen. Su eficacia varía según la versión de Stable Diffusion y el checkpoint utilizado.

Tags Más Eficaces

Tag Efecto Eficaz en
masterpiece Calidad máxima, composición cuidada SD 1.5, algunos SDXL
best quality Detalles finos, renderizado limpio SD 1.5, SDXL
highly detailed Aumenta el nivel de detalle Todos
sharp focus Mayor nitidez Todos
8k uhd Alta resolución aparente SD 1.5, variable en SDXL
intricate details Detalles complejos y finos Todos

Diferencias entre SD 1.5, SDXL y SD 3.5

SD 1.5

La versión más madura con el mayor ecosistema de checkpoints y LoRAs. Los prompts de SD 1.5 dependen mucho de los quality tags y de la sintaxis ponderada. Resolución nativa: 512x512.

Prompt tipo: (masterpiece:1.2), (best quality:1.1), highly detailed, 1girl, long blonde hair, blue eyes, white dress, standing in flower field, golden hour, (bokeh:0.8), sharp focus

SDXL

Resolución nativa de 1024x1024 con una comprensión mejorada del lenguaje natural. SDXL necesita menos quality tags pero sigue beneficiándose de la ponderación para un control preciso. El sistema de dos codificadores de texto (CLIP ViT-L y OpenCLIP ViT-bigG) proporciona una mejor comprensión semántica.

Prompt tipo: beautiful young woman with long blonde hair, wearing an elegant white dress, standing in a sunlit wildflower meadow, (golden hour:1.2), soft bokeh background, detailed skin texture, professional photography

SD 3.5

La última versión utiliza una arquitectura MMDiT (Multi-Modal Diffusion Transformer) que comprende mucho mejor el lenguaje natural. Los quality tags tradicionales tienen menos impacto. Las descripciones detalladas en lenguaje natural funcionan mejor.

Prompt tipo: A beautiful young woman with flowing blonde hair and bright blue eyes stands in a vast field of wildflowers during golden hour. She wears an elegant white summer dress that catches the warm breeze. The background is softly blurred with warm amber tones. Professional portrait photography with detailed skin texture and natural soft lighting.

Compatibilidad con los Checkpoints

Los checkpoints (modelos personalizados) son una fuerza clave de Stable Diffusion. Cada checkpoint ha sido entrenado con preferencias de prompt específicas.

Consejo clave: lee siempre la página del checkpoint en CivitAI para conocer los prompts recomendados y los quality tags preferidos. Un prompt perfecto para un checkpoint puede ser ineficaz para otro.

CFG Scale, Steps y Samplers

CFG Scale (Classifier-Free Guidance)

El CFG Scale controla la fidelidad al prompt. Es un parámetro fundamental que muchos principiantes pasan por alto.

Steps (Pasos de difusión)

El número de steps influye en el tiempo de generación y la calidad del resultado:

Samplers

La elección del sampler afecta la calidad y el estilo del resultado. Los más populares en 2026:

Templates de Prompts Avanzados

Retrato Fotorrealista (SD 1.5)

Prompt: (masterpiece:1.2), (best quality:1.1), (RAW photo:1.2), portrait of a 30 year old woman, (detailed skin texture:1.2), natural skin, freckles, green eyes, auburn hair, (natural lighting:1.1), f/2.8, Canon EOS R5, 85mm lens, shallow depth of field

Negativo: (worst quality:1.4), (low quality:1.4), bad anatomy, deformed iris, extra fingers, poorly drawn face, airbrushed skin, plastic skin, doll-like

Paisaje Fantasy (SDXL)

Prompt: majestic fantasy landscape, ancient ruins overgrown with luminescent plants, (floating islands:1.2) in a purple twilight sky, waterfalls cascading into mist, (volumetric lighting:1.3), ethereal atmosphere, concept art quality, highly detailed, 8k

Negativo: (worst quality:1.4), blurry, watermark, text, oversaturated, flat lighting

Anime (Anything V5)

Prompt: (masterpiece:1.2), (best quality:1.1), 1girl, long silver hair, violet eyes, detailed eyes, (fantasy armor:1.2), glowing runes, dynamic pose, magical particles, night sky background, (bloom:0.8), detailed face

Negativo: (worst quality:1.4), (low quality:1.4), bad anatomy, extra limbs, poorly drawn hands, simple background, flat shading

Genera Prompts Optimizados para Stable Diffusion

Sube una imagen de referencia y obtén un prompt completo para Stable Diffusion con sintaxis ponderada, quality tags y prompt negativo.

Probar el Generador SD →

Preguntas Frecuentes

¿Cómo funciona la sintaxis ponderada en Stable Diffusion?

La sintaxis ponderada utiliza paréntesis y dos puntos para aumentar o disminuir la importancia de un término. (término:1.3) aumenta el peso en un 30%, (término:0.7) lo reduce en un 30%. El valor por defecto es 1.0. Evita pesos superiores a 1.5 que causan artefactos visuales y distorsiones.

¿Cuáles son los mejores prompts negativos para Stable Diffusion?

Un buen prompt negativo universal: (worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, blurry, deformed. Para retratos, añade términos específicos como extra fingers, mutated hands, poorly drawn face. Adapta según el checkpoint utilizado.

¿Cuál es la diferencia entre SD 1.5, SDXL y SD 3.5 para los prompts?

SD 1.5 requiere prompts muy estructurados con quality tags y responde bien a la sintaxis ponderada. SDXL comprende mejor el lenguaje natural y necesita menos quality tags. SD 3.5 usa un nuevo sistema que favorece las descripciones naturales detalladas, similar a Flux, con menos dependencia de los tags técnicos.

¿Cómo elegir el CFG Scale correcto para mis prompts de Stable Diffusion?

El CFG Scale controla la fidelidad al prompt. Los valores bajos (3-5) dan resultados creativos pero menos fieles. Los valores medios (7-9) ofrecen el mejor equilibrio — es el punto ideal para la mayoría de los usos. Los valores altos (10-15) siguen muy fielmente el prompt pero pueden sobresaturar. Comienza en 7 y ajusta según tus resultados.