Stable Diffusion — самый гибкий и технически сложный инструмент для AI-генерации изображений. В то время как Midjourney и DALL-E 3 упрощают пользовательский опыт, Stable Diffusion предоставляет детальный контроль над каждым аспектом генерации. Однако для этого необходимо освоить специфический синтаксис промптов и технические параметры, которых нет в других моделях.
Автоматическая генерация: Наш генератор промптов Stable Diffusion автоматически создаёт оптимизированные промпты с синтаксисом весов, тегами качества и негативными промптами. Загрузите референс-изображение, чтобы начать.
Синтаксис весов
Синтаксис весов — уникальная функция, которая выделяет Stable Diffusion среди всех AI-инструментов генерации изображений. Он позволяет увеличивать или уменьшать относительную важность каждого термина в промпте.
Базовый синтаксис
Формат: (термин:вес), где вес — десятичное число. Значение по умолчанию — 1.0.
(golden hour:1.3)— увеличение важности «golden hour» на 30%(bokeh:0.7)— уменьшение важности «bokeh» на 30%(masterpiece:1.2), (best quality:1.1)— теги качества с весами
Сокращения весов
Stable Diffusion также поддерживает сокращения с вложенными скобками.
(term)=(term:1.1)((term))=(term:1.21)(((term)))=(term:1.33)[term]=(term:0.9)— уменьшение веса
Правила использования весов
Весы — мощный инструмент, но использовать их нужно с осторожностью.
- Держитесь в диапазоне от 0.5 до 1.5: за пределами этого диапазона появляется риск визуальных артефактов и искажений
- Задавайте вес немногим терминам: если всё поставить на 1.3, ничего фактически не будет усилено
- Используйте веса для решения проблем: если элемент не появляется — увеличьте вес, если доминирует — уменьшите
Полный пример
(masterpiece:1.2), (best quality:1.1), 1girl, (flowing red hair:1.2), green eyes, (medieval dress:1.1), standing in a (enchanted forest:1.3), (golden hour lighting:1.2), (bokeh:0.8), detailed face, soft shadows
Негативные промпты
Негативные промпты — уникальная функция Stable Diffusion (и производных моделей). Они указывают модели, что не должно появляться на изображении. Именно они часто становятся решающим фактором, отличающим любительские результаты от профессиональных.
Универсальный негативный промпт
Этот негативный промпт эффективен как основа для большинства генераций.
(worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, username, blurry, deformed, jpeg artifacts
Специализированные негативные промпты
Для портретов:
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra fingers, mutated hands, poorly drawn face, ugly, disfigured, cross-eyed, asymmetric face, extra limbs, fused fingers
Для пейзажей:
(worst quality:1.4), (low quality:1.4), blurry, watermark, text, logo, oversaturated, distorted horizon, unnatural colors
Для аниме:
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra digits, missing fingers, poorly drawn face, simple background, flat colors, bad proportions
Необходимые теги качества
Теги качества — это ключевые слова, повышающие общее качество изображения. Их эффективность зависит от версии Stable Diffusion и используемого чекпоинта.
Наиболее эффективные теги
| Тег | Эффект | Работает в версиях |
|---|---|---|
masterpiece |
Высшее качество, аккуратная композиция | SD 1.5, некоторые SDXL |
best quality |
Тонкость деталей, чистая отрисовка | SD 1.5, SDXL |
highly detailed |
Повышение уровня детализации | Все версии |
sharp focus |
Повышение резкости | Все версии |
8k uhd |
Визуальное повышение разрешения | SD 1.5, в SDXL нестабильно |
intricate details |
Сложная тонкая детализация | Все версии |
Различия SD 1.5, SDXL и SD 3.5
SD 1.5
Наиболее зрелая версия с крупнейшей экосистемой чекпоинтов и LoRA. Промпты SD 1.5 сильно зависят от тегов качества и синтаксиса весов. Нативное разрешение: 512x512.
Пример: (masterpiece:1.2), (best quality:1.1), highly detailed, 1girl, long blonde hair, blue eyes, white dress, standing in flower field, golden hour, (bokeh:0.8), sharp focus
SDXL
Нативное разрешение 1024x1024 и улучшенное понимание естественного языка. SDXL требует меньше тегов качества, но веса по-прежнему полезны для точного контроля. Двойная система текстовых энкодеров (CLIP ViT-L и OpenCLIP ViT-bigG) обеспечивает улучшенное семантическое понимание.
Пример: beautiful young woman with long blonde hair, wearing an elegant white dress, standing in a sunlit wildflower meadow, (golden hour:1.2), soft bokeh background, detailed skin texture, professional photography
SD 3.5
Новейшая версия на архитектуре MMDiT (Multi-Modal Diffusion Transformer), значительно улучшившая понимание естественного языка. Влияние традиционных тегов качества снижено. Как и в Flux, наиболее эффективны подробные описания на естественном языке.
Пример: A beautiful young woman with flowing blonde hair and bright blue eyes stands in a vast field of wildflowers during golden hour. She wears an elegant white summer dress that catches the warm breeze. The background is softly blurred with warm amber tones. Professional portrait photography with detailed skin texture and natural soft lighting.
Совместимость с чекпоинтами
Чекпоинты (пользовательские модели) — одна из главных сильных сторон Stable Diffusion. Каждый чекпоинт обучен на определённых настройках промптов.
- Realistic Vision: отлично подходит для фотографических промптов с терминами камеры (
Canon EOS R5, 85mm f/1.4, RAW photo) - DreamShaper: универсальный, хорошо работает с комбинацией арт-стилей и фотографии
- Anything V5: оптимизирован для аниме, использует теги Danbooru (
1girl, long_hair, blue_eyes, school_uniform) - Juggernaut XL: популярный SDXL-чекпоинт, предпочитает естественный язык с умеренными тегами качества
Важный совет: всегда проверяйте страницу чекпоинта на CivitAI, чтобы узнать рекомендуемые промпты и теги качества. Идеальный промпт для одного чекпоинта может быть неэффективен для другого.
CFG Scale, Steps и Samplers
CFG Scale (Classifier-Free Guidance)
CFG Scale контролирует точность следования промпту. Это важный параметр, который многие новички упускают из виду.
- CFG 3-5: творческий и свободный — модель интерпретирует промпт более вольно
- CFG 7-9: сбалансированный — хорошее сочетание креативности и точности (рекомендуется)
- CFG 10-15: строгий — точно следует промпту, но может быть перенасыщение
- CFG 15+: не рекомендуется — частые артефакты, неестественные цвета
Steps (количество шагов диффузии)
Количество шагов влияет на время генерации и качество результата.
- 15-20 шагов: быстро, приемлемое качество для тестирования
- 25-35 шагов: хороший баланс качества и скорости (рекомендуется)
- 40-50 шагов: высокое качество, более длительная генерация
- 50+ шагов: убывающая отдача — в большинстве случаев не нужно
Samplers
Выбор сэмплера влияет на качество и стиль результата. Популярные сэмплеры в 2026 году:
- DPM++ 2M Karras: стандартный выбор — быстрый и качественный
- Euler a: творческий, лучше для художественных композиций
- DPM++ SDE Karras: превосходен для детализации и текстур
- UniPC: быстрый и эффективный, идеален для прототипирования
Продвинутые шаблоны промптов
Фотореалистичный портрет (SD 1.5)
Промпт: (masterpiece:1.2), (best quality:1.1), (RAW photo:1.2), portrait of a 30 year old woman, (detailed skin texture:1.2), natural skin, freckles, green eyes, auburn hair, (natural lighting:1.1), f/2.8, Canon EOS R5, 85mm lens, shallow depth of field
Негативный: (worst quality:1.4), (low quality:1.4), bad anatomy, deformed iris, extra fingers, poorly drawn face, airbrushed skin, plastic skin, doll-like
Фэнтезийный пейзаж (SDXL)
Промпт: majestic fantasy landscape, ancient ruins overgrown with luminescent plants, (floating islands:1.2) in a purple twilight sky, waterfalls cascading into mist, (volumetric lighting:1.3), ethereal atmosphere, concept art quality, highly detailed, 8k
Негативный: (worst quality:1.4), blurry, watermark, text, oversaturated, flat lighting
Аниме (Anything V5)
Промпт: (masterpiece:1.2), (best quality:1.1), 1girl, long silver hair, violet eyes, detailed eyes, (fantasy armor:1.2), glowing runes, dynamic pose, magical particles, night sky background, (bloom:0.8), detailed face
Негативный: (worst quality:1.4), (low quality:1.4), bad anatomy, extra limbs, poorly drawn hands, simple background, flat shading
Сгенерируйте оптимизированный промпт для Stable Diffusion
Загрузите референс-изображение и получите полный промпт Stable Diffusion с синтаксисом весов, тегами качества и негативным промптом.
Попробовать SD-генератор →Часто задаваемые вопросы
Как работает синтаксис весов в Stable Diffusion?
Синтаксис весов использует скобки и двоеточие для увеличения или уменьшения важности каждого термина. (term:1.3) увеличивает вес на 30%, (term:0.7) уменьшает на 30%. Значение по умолчанию — 1.0. Избегайте весов выше 1.5, так как они вызывают визуальные артефакты и искажения.
Какие негативные промпты лучше всего подходят для Stable Diffusion?
Универсальный негативный промпт: (worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, blurry, deformed. Для портретов добавьте специализированные термины: extra fingers, mutated hands, poorly drawn face. Настраивайте под используемый чекпоинт.
В чём разница между промптами для SD 1.5, SDXL и SD 3.5?
SD 1.5 требует высокоструктурированных промптов с тегами качества и хорошо реагирует на синтаксис весов. SDXL лучше понимает естественный язык, и теги качества менее необходимы, но веса по-прежнему полезны. SD 3.5 использует новую систему и предпочитает подробные описания на естественном языке, подобно Flux, с меньшей зависимостью от технических тегов.
Как выбрать оптимальный CFG Scale для промптов Stable Diffusion?
CFG Scale контролирует точность следования промпту. Низкие значения (3-5) дают творческие результаты, но менее точно следуют промпту. Средние значения (7-9) обеспечивают лучший баланс и оптимальны для большинства задач. Высокие значения (10-15) очень точно следуют промпту, но есть риск перенасыщения. Начните с 7 и корректируйте по результатам.