Stable Diffusionは、最も柔軟で技術的なAI画像生成ツールです。MidjourneyやDALL-E 3がユーザー体験を簡素化しているのに対し、Stable Diffusionは生成のあらゆる側面をきめ細かく制御できます。ただし、他のモデルにはない特有のプロンプト構文や技術的なパラメータを習得する必要があります。
自動生成ツール: 当サイトのStable Diffusionプロンプトジェネレーターは、重み付け構文、クオリティタグ、ネガティブプロンプトを含む最適化されたプロンプトを自動生成します。参考画像をアップロードして始めましょう。
重み付け構文の解説
重み付け構文は、AI画像生成ツールの中でStable Diffusionを際立たせる独自の機能です。プロンプト内の各タームの相対的な重要度を増減させることができます。
基本構文
フォーマットは (ターム:重み) で、重みは小数値です。デフォルト値は1.0です。
(golden hour:1.3)— 「golden hour」の重要度を30%増加(bokeh:0.7)— 「bokeh」の重要度を30%減少(masterpiece:1.2), (best quality:1.1)— 重み付きのクオリティタグ
重み付けのショートカット
Stable Diffusionは括弧を重ねるショートカットもサポートしています。
(term)=(term:1.1)((term))=(term:1.21)(((term)))=(term:1.33)[term]=(term:0.9)— 重みを減少
重み付けのルール
重み付けは強力なツールですが、慎重に使用する必要があります。
- 0.5から1.5の範囲に収めましょう: それを超えると、視覚的なアーティファクトや歪みが発生するリスクがあります
- 重み付けするタームは少なめに: すべてを1.3にすると、実質的に何も強調されません
- 問題解決に重み付けを活用: 要素が表示されない場合は重みを増やし、支配的すぎる場合は減らしましょう
完成例
(masterpiece:1.2), (best quality:1.1), 1girl, (flowing red hair:1.2), green eyes, (medieval dress:1.1), standing in a (enchanted forest:1.3), (golden hour lighting:1.2), (bokeh:0.8), detailed face, soft shadows
ネガティブプロンプトをマスターする
ネガティブプロンプトは、Stable Diffusion(および派生モデル)独自の機能です。画像に表示させたくないものをモデルに指示します。これがアマチュアレベルとプロフェッショナルレベルの結果を分ける決定的な要素になることが多いです。
汎用ネガティブプロンプト
このネガティブプロンプトは、ほとんどの生成で基盤として効果的です。
(worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, username, blurry, deformed, jpeg artifacts
専用ネガティブプロンプト
ポートレート用:
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra fingers, mutated hands, poorly drawn face, ugly, disfigured, cross-eyed, asymmetric face, extra limbs, fused fingers
風景用:
(worst quality:1.4), (low quality:1.4), blurry, watermark, text, logo, oversaturated, distorted horizon, unnatural colors
アニメ用:
(worst quality:1.4), (low quality:1.4), bad anatomy, bad hands, extra digits, missing fingers, poorly drawn face, simple background, flat colors, bad proportions
必須クオリティタグ
クオリティタグは、画像の全体的な品質を向上させるキーワードです。その効果はStable Diffusionのバージョンや使用するチェックポイントによって異なります。
最も効果的なタグ
| タグ | 効果 | 有効なバージョン |
|---|---|---|
masterpiece |
最高品質、丁寧な構図 | SD 1.5、一部のSDXL |
best quality |
細部の精緻さ、クリーンな描画 | SD 1.5、SDXL |
highly detailed |
ディテールレベルの向上 | 全バージョン |
sharp focus |
シャープネスの向上 | 全バージョン |
8k uhd |
見た目の高解像度化 | SD 1.5、SDXLでは効果が不安定 |
intricate details |
複雑で繊細なディテール | 全バージョン |
SD 1.5・SDXL・SD 3.5の違い
SD 1.5
最も成熟したバージョンで、チェックポイントやLoRAの最大のエコシステムを持っています。SD 1.5のプロンプトは、クオリティタグと重み付け構文に大きく依存します。ネイティブ解像度:512x512。
プロンプト例:(masterpiece:1.2), (best quality:1.1), highly detailed, 1girl, long blonde hair, blue eyes, white dress, standing in flower field, golden hour, (bokeh:0.8), sharp focus
SDXL
ネイティブ解像度は1024x1024で、自然言語の理解が向上しています。SDXLはクオリティタグの必要性が少なくなっていますが、精密な制御には重み付けが引き続き有効です。2つのテキストエンコーダー(CLIP ViT-LとOpenCLIP ViT-bigG)のシステムにより、意味論的な理解が向上しています。
プロンプト例:beautiful young woman with long blonde hair, wearing an elegant white dress, standing in a sunlit wildflower meadow, (golden hour:1.2), soft bokeh background, detailed skin texture, professional photography
SD 3.5
最新バージョンは、MMDiT(Multi-Modal Diffusion Transformer)アーキテクチャを採用しており、自然言語の理解が大幅に向上しています。従来のクオリティタグの影響力は低下しています。Fluxに似た、詳細な自然言語での記述が最も効果的です。
プロンプト例:A beautiful young woman with flowing blonde hair and bright blue eyes stands in a vast field of wildflowers during golden hour. She wears an elegant white summer dress that catches the warm breeze. The background is softly blurred with warm amber tones. Professional portrait photography with detailed skin texture and natural soft lighting.
チェックポイントとの互換性
チェックポイント(カスタムモデル)はStable Diffusionの大きな強みです。各チェックポイントは、特定のプロンプト設定で訓練されています。
- Realistic Vision: 詳細な写真風プロンプトやカメラ用語に優れています(
Canon EOS R5, 85mm f/1.4, RAW photo) - DreamShaper: 汎用性が高く、アートと写真を組み合わせたプロンプトに対応
- Anything V5: アニメに最適化されており、Danbooruタグを使用(
1girl, long_hair, blue_eyes, school_uniform) - Juggernaut XL: 人気のSDXLチェックポイントで、適度なクオリティタグを含む自然言語を好む
重要なアドバイス:CivitAIのチェックポイントページを必ず確認して、推奨プロンプトや推奨クオリティタグを把握しましょう。あるチェックポイントで完璧なプロンプトが、別のチェックポイントでは効果がない場合があります。
CFG Scale・Steps・Samplers
CFG Scale(Classifier-Free Guidance)
CFG Scaleはプロンプトへの忠実度を制御します。多くの初心者が見落としがちな重要なパラメータです。
- CFG 3-5: クリエイティブで自由 — モデルがプロンプトを自由に解釈
- CFG 7-9: バランス型 — 創造性と忠実度の良いバランス(推奨)
- CFG 10-15: 厳密 — プロンプトに忠実に従うが、過彩度になる可能性あり
- CFG 15+: 非推奨 — アーティファクトが頻発し、不自然な色になりがち
Steps(拡散ステップ数)
ステップ数は生成時間と結果の品質に影響します。
- 15-20 steps: 高速、テスト用として許容できる品質
- 25-35 steps: 品質と速度の良いバランス(推奨)
- 40-50 steps: 高品質、生成時間が長め
- 50+ steps: 収穫逓減 — ほとんどの場合不要
Samplers
サンプラーの選択は、結果の品質とスタイルに影響します。2026年に人気のサンプラーは以下の通りです。
- DPM++ 2M Karras: 標準的な選択 — 高速で高品質
- Euler a: クリエイティブで、アーティスティックな構図に最適
- DPM++ SDE Karras: 細部のディテールやテクスチャに優秀
- UniPC: 高速で効率的、プロトタイピングに最適
上級プロンプトテンプレート
フォトリアルポートレート(SD 1.5)
プロンプト:(masterpiece:1.2), (best quality:1.1), (RAW photo:1.2), portrait of a 30 year old woman, (detailed skin texture:1.2), natural skin, freckles, green eyes, auburn hair, (natural lighting:1.1), f/2.8, Canon EOS R5, 85mm lens, shallow depth of field
ネガティブ:(worst quality:1.4), (low quality:1.4), bad anatomy, deformed iris, extra fingers, poorly drawn face, airbrushed skin, plastic skin, doll-like
ファンタジー風景(SDXL)
プロンプト:majestic fantasy landscape, ancient ruins overgrown with luminescent plants, (floating islands:1.2) in a purple twilight sky, waterfalls cascading into mist, (volumetric lighting:1.3), ethereal atmosphere, concept art quality, highly detailed, 8k
ネガティブ:(worst quality:1.4), blurry, watermark, text, oversaturated, flat lighting
アニメ(Anything V5)
プロンプト:(masterpiece:1.2), (best quality:1.1), 1girl, long silver hair, violet eyes, detailed eyes, (fantasy armor:1.2), glowing runes, dynamic pose, magical particles, night sky background, (bloom:0.8), detailed face
ネガティブ:(worst quality:1.4), (low quality:1.4), bad anatomy, extra limbs, poorly drawn hands, simple background, flat shading
最適化されたStable Diffusionプロンプトを生成
参考画像をアップロードすると、重み付け構文、クオリティタグ、ネガティブプロンプトを含む完全なStable Diffusionプロンプトが取得できます。
SDジェネレーターを試す →よくある質問
Stable Diffusionの重み付け構文はどのように機能しますか?
重み付け構文は括弧とコロンを使って、各タームの重要度を増減させます。(term:1.3) は重みを30%増加、(term:0.7) は30%減少させます。デフォルト値は1.0です。1.5を超える重みは視覚的なアーティファクトや歪みの原因になるため避けてください。
Stable Diffusionに最適なネガティブプロンプトは何ですか?
汎用的なネガティブプロンプト:(worst quality:1.4), (low quality:1.4), (normal quality:1.2), lowres, bad anatomy, bad hands, extra digits, fewer digits, cropped, watermark, signature, blurry, deformed。ポートレートには extra fingers, mutated hands, poorly drawn face などの専用タームを追加してください。使用するチェックポイントに合わせて調整しましょう。
SD 1.5、SDXL、SD 3.5のプロンプトの違いは何ですか?
SD 1.5はクオリティタグを含む高度に構造化されたプロンプトが必要で、重み付け構文によく反応します。SDXLは自然言語の理解が向上し、クオリティタグの必要性が減りますが、重み付けは引き続き有用です。SD 3.5はFluxに似た詳細な自然言語の記述を好む新しいシステムを採用しており、技術的なタグへの依存度が低くなっています。
Stable Diffusionのプロンプトに最適なCFG Scaleの選び方は?
CFG Scaleはプロンプトへの忠実度を制御します。低い値(3-5)はクリエイティブですがプロンプトへの忠実度が低くなります。中間値(7-9)は最良のバランスを提供し、ほとんどの用途に最適です。高い値(10-15)はプロンプトに非常に忠実ですが、過彩度のリスクがあります。7から始めて、結果に応じて調整してください。