Midjourney是世界上最受欢迎的AI图像生成器——这是有充分理由的。当你给它正确的提示词时,它能产出真正令人惊叹的图像。当你给它错误的提示词时,你得到的只是通用、模糊或完全偏离目标的结果。
平庸的Midjourney结果和卓越的结果之间的差异,通常归结于提示词的质量。本指南涵盖了你在2026年撰写优秀Midjourney提示词所需的一切。
有想要重新创建的图片?不必从零开始写提示词,将它上传到ImageToPrompt即可自动获得Midjourney专用提示词。然后用本指南进行优化调整。
2026年Midjourney当前版本(--v 6.1)
截至2026年3月,Midjourney当前默认版本为--v 6.1。这是在不指定版本时自动运行的版本——它比前代产品有显著改进,直接影响你编写提示词的方式。
从v6到v6.1的升级带来了三项重大改进。首先是连贯性:v6.1更忠实地遵循多部分提示词,复杂场景中的多个描述元素能被更准确地渲染。其次是手部和解剖:Midjourney长期存在的手部变形问题在v6.1中得到显著改善,但对于人物特写添加--no deformed hands仍然有帮助。最后是文字渲染:虽然仍不如Ideogram或DALL-E 3的排版能力,但v6.1可以可靠地在图像中渲染短词和简单短语——只需在提示词中使用引号。
要明确使用当前版本,请始终在提示词末尾添加--v 6.1。这能确保您保存的提示词在未来不会因版本更新而改变行为。您可以在Midjourney设置中将v6.1设为默认版本(/settings -> 选择版本)。
快速参考:始终在提示词末尾包含--v 6.1以锁定当前最佳版本。示例:your prompt here --ar 16:9 --v 6.1 --style raw
Midjourney提示词结构
完整的Midjourney提示词遵循以下结构:
[主体描述], [风格和媒介], [灯光], [构图], [氛围], [技术细节] --参数 值 --参数 值
例如:
ancient stone temple overgrown with vines and glowing bioluminescent moss, cinematic concept art, dramatic rim lighting with deep shadows, wide angle shot, mysterious and otherworldly atmosphere --ar 16:9 --v 6.1 --style raw --q 2
Midjourney提示词公式
主体 + 细节 + 环境/场景 + 风格/媒介 + 灯光 + 色彩 + 氛围 + 构图 + --参数
肖像示例
elderly Japanese craftsman, weathered hands, focused expression, seated at a traditional woodworking bench covered in tools, editorial photography, soft window light from the left, warm wood tones with cool shadow areas, contemplative, dignified, medium shot, shallow depth of field --ar 2:3 --v 6.1 --style raw
风景示例
ancient stone ruins half-submerged in still water, flooded valley surrounded by dense jungle, cinematic photography, blue hour, mist rising off the water, cool blue-greens with warm torch light reflections, mysterious, lost civilization atmosphere, wide establishing shot, symmetrical reflection --ar 21:9 --v 6.1 --q 2
商业/产品示例
minimalist ceramic coffee mug, steam rising, on a clean marble surface with morning light, commercial product photography, soft diffused natural light, subtle rim highlight, white and cream palette with warm coffee tones, calm, premium, aspirational, close-up, 45-degree angle, negative space above --ar 4:5 --v 6.1 --style raw
撰写有力的主体描述
主体是提示词的基础。最常见的错误是过于模糊。"一条龙"会生成一条通用的龙。"一条古老的战斗伤痕累累的龙,有着虹彩翠绿鳞片,蹲伏在洪水淹没的地下密室中坍塌的石头王座上"——这会产生更具体、更有趣的结果。
有效的主体要素:
- 物理特征:大小、年龄、状态、显著特征
- 环境背景:主体在哪里、在做什么、周围有什么
- 情绪状态:表情、姿态、能量
- 与环境的关系:主体如何与场景互动
风格与媒介描述符
在主体之后,指定你想要的视觉风格。Midjourney理解广泛的风格词汇:
摄影风格
cinematic photography— 电影级质感,具有深度和戏剧性editorial photography— 干净、专业、杂志级documentary photography— 纪实、原始、真实studio portrait— 控制灯光、干净背景
艺术风格
concept art— 详细的叙事性插画digital painting— 具有数字精度的绘画质感oil painting— 纹理丰富、色彩浓郁、古典watercolor illustration— 柔和边缘、透明层次anime style— 日本动画美学
渲染风格
octane render/unreal engine— 照片写实3D渲染isometric illustration— 俯视3D视角pixel art— 复古游戏美学
灯光就是一切
灯光比几乎任何其他元素更能定义图像的氛围。Midjourney特别擅长解读灯光描述。
自然灯光
golden hour lighting— 温暖、水平、长阴影(日出/日落)blue hour— 冷调、黄昏、柔和环境光overcast soft lighting— 漫射、均匀、无硬阴影harsh midday sunlight— 高对比、强阴影moonlight— 冷蓝白色、神秘感
影棚与人造灯光
Rembrandt lighting— 经典肖像灯光,三角形高光rim lighting/backlit— 轮廓光勾勒主体neon lighting— 鲜艳彩色光,赛博朋克美学dramatic chiaroscuro— 极端明暗对比volumetric lighting— 可见光线,大气深度
Midjourney核心参数
参数添加在提示词末尾,用双横线开头。它们提供对输出的精确控制。
| 参数 | 语法 | 范围/值 | 作用 | 默认值 | 示例 |
|---|---|---|---|---|---|
| 宽高比 | --ar W:H | 任意比例 | 设置图像比例 | 1:1 | --ar 16:9 |
| 版本 | --v N | 4, 5, 5.1, 5.2, 6, 6.1 | 模型版本 | 6.1 | --v 6.1 |
| Style Raw | --style raw | 开/关 | 减少美化,更忠实于提示词 | 关 | --style raw |
| Stylize | --s N | 0–1000 | 艺术化处理强度 | 100 | --s 750 |
| Chaos | --c N | 0–100 | 网格结果间的变化程度 | 0 | --c 30 |
| Quality | --q N | 0.25, 0.5, 1, 2 | 渲染质量和计算时间 | 1 | --q 2 |
| No | --no [词] | 任意词 | 排除指定元素 | — | --no blur, text |
| Seed | --seed N | 0–4294967295 | 可复现的起点 | 随机 | --seed 12345 |
| Tile | --tile | 开/关 | 创建无缝平铺图案 | 关 | --tile |
| Image Weight | --iw N | 0.5–2 | 图片参考影响强度 | 1 | --iw 1.5 |
10个即用Midjourney提示词
以下10个提示词可直接用于Midjourney v6.1。直接复制使用,或作为起始模板进行自定义。
1. 电影级肖像
生成戏剧性的电影级特写肖像,专业灯光和浅景深。
young woman with sharp features and silver-streaked hair, intense gaze, wearing a weathered leather jacket, shot on Sony A7R V with 85mm f/1.4, shallow depth of field, dramatic Rembrandt lighting, cinematic color grade with teal shadows and warm highlights --ar 2:3 --v 6.1 --style raw --q 2
2. 奇幻风景
生成史诗级广角奇幻环境,大气深度和超凡色彩。
floating sky islands covered in ancient ruins and waterfalls cascading into clouds below, twin moons on the horizon, bioluminescent flora glowing at twilight, vast epic scale, fantasy concept art, matte painting style, volumetric god rays --ar 21:9 --v 6.1 --q 2 --s 400
3. 产品摄影
创建干净的高端商业产品图,适合电商或广告。
minimalist glass perfume bottle with gold cap on white marble surface, water droplets condensation, soft diffused natural light from left window, subtle reflections, premium commercial product photography, razor-sharp focus, negative space --ar 4:5 --v 6.1 --style raw
4. 动漫角色
输出具有表现力和风格化设计的详细动漫风格角色插画。
female mage character with flowing silver hair and glowing violet eyes, ornate blue and gold robes with celestial embroidery, casting a spell with trails of light, dramatic upward angle, highly detailed anime illustration, soft cel shading, dynamic pose --ar 2:3 --v 6.1 --q 2
5. 建筑可视化
渲染具有精确材质和专业灯光的照片写实建筑外观。
modern minimalist villa at twilight, floor-to-ceiling glass walls revealing warm interior light, infinity pool reflecting orange sky, concrete and dark wood facade, surrounded by curated desert landscaping, architectural photography, wide angle exterior shot --ar 16:9 --v 6.1 --style raw --q 2
6. 抽象艺术
fluid simulation of molten gold and deep cobalt blue colliding in slow motion, macro photography, high-speed capture frozen in time, swirling organic forms, extreme detail in surface tension and droplet formation, studio lighting, abstract fine art --ar 1:1 --v 6.1 --q 2 --s 600
7. 美食摄影
rustic sourdough loaf just pulled from oven, steam rising, golden-brown crust, cracked top revealing open crumb, on a worn wooden board with scattered flour and a linen cloth, warm kitchen window light, food photography, close-up overhead angle --ar 4:5 --v 6.1 --style raw
8. 科幻概念艺术
abandoned alien megastructure half-buried in red desert sand, towering monolithic slabs of dark metal covered in cryptic geometric engravings, dramatic low sun casting long shadows, lone explorer figure for scale, sci-fi concept art, matte painting, cinematic wide shot --ar 21:9 --v 6.1 --q 2
9. 复古风格
1970s road trip across American Southwest, vintage station wagon on Route 66, dust clouds behind, vast red canyon landscape, analog film grain, Kodachrome color palette, warm faded tones, cinematic 16mm aesthetic, wide angle --ar 16:9 --v 6.1 --style raw --s 200
10. 极简设计
single red tulip in a clear glass vase on a white table, high-key even lighting, long shadow cast to the right, minimal composition with intentional negative space, Japanese minimalist aesthetic, commercial photography --ar 4:5 --v 6.1 --style raw
提示:使用ImageToPrompt从任何参考图片自动生成类似的提示词——然后用这些模板理解结构并优化结果。
提示词结构对比:Midjourney vs Flux vs Stable Diffusion
AI艺术家最常犯的错误之一是用错误的格式为所使用的模型编写提示词。Midjourney、Flux和Stable Diffusion有着根本不同的提示词语言——在一个模型中效果极佳的提示词在另一个模型中可能产生平庸的结果。
Midjourney偏好按视觉重要性排列的逗号分隔描述词序列。以主体开头,然后是风格/媒介、灯光、构图、氛围——后跟--参数。Midjourney按比例分配注意力,所以排在前面的内容获得最多视觉权重。
Flux(Flux.1 Dev/Pro/Schnell)使用大型T5-XXL语言模型解读提示词,意味着它比Midjourney的CLIP方法更好地理解自然语言。用完整的描述性句子编写Flux提示词。Flux不支持--参数、负面提示词或权重语法。
Stable Diffusion使用基于token的CLIP编码,意味着它响应加权标签列表。质量token放在开头(masterpiece, best quality, ultra-detailed),然后是主体和风格token,再加上独立的负面提示词字段。权重语法如(重要概念:1.3)可精确调节强调程度。
| 方面 | Midjourney v6.1 | Flux.1 Dev/Pro | Stable Diffusion XL |
|---|---|---|---|
| 提示词格式 | 逗号分隔描述词 | 自然语言完整句子 | 加权标签列表 |
| 参数 | --ar --v --s --c --q |
无(在UI/API中设置) | CFG scale, steps, sampler |
| 负面提示词 | --no [词] |
不支持 | 独立负面提示词字段 |
| 提示词长度 | 中等(50–150词) | 长(1–4个句子) | 短–中等(标签列表) |
| 权重控制 | subject::2语法 |
仅通过句子强调 | (term:1.3)语法 |
| 最适合 | 艺术性、风格化、一致美学 | 照片写实、开源、自托管 | 微调模型、动漫、自定义工作流 |
Midjourney版本对比



| 方面 | V5.2 | V6 | V6.1 |
|---|---|---|---|
| 照片写实 | 好 | 非常好 | 最佳 |
| 文字渲染 | 差 | 改进 | 好 |
| 细节水平 | 高 | 很高 | 很高 |
| 提示词遵循度 | 中等 | 好 | 非常好 |
| 美学风格 | 标志性MJ风格 | 更自然 | 最自然 |
提示词权重控制
您可以使用::语法控制Midjourney对提示词特定部分的重视程度:
a surreal landscape::2 with tiny clockwork figures::1
::2告诉Midjourney风景的重要性是小人偶的两倍。您还可以使用负权重:forest::2 buildings::-1强调森林并排除建筑物。
常见Midjourney提示词错误
在不重要的部分花费太多描述
Midjourney在整个提示词中分配注意力。如果你用50个词描述背景元素,它们会与主体竞争。先写最重要的内容。
矛盾的指令
"明亮阳光" + "黑暗阴郁氛围"会造成混乱。保持内部一致。如果你想要一个整体明亮但有戏剧性阴影的场景,请具体描述。
遗漏构图
没有构图指导,Midjourney会自行选择。添加明确的构图:"close-up portrait"、"wide establishing shot"、"bird's eye view"。这会显著改变结果。
忘记宽高比
默认的1:1方形格式很少是你想要的。始终添加--ar以匹配预期用途。
获得一致的结果
找到满意的结果后,使用seed值来重现类似结果。对Midjourney消息添加表情反应获取seed,然后在未来的提示词中使用--seed [数字]获得相似的构图起点。
有效使用图片参考
Midjourney接受在提示词开头的图片URL。--iw(image weight)参数控制参考图的影响强度:
--iw 0.5:微妙影响——参考图模糊地引导风格和氛围--iw 1:中等影响——默认值,平衡参考图与文本提示词--iw 2:强影响——结果会与参考图非常相似
这正是ImageToPrompt等图片转提示词工具与Midjourney互补的方式——从参考图提取文本提示词,同时提供图片URL作为视觉锚点,实现更强的风格迁移。
常见问题排除
图像太暗
添加明确的灯光描述:bright ambient lighting、well-lit scene或特定光源。删除所有暗示黑暗的氛围词。
手部变形
使用--no deformed hands, extra fingers, fused fingers并在正面提示词中包含detailed hands, accurate anatomy。V6.1比之前版本更擅长处理手部。
4个网格结果看起来都一样
添加--chaos 30或更高。低chaos(默认0)产生非常相似的变体。探索时使用20-50,确定方向后降回0。
图像中的文字模糊
使用V6或V6.1(不要用更早版本)。将想要的文字用引号括起来:"OPEN" sign on the door。保持文字简短——单词或2-3词短语效果最好。