你第一次打开Midjourney,输入"cool dragon",得到的结果还行,但很普通,完全不是你心目中想要的。而另一个人输入了一大段具体的描述词,却生成了令人惊叹的作品。

区别就在于提示词工程——一种与AI图像生成器清晰有效沟通的技能。它不是编程,也不是魔法,而是一门可学习的手艺。本指南从零开始为你打下坚实的基础。

什么是提示词?

在AI图像生成的语境中,提示词(prompt)是你给AI模型的文本指令,用于生成图像。AI读取你的文字,解读你的意图,并生成尝试匹配你描述的像素。

核心挑战在于:AI模型基于数十亿图像和标注训练而成。它们学会了文字和视觉概念之间的关联。但它们是以概率方式解读你的文字的——每次生成都略有不同,模型在"你到底想要什么"这个问题上做出了无数微观决策。

提示词工程就是编写能引导这些微观决策朝向你真正想要的结果的提示词。

为什么"Cool Dragon"不行

"Cool dragon"是最大程度的模糊。AI见过数千种被描述为"cool"的龙——西方龙、东方龙、卡通龙、写实龙。没有额外指导,它会选择所有这些的平均值。结果感觉平庸,因为它本质上就是"cool dragon"的统计平均值。

提示词越具体,AI可以利用的信息就越多,结果就越独特。对比:

弱:cool dragon

强:ancient sea dragon emerging from stormy ocean waves at night, translucent teal scales catching moonlight, massive wingspan, serpentine body, bioluminescent markings, cinematic wide shot, dramatic lighting, dark fantasy concept art

同一个主题,截然不同的结果。

优质AI提示词的五大支柱

1. 主题——图像中有什么?

主题是你的起点。要精确:

包括:外貌特征、年龄/时代、服装、表情、动作、与环境的关系。

2. 风格——看起来应该是什么样?

风格告诉AI在什么艺术或摄影语域中工作。常用风格类别:

3. 光照——光线在做什么?

光照可以说是影响氛围和质量的最强大的单一元素。关键光照描述词:

4. 构图——如何取景?

构图告诉AI如何在画面中安排元素。借鉴电影/摄影术语:

5. 氛围——应该给人什么感觉?

氛围传达情感基调。有用的氛围描述词:

专业提示词的解剖

让我们解析一个完整的专业提示词,标记每个组件:

ancient sea dragon emerging from stormy ocean waves at night,  [主题]
dark fantasy concept art, digital painting,                      [风格]
dramatic rim lighting, bioluminescent glow from below,           [光照]
deep navy blue and teal with warm orange accents,                [色彩]
cinematic wide shot, low angle perspective,                      [构图]
mysterious, awe-inspiring, powerful                              [氛围]
--ar 21:9 --v 6.1 --style raw --q 2                            [参数]

每个元素都有其存在意义。移除"bioluminescent glow from below",龙就失去了超凡品质。移除"low angle perspective",规模感就崩塌了。

质量标签:可靠的增效词

许多AI生成器对质量信号词有良好响应,这些词告诉模型产出最佳输出。在Stable Diffusion中尤其重要:

在Midjourney和Flux中,这些标签不太必要,因为它们默认就以高质量为目标。但在SD中,它们能产生明显的差异。

负面提示词:排除你不想要的

Stable Diffusion有一个独立的负面提示词字段,用于列出你想排除的元素。标准负面提示词基础:

blurry, low quality, bad anatomy, deformed fingers, watermark, text, logo, cropped, out of frame, duplicate, ugly, amateur, jpeg artifacts

Midjourney通过--no [term]处理负面排除,但没有SD的实现那么强大。

提示词词汇速查表

类别常用术语
光照golden hour, blue hour, rim light, backlit, Rembrandt lighting, volumetric light, neon light, candlelight, chiaroscuro, bioluminescent
风格cinematic, editorial, concept art, oil painting, watercolor, anime style, photorealistic, minimalist, surrealist, Art Nouveau, dark fantasy
氛围ethereal, dramatic, serene, ominous, nostalgic, whimsical, melancholic, epic, cozy, mysterious, magical
构图close-up portrait, wide shot, bird's eye view, Dutch angle, rule of thirds, shallow depth of field, establishing shot
色彩warm tones, cool tones, muted palette, vibrant saturated, monochromatic, pastel, earth tones, high contrast
相机/镜头85mm f/1.4, 24mm wide angle, macro lens, Canon EOS R5, film grain, bokeh, tilt-shift

观察提示词的进化过程

理解提示词工程最有效的方式是观察一个提示词如何从模糊变为精确。每个阶段增加一层信息:

第1阶段——太模糊:

a cat in a garden

通用。AI选择了"花园中的猫"的统计平均值。毫无特色。

第2阶段——具体的主题和场景:

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden

更好了。现在有了品种、毛发质感、动作和具体环境。但仍然没有艺术方向。

第3阶段——添加风格:

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework

有了艺术方向。风格词为AI提供了视觉语域。

第4阶段——添加光照:

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework, golden hour sunlight, dappled light filtering through trees, warm amber tones

光照完全改变了氛围。同一场景现在感觉温暖、怀旧、田园诗般。

第5阶段——添加构图和参数:

a fluffy orange tabby cat sitting among wildflowers in an English cottage garden, watercolor illustration style, soft edges, delicate linework, golden hour sunlight, dappled light filtering through trees, warm amber tones, shallow depth of field, rule of thirds composition --ar 3:2 --v 6.1

专业级成果。与第1阶段相同的主题——被五层具体描述彻底改变。

如何快速学习提示词工程

研究现有提示词

PromptHero、Civitai和Lexica等网站允许你浏览带提示词的AI艺术。研究哪些描述词产生特定结果。

使用图像转提示词工具

学习的最佳方式之一是分析你喜欢的图像。上传任何图片到ImageToPrompt,仔细研究生成的提示词。对10-20张图片这样做,你就能快速内化词汇。

每次只改变一个元素

实验时,每次只改变一个元素。如果改了五个元素且结果变好了,你不知道是哪个改变起了作用。

建立个人提示词库

保存好用的短语和组合。或者跳过手动编写——使用我们的文本转提示词生成器即时增强任何描述。

3个立刻可以练习的练习

练习1:分析与对比

上传你最喜欢的照片到ImageToPrompt。仔细阅读生成的提示词。然后关闭它,凭记忆为同一张图片从头编写你自己的提示词。对比两者——你遗漏了什么?AI遗漏了什么?

练习2:单词游戏

取任何有效的提示词,只改变一个词。生成两个版本并对比。用5个不同的词做5次。你会很快了解哪些描述词具有最大的视觉影响力。

练习3:风格迁移

使用ImageToPrompt从风景照片生成提示词。保留所有风格、光照、色彩和氛围词——但将主题替换为完全不同的事物。观察视觉语言如何迁移。

通过分析真实图像开始学习

上传任何图片到ImageToPrompt,精确了解视觉特质如何转化为提示词语言。这是学习提示词工程最快的途径。

试用免费图像转提示词生成器 →

常见问题

什么是AI艺术的提示词工程?

AI艺术的提示词工程是编写文本描述来引导AI图像生成器产生特定视觉效果的技能。它涉及描述主题、艺术风格、光照、构图、色调和氛围。

优质提示词的五大要素是什么?

五大要素是:主题(图像中有什么)、风格(看起来应该是什么样)、光照(光线在做什么)、构图(如何取景)和氛围(应该给人什么感觉)。

如何快速学习提示词工程?

最快的方法是使用图像转提示词工具分析你喜欢的图像,然后每次只修改一个元素观察效果。浏览社区画廊学习产生出色结果的提示词也很有帮助。