2. Midjourney 极简入门:prompt 结构说明与属性描述词

Midjourney 入门 prompt 结构 属性描述词 图片生成技巧
Midjourney 的 prompt 结构可分为三部分:内容描述、风格描述和属性描述。内容描述定义图像主体,风格描述涉及艺术风格、视角等,属性描述则包括图片尺寸、版本号等基本属性。文章重点探讨了属性描述词的使用,如版本号(--v)、扩幅(upscale)、负面提示词(--no)、质量(--q)、图片比例(--ar)、chaos值(--c)等。此外,还介绍了参考图片、Remix模式、细分样式(--style)和动漫风格(--niji)等高级功能。掌握这些参数可以大幅提升使用 Midjourney 的效果。
文章内容
思维导图
常见问题
社交分享

Midjourney 的 prompt 的结构可以拆分成三个基础组成部分:

  1. 内容描述:就是主体内容,表达我们到底想画什么。是骡子是马,是猴子是兔。他们是什么形象、穿着什么衣服、在干什么,等等。
  2. 风格描述:包括曾经讲过的艺术家、画笔风格、艺术风格等等,甚至包括打光、视角、拍照相机的牌子等等。
  3. 属性描述:最基本的图片属性,比如尺寸、使用的 Midjourney 版本。

显然,内容描述是各位在画每个图的时候各自去创作的;风格描述,就是这个创意库接下来要探讨的;而属性描述,是相对最基础也容易掌握的部分。这篇文章就探讨几个最基本的属性描述词。

对了,强调一下,内容描述和风格描述都是可以用 , 或者 + 隔开的。而属性描述是要用两个短横线隔开的,要严格遵循:–[属性名][空格][属性值]

比如:rabbit, white --v 4

版本号 --v 1/2/3/4

前文提到过了,去年底发布的 v4 是效果最震撼的,而之前的三个版本还没有达到如此写实的程度。2023 年,这个专栏更新的过程中,Midjourney 预计会发布 v5,又会有一轮优化。

v 1-4 的区别,可以用同样的关键词来体会,比如:

cat --v 1

cat --v2

cat --v3

cat --v4

直观的感受,自然是默认都用 v4 即可,效果是最好的。但在画不同艺术风格的图片时,也未必。有时候觉得过于写实了,用一下 v2、v3 画抽象的风格,可能会有奇效

另外,每次输入 --v 4 是比较麻烦的,想要默认都是 v4,可以输入语句:

/settings

这里面可以选择各种默认的语句。每次输入完,会自动给你添加上的。

扩幅相关 upscale

upscale 是把 4 in 1 的 demo 图片扩大篇幅成为更高清的图片。默认的扩幅一般就能用了。

还有几个特殊的扩幅操作:

–uplight

轻量级的扩幅,不代表是「不用心」的,指的是添加少数细节。对于平滑和简单的图片,效果更好。

这一项也可以在 settings 里设置成默认。

–upbeta

这是 beta 扩幅,增加更多额外的细节,图像像素大小也会翻一倍。

另外,还有一个特殊的操作,就是当你用了 upscale 之后感觉还是不行,想要重做,是可以用 light 重做和 beta 重做的,逻辑类似。方式就是点击图片下方的按钮:

这里还有一个 Make Variations,也容易理解,就是根据这个图重新做一份 4 in 1 的 demo,效果是这样的:

对于扩幅的图片像素大小,官方有一个完整的图表:

负面提示词 --no

如果不希望图片里出现什么内容,可以用这个描述。

比如:

–no hands

不要出现手。

质量 --q .25/.5/1/2

这是很量化的图片渲染时间,默认是 1。如果用更短的时间,消耗的额度更少,图片效果可能略差;反之亦然。

注意,渲染时间也跟额度有关。q 设置为 2,差不多就消耗两倍的额度。

图片比例 --ar 2:3/3:2

v4 版本只支持三种比例:

默认的 1:1,2:3 和 3:2

要调整比例,使用语句 --ar,如:

cat --ar 2:3

v3 支持更多比例。但这里不展开说了。

有多飞 --c 0-100

chaos 指的是画得有多飞,默认值是 0。如果数值较大,会画得特别飞(少数场景才比较合适)。

比如这是:

cat fighter --c 0

这是:

cat fighter --c 100

参考图片

Midjourney 是支持参考图片的。比如如果想依据自己的照片画图,可以直接把图片网址放在 prompt 里面。例如:

https://s.mj.run/euG_Zu_BnQM iron man

如果图片还没有上传到什么图床,可以直接在对话框里发送,发送完后点击右键——复制地址。

增加语句重制 Remix

跟普通的重新制图不一样,高阶版的增加语句重制,可以在原构图/基本结构上,画别的主题。

具体操作是要去 settings 里打开 Remix Mode,然后再已经 upscale 的图片下点击 Make Variations,就可以另行输入 prompt 了。

这是我画的中国古镇:

这是用同一张图片在 Remix 模式下绘制的北欧古镇:

细分样式 --style 4a/4b

在 v4 中,Midjourney 还提供了有细微差别的 style,把 4 分为了 4a 和 4b。如果不输入 style,默认都是 4b。具体的区别,官方没有说明,可以用图片感受下(4b 的在前面有过了):

cat --v4 --style 4a

##

动漫风格 --niji

官方跟麻省理工的 AI 团队 spellbrush 合作推出的 niji 风格。

cat --niji

更多相关的属性描述词

可以参考官方手册:

https://docs.midjourney.com/docs/parameter-list

掌握了以上这些,可以说已经掌握 90% 的参数了。

下一节开始,我们将进入正文主题,开始我们的创意之旅。

思维导图生成中,请稍候...

问题 1: Midjourney 的 prompt 结构包含哪些组成部分?
回答: Midjourney 的 prompt 结构包括内容描述、风格描述和属性描述三个基础部分。内容描述表达主体内容,风格描述涉及艺术家、画笔风格等,属性描述则包括图片尺寸、版本号等基本属性。

问题 2: 如何正确使用属性描述词?
回答: 属性描述词需要用两个短横线隔开,格式为 --[属性名][空格][属性值]。例如:rabbit, white --v 4

问题 3: Midjourney 的版本号(–v)有什么作用?
回答: 版本号(–v)用于指定 Midjourney 的版本,不同版本的效果不同。例如,v4 是最新且效果最写实的版本,而 v2 和 v3 可能更适合抽象风格。

问题 4: 如何设置默认的 Midjourney 版本?
回答: 可以通过输入 /settings 命令,在设置中选择默认的版本号,这样每次生成图片时都会自动应用该版本。

问题 5: 什么是 upscale,它有哪些类型?
回答: upscale 是将 4 in 1 的 demo 图片扩大为更高清的图片。常见的类型包括 --uplight(轻量级扩幅)和 --upbeta(beta 扩幅,增加更多细节)。

问题 6: 如何避免图片中出现某些元素?
回答: 可以使用负面提示词 --no,例如 --no hands 可以避免图片中出现手。

问题 7: 图片质量参数(–q)的作用是什么?
回答: 图片质量参数(–q)控制图片的渲染时间和效果。默认值为 1,数值越高,渲染时间越长,效果越好,但消耗的额度也越多。

问题 8: 如何调整图片的比例?
回答: 使用 --ar 参数可以调整图片比例,例如 --ar 2:3 将图片设置为 2:3 的比例。v4 版本支持 1:1、2:3 和 3:2 三种比例。

问题 9: 什么是 chaos 参数(–c),它有什么作用?
回答: chaos 参数(–c)控制图片的创意程度,数值范围为 0-100。数值越大,图片越“飞”,适合少数特殊场景。

问题 10: 如何使用参考图片生成图像?
回答: 可以将图片的网址直接放在 prompt 中,例如 https://s.mj.run/euG_Zu_BnQM iron man,Midjourney 会根据参考图片生成图像。