从上上个月OpenAI的DALL·E发布引爆AI画图的热点到如今已经过去了一段时间。我也积攒了一些使用Midjounary的经验
我总喜欢在热点过去很久之后正式开始浏览和审视一个话题,我认为这可以让我做出更加负责任的评论。这里不探讨其社会价值或者是Emo的哲学问题,仅仅就使用这些东西写一个技术上的感悟。
神奇的提示
图片的内容
所有使用过AI生成图片的引擎输入基本上都大同小异:你需要为你想要的图片提供一个合理的描述。当然提示只是我的口头用语,其高大上的学名是原始提示文本(Raw prompt text)简称prompt。
让我们简单测试下,随便给个提示:一个月球上的剑客?听起来不错,当我键入 A swordsman on the moon.以下是我输出的结果。
乍一看好像的确符合我的要求,但是我们不会止步于此对吧?大部分时候,我想定义这个人在干什么,用什么风格这个人长什么样子,以下就让我们来深入挖掘下。
大量的形容词
将上面的部分组织在一起并不容易,大部分时候,我们需要为名词组织形容词以达到更具体的效果
艺术风格
艺术风格是生成一张图片最重要的参数之一,其在一个很高的层次上决定着这是一张怎么样的图片。这可以是美术流派,也可以是艺术家本人。
你任何可以想到的艺术风格、流派和作者的名字只要是能搜索到的均可以作为风格放在这里。包括但不限于:现实主义,超现实主义,印象派,野兽派,浪漫派,新古典主义,日式卡通,迪士尼,赛博朋克、达芬奇、毕加索等等等等。当然你也可以同时输入两个艺术风格来尝试下会有什么效果。
影视、渲染和光线效果
除此之外,任何你想要的输出效果或者是渲染效果也可以填写在提示内部:
图像作为提示参数
当你希望你生成的图片跟另外一个图片很像的时候也非常简单,你仅仅需要将图片链接作为提示输入即可:
/imagine <your image URL> <your text prompt>
除提示外的其他各种参数
风格化参数(Stylize)
该参数由stylize提供,需要输入风格化干扰的时候,只需要键入以下参数。
--stylize <stylize intensity>
其中数值越大,说明我们的风格化程度越高,这个风格化是贴合自己的描述的。可以简写为-s
混乱(Chaos)
该参数由chaos提供,其决定了图片的抽象程度,简写为-c
--chaos <abstracte intensity>
输出质量(Quality)
该参数定义了输出内容的细节程度,数值越高,输出的细节会越多。
--quality <quality values>
分辨率/屏幕长宽比
我将这些放到一个类目下面,因为这两个的确很接近
这些参数很多都是决定你图像分辨率的,主要有
--hd // high definition 高清
--w // width
--h // height
--ar <width ratio>:<height ratio> // aspect ratio
可以写在提示中的有:8K , 4K , photorealistic , ultra photoreal , ultra detailed, intricate details
图片提示权重值(Image prompt Weight)
决定了你生成的图片出来有多么像你的输入提示图片
--iw <weight number>
文字提示权重值
你可以使用
剔除
当我们不想要图片上的某样东西,从而剔除这个东西的时候,我们需要使用这个参数,这个参数为:
--no <item to filter out>