不久前,AI绘画赛道数一数二的Midjourney是否在QQ频道开启中文版内测,引发了一场罗生门讨论。
5月15日,公众号“Midjourney AI”宣布开启官方中文版内测,将搭载在QQ频道上。
(资料图)
但很快,有自媒体发文质疑“Midjourney AI”的真实性,罗列的疑点包括:其按次收费,而海外版为会员制;“Midjourney AI”的认证主体是名不见经传的南京鹏羽辉科技有限公司;5月17日删除官宣推文。
而根据Midjourney中国区运营回复36氪的信息,Midjourney QQ频道确为官方运营。微果酱也在Discord频道上找到官方曾提及在QQ开放的会议纪要。
值得一提的是,Midjourney并没有自己的App,在国外是架设在Discord频道。在国内,Midjourney目前选择和QQ合作。有消息称,QQ正在全力支持Midjourney频道的商业化。
至此,Midjourney进军中国的罗生门告一段落,但AI绘画赛道的竞争仍然如火如荼。
果酱妹尝试体验了一下当前几个热门的AI绘画平台,其能力水平和实操门槛还是有一定差距的。(这里谨以新手输入指令直接出图的水平作比较,不涉及专业调整或后期修图结果)
01#
Midjourney
大家还记得这张曾在网上疯传的情侣照吗?神似相机拍摄的图片,实际上来自AI一键生成,Midjourney一时间名声大噪。
在Discord的Midjourney频道上,持续不断地滚动着用户的需求和AI绘画的出图成果。一开始进入界面时,不少用户会觉得有些混乱,不符合使用习惯,实际上这方便了用户之间的指令共享。
只需要输入绘画指令,名为“Midjourney Bot”的AI机器人就会在短时间内出图。用户可以根据需要对指令做细化编辑,以得到让自己满意的图片。
比如,对应指令的图片效果如下:
指令翻译:一个美丽女人在春丽装的异想式肖像微笑,直发,插图,马丁安辛,库夫希诺夫伊利,亚当休斯的风格,线条艺术,闪闪发光,现实的脸,皮下皮肤,高对比度现实主义,8k分辨率,编辑插图,现实主义的细节,半身
产品商业图也能够拿捏,只需要输入背景、产品类型、颜色风格就完事。
背景皮肤护理,摄影,现实主义,干净,浅粉色,明亮,4k
不过值得注意的是,目前Discord的Midjourney频道只支持英文,且或许因为需求太大,已经取消了免费体验的通道。
主要内容翻译:由于需求太大,我们现在不能提javascript供免费试用。请订阅或明天再试。
有需要的朋友可以花钱订阅,或者让我们再等等QQ频道的中文版开放吧。
02#
Stable Diffusion
作为同样在国内有相当名气的AI绘图平台,Stable Diffusion的优势主要在于控制更加精确,以及免费。
只需要按照提示在浏览器添加插件,就可以开始AI绘画之旅了。在Stable Diffusion的输入框下方还有指令示例,用户可以参考其表达进行输入。
输入这样一段用逗号隔开关键词的指令,AI在几秒钟内跑出了四张图片:
指令翻译:一瓶盒装牛奶,放在厨房的桌上,阳光从窗户照进来,温馨的家居氛围
可以看到,四张图中有三张图是基本满足要求的,且图片风格也没有跑偏。
但如果涉及到人物图片的输出,则需要更专业的指令和操作,以及配合其他大模型。否则直接出图的效果大多不尽如人意,甚至五官、动作都会呈现出一定程度的错乱。(鉴于果酱妹做出的成果图实在恐怖,这里就不放了)
因此,Midjourney和Stable Diffusion两者的区别可以简单总结为,前者收费,但更适合非专业绘画领域的用户一键生成;后者免费,但使用门槛更高,更适合行内人作为专业辅助。
图源:站酷@hello小尹
03#
文心一格
背靠百度的文心一格,可以算是国内AI绘画平台的头部。相对来说,其主界面更符合国民的使用习惯,左边是操作栏,中间是成品显示,右边是历史记录,基本不需要什么教程就可以上手。
文心一格包括了推荐和自定义两种模式。相比推荐模式,自定义模式能够对需求做细化,常见参数的选项相当于是一种引导。同时,文心一格免费生成图片的数量有限,使用过程不免精打细算。
但功能千千万,真到出图时刻却一言难尽。这个成品和果酱妹选择的“二次元”“动漫”画风,很难找出一毛钱的联系。
综合来看,文心一格相对擅长简单的指令,生成得较为成功的图片以卡通风格为主,要达到真人绘画师的水平还需加倍努力。
04#
6pen Art
6pen是国内一个创业团队推出的AI绘画平台,属于原本数字内容销售业务的延伸,相当于为平台创作者提供的工具,支持自产自销。
正因为商业化气息浓厚,所以6pen的产品体验流畅,上手门槛也低。
微信扫码登录,具体流程、页面布局都和此前火过一阵子的AI绘画小程序相似,只是做了功能细化进阶。
用户在“画面描述”框中输入指令,然后选择画风,包括画面类型、风格修饰、艺术家等,支持一次性生成多张图片。
值得注意的是,6pen可以选择AI绘画的模型,包括自研的南瓜、西瓜、甜瓜,还和Stable Diffusion商业合作。每种模型的特点都标注了特点,让用户按需取用。也就是说,不需要科学上网,在6pen就可以体验一把Stable Diffusion。
同时,6pen支持挂载自己创建训练的模型。这对于专业领域的或者拥有了自己风格成熟模型的用户来说,是大开方便之门。
此外,对于老手,6pen还提供了专家模式,可以进行更加细致的绘画调整。
最重要的是,只要你选择了“免费通道”,以上大部分功能都是免费且不限生成次数的,模型不同也只决定生成速度的快慢。
而在版权方面,6pen做得也不错。如果使用的是南瓜和西瓜模型,采用的都是MIT协议开源,生成的图片版权完全授权给生成者本人。
不过,Stable Diffusion模型采用的是CC0协议,其产生的作品版权不由创作者独享,所有人都可以用它做任何商业用途,版权也无法直接出售。
浅看一下大佬们的作品,AI作为辅助的效果还是很不错的,也可以看出,6pen更擅长CG风格。
果酱妹用最基础的功能尝试生成不同模型的图,不算惊艳,也比不上直接用Stable Diffusion的效果,只是在某些缺图的场合能用的水平。但无需科学上网,几秒钟出图,没有版权的后顾之忧,还要什么自行车?
05#
Vega AI
同样来自于国内创业团队的AI绘画平台,Vega AI被某些网友称为“国产AI高级绘图工具天花板”。首页的功能区包括文生图、图生图、条件生图和风格训练,基本囊括了AI绘画的主流功能。
大致操作和其他平台的区别不大。
相比6pen,Vega AI生成的图片风格会更加精准;
相比文心一格,VegacCgOGKksAI生成的人物图片也较少出现五官错乱等惊悚情况。
同时,支持点击生成图片右边栏的编辑按钮实现一键优化,或者发送到隔壁的“图生图”频道进一步操作。
进阶玩家还可以在Vega AI上训练自己的模型,只需要上传足够多的图片样本,就能够跑出自己的风格,将生成人物的外观稍微固定下来。
也就不会像果酱妹这样,生成这样成功的图只是偶然。
需要注意的是,如果用Vega AI反复生成人物图片,并且不改用其他模型,很容易导致后续的指令都会被默认为生成人物图片。
06#
AI绘画杀疯了
在ChatGPT引爆之前,AI绘画的发展是这场AI热潮的第一波巨浪。
2022年8月31日,一幅名为《太空歌剧院》的AI画作在美国科罗拉多州博览会美术比赛中获得“数字艺术/数字修饰照片”类别的最高奖项。尽管受到不少画师们的质疑和抵制,但AI创作仍然让它声名鹊起。
彼时,大家都没有想到,3个月后ChatGPT横空出世,向大众真正打开了AI之门,AI绘画也随之变得普遍。
从2021年开始,ChatGPT的研发公司OpenAI便公布了DALLE,声称这个模型能够从任何文字中创建高质量图像。2022年4月,DALLE2发布,绘画效果直逼人类画师水平。
2022年2月,Disco diffusion面世,从无法生成具体的人像到能够画出初级画师水平,只用了短短几个月。3月,由Disco diffusion的核心参与建设的Midjouney发布,开启了AI绘画以假乱真的时代,用其创作的《太空歌剧院》在5个月后获奖。
同年7月,Stable Diffusion开启内测,有消息称“仅仅十天后,每天就有一千七百万张图片通过它生成”。而不到一个月,其便宣布开源,意味着所有人都能在本地部署自己的AI绘画生成器。
我们总说,让子弹再飞一会儿。但实际上,这颗子弹的飞行速度早已超出想象。
通过前文的几番体验,我们不难感受到,AI绘画已经离我们越来越近了。
从新鲜事物到司空见惯,从需要科学上网到国产平台层出不穷,从一眼鉴AI到难辨真假,AI绘画的发展不断加速,门槛不断下降,“人人都能成为达芬奇”的时代似乎触手可及。
我们不妨大胆猜测AI绘画的未来—js—其将会成为一个新的行业,不同于传统绘画,原本费时费力的创作过程变成搭建数据集、跑模型、AI出图的可控科技流程。新旧行业并存,甲方按需合作。
同时,AI绘画逐渐成为画师们的最强辅助,颠覆一直以来亲力亲为的创作环节,AI负责按需求生成草图的工作,再由画师在其基础上完善细节。这也意味着,部php分初级画师将被淘汰。
值得重视的是,AI绘画的影响并不局限于画师。当AI绘画的版权问题解决,原本依赖图片版权为生的公司该如何应对;当AI绘画开始泛滥,艺术交易中的真实性和可靠性又该如何保障......
尽管人们总说AI的作品不含感情因素,难以取代人类的创作,这一点在文本领域更为明显,但在绘画领域,外行人很难迅速判断一幅画作的价值,这也就给了AI绘画更多的机会。
对于我们来说,顺应时代发展,学会使用AI工具,或许才能给未来的自己留下一条出路。