堪比艺术家!被疯狂安利的 AI 插画神器 Disco Diffusion 有多强? 收藏
大家好,我是和你们聊设计的花生~
有关注「神器挖掘机」阿文(微博 @Simon_阿文 )的朋友,可能已经了解到他最近正在疯狂安利一款 AI 绘画神器—— Disco Diffusion 。
这款被阿文称作“用嘴就能画画”的神器,能通过输入的一段描述语句,自动渲染生成对应场景的图片。渲染结果质量非常高,高到不说是 AI 自动生成的话,你肯定会觉得是哪位绘画大神的作品。
先来看看阿文第一次尝试的结果,输入关键词是“星空下的向日葵花海”,渲染时间很久,但是出来的效果也足以令人惊叹。(图片来源: @Simon_阿文 )
之后阿文又尝试了中国画的水墨风格,Disco Diffusion 的表现仍然很好。
图片来源: @Simon_阿文 ,关键词 ”a beautiful painting of Chinese Shanshui landscape, clouds, ink style, trending on artstation“
在看到阿文的推荐后,微博上很多网友也开始尝试,并同样取得了不错的渲染结果。
图片来源:微博 @MIGRAINER- ,关键词 ”Among planets, stars and galaxies, an armada of gigantic very long spaceships travels at light speed, detailed,artstation,Chris Foss“
怎么样,是不是有点颠覆你对 AI 绘画的认知了?
Disco Diffusion 自发布后,在外网引起了很多艺术家的关注。他们也使用 Disco Diffusion 进行各种尝试,也诞生了很多优质的渲染作品。
图片来源: @cosmicWranglerZ ,关键词 ”A BOY TRAVELING WITH HIS CYBERNETIC PACKHORSE SELLING TECHNO ALCHEMY WARES“ 渲染结果,
图片来源: @x1ao4 ,关键词 ”ancient Chinese village“
可以看出 Disco Diffusion 自动渲染出的图片无论是色彩还是氛围都达到非常高的水平,充满魔幻色彩。作为一个 AI 程序,这一切是如何实现的呢?
什么是 Disco Diffusion? Disco Diffusion 是在今年 2 月初开始流行的一个 AI 图像生成程序,它可以根据描述场景的关键词渲染出对应的图像,开发者是艺术家兼程序开发员 @Somnai_dreams 。
这款程序的特点在于:它直接托管在谷歌的 Colaboratory 上的,即整个程序是直接在浏览器中编写和运行代码的。这也意味着使用 Disco Diffusion 对电脑配置没有要求,因为程序不需要被部署到本地。
Github 地址 ? https://github.com/alembics/disco-diffusion
Disco Diffusio 程序的首页
Disco Diffusion 程序的首页不是我们熟悉的用户界面,而是一行行看起来很复杂代码——有点像没有外壳的机器,将线路零件直接呈现在用户面前了。
这些代码就是 Disco Diffusion 整个程序运行下来的所需的全部代码,而且都已经按步骤分类好了。看起来很深奥,但真正需要我们动手修改参数的地方极少,跟随网站上的教学视频你可以很快就弄懂如何操作。
需要用户修改参数的其中一部分,右边的界面还是简单易懂的
Disco Diffusion 之所以有如此强大图像生成功能,倚仗的是背后强大的机器学习模型。
这个模型并不是简单地将一堆图片生硬拼接,而是在基于关键词的基础上,AI 模型对图像进行一次次迭代渲染,直至机器判定渲染结果与给定的关键词匹配度最高,渲染结果才会最终确定。
图片来源: 《How does CLIP Text-to-image generation work?》
这也是为什么我们用 Disco Diffusion 渲染图像时,画面最开始都是模糊的噪点,而渲染时间越长,图片精度就越高。
Disco Diffusion 的版权问题 Disco Diffusion 的图片生成功能如此强大,那生成图片的功能可以直接免费商用吗?
首先,Disco Diffusion 程序基于 MIT 开源协议,即这个程序供所有互联网用户免费使用,还可以复制、修改甚至出售。用 Disco Diffusion 渲染生成的图像,版权归图片创作者本人所有。
Disco Diffusion 首页的「License」中表明程序基于遵循 MIT 开源协议
那生成的图片可以直接拿来商用吗?这个问题需要谨慎对待。
Disco Diffusion 如同一位具有极强模仿并融合画风能力的画手,人工需要很长时间很多精力才能完成的画作,它通过模型学习加机器渲染,就能用比人工少很多的时间实现。
使用 Disco Diffusion 渲染的节气图,作者: 弈湘君
但 Disco Diffusion 本质上只是通过算法不断去接近给出的关键词,或者是在几个关键词中取得一个平衡点,以达到文本规定下最大程度的“相似”。
这些行为都是“模仿”——无论好坏,只要相似度够高就行了,远达不到人脑可以有意识进行取舍的程度。
使用莫比斯风格渲染出的图,风格与原作者非常接近。(图片来源: @Simon_阿文 )
如果你在给 Disco Diffusion 的关键词中,涉及到风格特别鲜明的艺术家或者商业作品,那么渲染生成的图像会呈现出非常相似的风格,这样自然就会涉及到侵权的问题了。
阿文对 Disco Diffusion 图片是否可以商用的看法,图片来源 @Simon_阿文
Disco Diffusion 能代替人工绘画吗? Disco Diffusion 可以轻易渲染出犹如专业艺术家创作的图画,是否意味着能够取代人工创作呢?我们看看专业艺术家是怎么看待这个问题的。
Stijn Windig 是一位来自荷兰的艺术家,擅长概念设计,作品细节精致,场景恢弘。
Stijn Windig 的部分作品(图片来源: Artstation )
Disco Diffusion 开始流行后,Stijn Windig 也开始尝试将 Disco Diffusion 运用到自己的创作过程中。
Stijn Windig 先用 Disco Diffusion 渲染生成各种图像,然后将图像导入 PS 放大,以此为基础在上面进行进一步的绘制。下面是他以这种方式创作的作品:
Stijn Windig 在进行一系列的尝试之后,将作品分享到 Artstation 上并写到:
……完善每幅渲染图像大约需要 1.5 小时。从Disco Diffusion中获取图像花费了更长的时间,尝试了不同的文本提示,直到我得到了一些看起来还比较像样的东西。
Stijn Windig 还将自己的创作经验写成文章发布到自己的 Artstation 博客中,在文章中,Stijn Windig 说到:
……首先,这东西(Disco Diffusion)的存在是有点疯狂的……它似乎能够轻易地生成史诗般恢弘的概念艺术。
……当你下载图片后将其放大,并开始在上面作画,就会有一种超级失望的感觉,因为事实证明,尽管从远处看它是一个恢弘场景的图像,但实际上那里什么也没有。
……一旦你开始想细化图像中某个不明确的部分,渲染图像就失去了其原有的氛围感了……在试图 “完善细化 “图像的过程中,我发现每一笔都不对劲,因为我可以看到图像变得更加明确,但却失去了原有的魅力。
……当我第一次发现它时,我试着把它用在一个客户的项目上,这个项目的特点是环境中有很多建筑元素,我想,”Disco Diffusion能够帮助我快速完成这幅画”,但是结果并非如此。我发现渲染图像上的每一处都需要重新绘制,甚至每一个像素都得重新刻画。因为尽管它可能看起来像一个有城市的山地景观,但实际上没有正确的房屋、山垛、植被和其他东西,只有模糊的概括暗示。我在一幅本应一两天内就完成的图像上耗费了一个星期。如果是直接创作三维甚至是二维的图像,我就会更快……
所以这就是 Disco Diffusion 的弱点:如果你想要一些有具体细节的事物,Disco Diffusion 是没有能力来生成一个细节精细的作品的(至少目前是没有)。它不擅长刻画具体细节。
除此之外,它不擅长人物、动物、汽车、透视,或任何需要真正具体特征的东西……
从文章中,我们可以看出,身为专业艺术家的 Stijn Windig 在经过多次实践后,认为 Disco Diffusion 并没有取代人工创作的能力,原因有以下几点:
从 Disco Diffusion 中获取想要图像并不容易,需要花费大量时间去调试关键词。 Disco Diffusion 没有刻画具体细节的能力,渲染出的图像乍看惊艳,如果仔细观察就会发现大部分都是模糊的概括暗示,不能达到商业水平的要求。 如果想在渲染图像的基础上刻画细节,就相当于要把整个图重新画一遍,这样一个流程下来花耗费的时间精力,比直接手绘还要多。
不过 Stijn Windig 还是对 Disco Diffusion 的未来发展持乐观态度,虽然直接利用 Disco Diffusion 渲染的图像进行商业创作的尝试失败了,但将它作为一种灵感参考生成器还是非常好的。
……我发现它更适合作为一个创意生成器使用。给它一个提示,比如”晴天的幻想城市,王座游戏,巨大的城堡”,它将返回一些至少能激发想象力的东西,并可以用来在上面绘画,作为草图。
Disco Diffusion 相关资源 根据文本提示渲染出高质量图像的技术近年来发展迅速,除了我们今天谈到的 Disco Diffusion,类似的程序还有 Nightcafe Creator 和 Dream by wobom。
1. 人工智能艺术生成器 NightCafe Creator
「网站」 https://creator.nightcafe.studio/
NightCafe Creator 是一款人工智能艺术生成器应用程序,可以根据你给出文本提示生成多种风格的艺术作品。创作完成后版权归创作者所有,并可以随心所欲地使用它们。
NightCafe Creator 还支持将照片转换成各种风格的图片,使用这个功能要注意照片的版权问题。
2. 人工智能艺术生成器 Dream by Wobom
「网址」 https://www.wombo.art/
Dream 是一款 ISO 应用程序,输入一个文本提示,选择一种艺术风格,就能在几秒钟内生成一副精美的图画。
3. 欣赏更多用 Disco Diffusion 渲染出高质量的作品:
「国内」 点击此处直达
「国外」 点击此处直达
「参考资料」
https://ecency.com/hive-163521/@penderis/get-started-quickly-with-disco https://www.youtube.com/watch?v=Dx2G940Pao8 https://www.youtube.com/watch?v=-b7xKWeADHQ https://www.artstation.com/blogs/stijn/B276/ai-sketches-with-vqgan-and-clip-for-concept-art
想无损放大图片?试试这个在线神器「AI Image Upscaler」 曾经遇到一个情境:对方要求的图片尺寸比我手上有的图片还要大张,而且还大了两三倍,但图片是采用位图格式,若非向量图直接放大就会出现失真、变形或模糊等问题,那要怎么解决呢?
阅读文章 >