ChatGPT与无尽的媒体:碎片化文化时代即将来临
如今生成式人工智能越来越成熟,通过人工智能算法,有可能生出令人惊叹的图像和文字,像前阵子的AI绘画和最近的ChatGPT。这些这对内容制作来说意味着什么呢?它又会如何改变我们对它的消费方式?
一、可产生行动的见解 如果你只有几分钟的空闲时间,以下是作为投资者、运营者和创始人应该了解的要点。
作为媒体创作者,人工智能的能力正变得越来越强。ChatGPT 是人工智能匪夷所思的能力的最新体现。现在模型可以写文章,写诗,生成图像与视频。 我们也许正在步入一个 “无尽媒体”的时代。作为媒体创作者人工智能不仅胜任,而且还即时、经济。随着时间的推移,它在各种媒体上的表现也许可以达到或超越人类的能力,从而形成一个可以按需、无休止地创作电影、漫画或小说的世界。 无尽的媒体可以强化现有知识产权的价值。系列产品(Franchises)在我们的文化当中(尤其是在电影和电视中)占据着主导地位。但是,那些大 IP 往往需要花大价钱才能把最新作品做出来。人工智能可以节约成本和时间,让价值发生跃迁。但是,结果可能有两面性,既有可能对知识产权持有人有利,也有可能会威胁到他们,因为大家都更容易创作出高质量的媒体了。 艺术家、作家以及其他创作者需要适应。一些创作者的效率会出现极大提升;跟不上形势的会被淘汰。随着人工智能不断改进,对人类艺术性工作的需求可能会消失或大大减少。 共同的文化能指(cultural references)可能会消失。尽管社交媒体出现了注意力的巴尔干化,但仍然存在共同的文化接触点。一旦媒体可以按需生成,并有无限的定制选项,大家可能会少了很多共同的“谈资”。 在微不足道的苦恼当中,像完成一本好书那么痛苦的没几个。这是一桩奇怪的伤心事,说大就大,说小也小。你即将失去的是由角色、斗争与意义构成的整个世界,但这个世界又完全是虚构的,与你的现实生活没有什么关系。
结局既可以成就故事,也可以毁掉故事,任何作家或电影制作人都知道这是事实。为了“遣词造句的精妙”,海明威的《永别了,武器》写了 47 个版本,对于《闪灵》的结尾,库布里克十分讲究,直到最后一刻才下令销毁所有没有用过的镜头,这样就没人可以干涉他的构思了。
请允许我用我最好的广告腔发问:如果有另一种方式呢?如果你知道并喜爱的故事根本不需要结尾呢?如果你喜欢的书或电影可以永远看下去呢?
就像大多数信息广告一样,其所暗示的产品听起来似乎好到不可能是真的,就像博尔赫斯(Borges)给比利·梅斯(Billy Mays)写的文案一样。就人类历史的总和而言,这一直是事实。但这种情况也许不会持续太久了。
生成式人工智能迅速成熟,与其说是像一只烦人的大黄蜂撞击玻璃窗一样“颠覆”了媒体创作,不如说是将其拆解了。通过人工智能算法,有可能生成出生令人惊叹的图像以及过得去的文字,而且是即时的,廉价地。就像早熟的孩子一样,现有的模型的改进似乎不可避免,它会不断学到新技能,直到创作一部新的海明威小说或希区柯克电影的难度,并不比用 Midjourney 生成图像或用 OpenAI 的最新创作物 ChatGPT 生成短篇故事棘手多少。
这对内容制作来说意味着什么?它又会如何改变我们对它的消费方式?谁会赢?谁会输?在一个无尽媒体的时代,叙事对我们来说意味着什么?
二、走向无尽 首先,稍微再定义一下。当我们说“无尽媒体”时,我们指的是什么?
从根本上来说,我们指的是媒体制作与消费方式的转变。有了人工智能之后,媒体不再是一集集地创作出来,而是按需生成。如果你想让J.K.罗琳或乔治·马丁再写本书出来,你得等作家去写。根据作家对写作的兴趣程度,这可能需要一段时间。也许是几年。也许几十年。
电视节目、专辑、游戏以及其他各种形式的媒体也是如此。创作过程取决于人力资本,而这需要时间。
相比之下,人工智能就没有人的局限性。它可以用更快的速度处理和生成信息。虽然它还不能制作一部名声大噪的 HBO 电视剧,但我们已经看到它可以写博客或者变出图像,而且速度比人类快多了。一幅 DALLE-2 图像如果让人来画,可能需要数周或数月才能完成,但AI模型只需几秒钟即可生成。
一旦媒体可以即时生成,我们对它的使用方式也将改变,因为我们的欲望将不再受到内容可用性的限制。如果你想再看一本《指环王》、村上春树的短篇小说,或者再玩一局《荒野大镖客》风格的游戏,你不需要等创作者去做(或复活)。你只需跑这个或那个平台,让它们生成新作即可。
你还会以不可预见的方式去定制你的媒体,指定背景(输入:新朋克 中土世界)、情节结构(输入:比尔博、萨鲁曼与一个精灵的三角恋)、风格(输入:黑暗喜剧)以及任何数量的其他变量。创作原创故事几乎易如反掌,而且,如果版权法松动的话,创作同人小说风格的混搭也许一样简单。
这就是我相信正在逼近的无尽媒体世界。那么我们今天距离这个世界有多近了呢?
这股运动要想涌现,生成式人工智能必须在三个方面取得成功:
质量:人工智能必须能够创作出质量足够高的媒体,以此来维持关注。最终,它应该能够创作出与人类相当或质量更高的媒体。 速度:按需模型的生成速度需要多快?我想应该因媒体而已。在通勤时,生成一首新歌得等几分钟不大可能有吸引力,但是如果这是制作一部新电影的时间的话,也许还是可以的。 成本。媒体生成得更加经济。具体来说,它必须足够便宜,让消费者通过直接购买或关注来证明成本的合理。 大家的态度如何?有人也许会说人工智能已经达到这些标准了,有人也许会说还差得远,这要取决于你的基准。用像 Midjourney 这样的产品,你可以轻易在几秒钟内用几分钱的价格生成一幅令人愉悦的图像。比方说,当我让 Midjourney 创作一幅特纳式的外星海景图,时间是在日落时分,还要有护卫舰的战斗场面时,它梦见了这个:
Midjourney
相当不错的一幅画作!奇怪的是,我还对它感到自豪,仿佛我的提示体现了我的品味或智慧。了解我们对合成作品的依恋或疏远程度会很有趣。
OpenAI 新推出了一项功能叫 ChatGPT,用的是所谓的 “GPT-3.5”的新的高级模型,这让我们更清楚地看到作为作家的人工智能有多强。我让 ChatGPT 用科马克·麦卡锡(Cormac McCarthy)、村上春树、雪莉-杰克逊(Shirley Jackson)和奇努阿·阿切贝(Chinua Achebe)等作家的风格创作了几部短篇小说。ChatGPT 似乎还不了解什么是风格。它的创作主要是围绕着作者最喜欢的词汇、主题和设定进行的,而不是真正模仿作家的遣词造句。AI模仿纳博科夫写了一位美女,但却没有尝试他那俏皮的双关语;仿写麦卡锡时,AI写了罪恶之地,主角的无赖,但又不敢与他那连珠炮式、让人喘不过气的奔放文风试比肩。
尽管如此,结果还是好得吓人。令人信服,有趣,并且能让人联想到所模仿的作家。故事几秒钟就出来了,并且完全免费。写诗的实验表明, GPT-3.5 也能理解押韵和格律。
ChatGPT创作的小说
如果你的媒体食谱完全由精美绘画和不错的短篇小说构成的话,那其实你已经可以享受无尽媒体了。更加复杂的产品仍然遥不可及。人工智能距离能制作出一部可以取代《继承之战》的连续剧或写出安妮·卡森(Anne Carson)那种水平的散文诗似乎还很远。
本文的剩余部分是纯粹的思想实验还是实际讨论?这要取决于你如何回答这个问题:我们能到达那个彼岸吗?从人工智能生成的博客文章和漂亮图片,到复制司汤达、斯科塞斯和斯威夫特,是否存在一条技术上可行的路径?如果不存在,那么我们人类的天才理论可以保留——人工智能将处理那些讨厌的,可以衍生的东西,伟大艺术和伟大媒体就留给人类的头脑吧。如果存在,那么剩下的就只有时间问题。会早到还是晚到?是下个十年还是下个月?(或者,更加可怕,明天?)
甚至在年底之前,我们可能就能看到相当大的进展。如果传言可信的话, OpenAI 的 GPT-4 预计将在 2022 年 12 月至 2023 年 2 月间推出。尽管透露的细节很少,但坊间认为这会是一次重大飞跃。与生成式人工智能的快速发展对赌越来越让人感觉站不住脚。
三、价值转移 在一个无尽媒体的世界里,价值从何而来呢?我们又应该期待什么样的转变呢?
在思考无尽媒体时,习惯上我会预期有价值的 IP 持有者能从中受益。如果你拥有哈利波特系列版权的话,则能够以低廉的价格按需生成无限媒体的能力的好处巨大。你会把制作成本降低到接近于零;更好的是,你还可以更好地从客户身上获利,提高频度、可靠性, LTV (客户终身价值)也可能会相应提高。到时候粉丝也许就不是每两年花 20 美元买张电影票或买本书,也是每月支付 20 美元来访问一项服务,通过它获取哈利波特宇宙的新内容,或自己生成内容然后消费。
老看难道客户不会觉得无聊吗?有些人可能会。但同人小说和同人论坛的流行表明,除了传统的发行以外,消费者正在寻找排解自己对IP的这种痴迷的新手段。好莱坞最可靠的手段往往是翻拍或出续集。2017 年的一项研究发现,有史以来票房收入最高的 50 部电影当中有 41 部都是建立在现有 IP 之上;重拍或续集的绝对数量从 1981 年的 16% 上升到 2019 年的 80%。迪士尼尤其熟悉这些动态并善加利用。通过其 Disney+ 订阅服务,它已将 《星球大战》与《漫威》等票房大片拓展成流媒体形式的系列片。
IP 持有者的获利多寡可能要取决于给资产保护打开的口子有多大。随着靠粉丝变现的钱越来越多,IP持有者变得越来越喜欢打官司,取缔未经授权的游戏、商品和体验。虽然保护知IP持有人(尤其是在世的艺术家或作家)有它的好处,但过度监管可能会限制创造力的进一步发挥。
大型语言模型背后的公司对 IP 的使用立场各不相同,这说明了对原始材料的获取会如何影响到可以制作的内容。
一周前,当我在 OpenAI 里面输入 “哈利波特”这样的单词时,上面会弹出一条信息,称这条搜索违反了该公司的内容政策。今天当我再次尝试时,这种使用阻力又没有了,所以很愉快地生成了一系列热门 IP 合集:哈利-波特吹魔笛,米奇老鼠与皮卡丘击掌,新朋克风的天行者卢克用光剑烤棉花糖。
尽管 DALLE-2 允许输入这些提示,但它很难生成高质量的图像。尝试生成像 Hello Kitty 和 Pacman 这样的角色会创作出无法识别的结果。将结果与 Midjourney 的进行对比,你会发现明显的不同。后者用类似的提示生成的图像质量更好:
DALLE-2 与Midjourney的生成结果对比
(我不知道为什么,但 Midjourney 似乎很难理解让两个角色击掌的想法。不过,Mickachu 还是那么的可爱!)
造成这种差异的原因是什么?也许是模型在训练期间接触到的图像的相关程度不一样。为了避免出现版权问题,OpenAI 似乎已经确保它对 Hello Kitty 或天行者卢克的样子有所了解。 Midjourney 和 Stable Diffusion 在这方面似乎就没考虑那么多。
许多最有趣的无尽媒体得靠全新的 IP。与其输入类似“给我制作一部新的星球大战电影”这样的提示,我们可以这么提出要求,给我制作一部原创的太空奇幻电影。机器智能大量炮制出来的故事会充斥着各种意外,令我们惊喜和兴奋,形成一个全新的粉丝圈。尤其是如果对受到严格保护的 IP 的访问受限的话,这些生成作品当中的很多也许质量反而更好。
这些原创内容的所有权该归谁?建立模型的公司?帮助你创作它出来的平台?还是你,给出提示的人?这个问题也会引起争议。比方说,DALLE-2 允许用户出售生成的图像,但一些律师认为相关条款自相矛盾。
无论所有权归谁,会出现数量多到令现在的体量显得很离奇的内容应该可以预期。至少从某些方面看,这对用户来说可能是一次重大胜利,因为他们第一次能够在想消费的时候就能生成他们想要的东西。马上想找一本以 18 世纪日本为背景,奥尔罕·帕慕克(Orhan Pamuk)风格的神秘小说,然后坐在火炉旁欣赏?或者下一次坐飞机的时候,想看一部以不久的将来为背景,英国侦探题材的黑色喜剧?你的一切情绪与心血来潮,你所有的偏好,只要你一想到就能得到满足。
如果觉得要思考你想生成什么太累人的话,其他用户生成的越来越多的无尽内容的海洋也足够你遨游。新的平台会帮助我们对这些无尽杰作和罪恶快感进行排名,工具会把我们的兴趣与这个浩瀚的纲目关联到一起。帮助发现、策划和推荐的产品可以积累价值,因为充裕的内容会让这三者变得更加重要。
四、制造意义 我最近一直在思考一个问题:技术让貌似合理的类比变得毫无意义。这个行业的规模和速度已经超过了我们简化和转化的能力。当我们试图把一个宇宙塞进信箱时,有太多的微妙之处被丢失了。
考虑到这一点,说到职业艺术家时,我们应该谈谈生成式人工智能的极大不公平。这个行业最强大的模型是用人类产生的数十亿个数据点训练出来的。机器模型摄取和吸收了数以百万计的绘画、卡通、照片、散文和书籍。人类辛辛苦苦才开发出来的独一无二且奇特的技能,一下子就被整个吞噬,变成了任何人都可以获得的商品。现在,通过互联网,你既可以像梵高那样作画,也可以像迪斯尼那样制作动画。
这公平吗?从某种程度来说,这感觉像是一个没有结果的问题。情况已经发生,而且还会继续。公不公平跟这个有什么关系?海啸是没有良知的。当技术在这样的时刻拾起势头时,最好是确保对它的开发和指导尽可能地负责任——引导它的力量远离脆弱的地方。
当然,这个问题的答案是:不。不,这不公平。而这正是类比显示出局限性的时候。反过来说,人工智能的发展其实与人类相似。与其说人工智能是在模仿现有的艺术作品(复制粘贴像素或改编文字来适应新环境),不如说它是在学习。它在学习和改进,就像我们一样!
只是,我们没法消化 50 亿张图片。我们没法只看少数几件仿制品,就能神奇地模仿它们的风格。我们五秒钟画不出教皇坐在自行车上吃苹果的肖像。将人工智能的能力与人类的学习能力进行对比,会抹杀它的神奇,淡化它的风险。银河系深不可测的浩瀚,或海滩所含的沙粒的无尽——这些是更合理的隐喻。
艺术家能适应吗?这项技术会让一些人如虎添翼,用它来改进自己的工作并节省时间。一个乐观的思维框架是艺术作品将被“半人马化”。人与机器结合,将创造出其中的任何一方所不能及的,更伟大的东西。曾几何时,“半人马”是表现最好的国际象棋选手,曾击败过独立参赛的人类或算法。但随着人工智能的不断改进,人类干预变得越来越多余,或者适得其反。不过,从中期来看,“半人马”可能会蓬勃发展,创作出令人印象深刻的绘画、电影和书籍。
许多艺术家可能会逐渐转变成周边角色(具体多快要看人工智能带来的变革速度):作家转为编辑,画家转为艺术设计师。那些在 “建设世界”(划定范围,让人工智能发挥)方面有天赋的人暂时也会如鱼得水。不过,人工智能似乎并没有失去它的胃口。最终,它也可能有能力完成这些任务。
当然,关于人工智能对艺术家的影响,从很多方面来说,我都希望我的看法是错的。(而且我也提醒自己经常会出错。)虽然我对人工智能释放创造力的新形态感到兴奋,但我也还只是… …一名作者。一个由手指、拇指、肌肉和灰质组成的混合物,需要食物才能运转,需要钱来买食物。一个文字由机器制造的世界,在经济上令人不快,从利己主义来说是灾难性的。
一种可能性是,随着我们从(内容的)富足走向过剩,我们会变得更加重视人类的工作。就像在机器时代会出现手工品市场一样,尽管人工智能的效率和经济性都很高,但人们可能对人类创作的艺术、音乐、文学和电影依旧充满渴望。
生成式人工智能除了会给艺术家造成影响以外,其创造性产出的速度和数量对社会也许会产生更广泛的影响。在《去中心化的国家》一文中,我认为互联网与社交媒体已经进入“碎片化真相”的时代:
互联网降低了出版成本,消灭了看门人,令 “出版商”数量激增。当然,出版商的定义已经发生了根本性变化,从指向组织变成了个人。现在,每一个在推特上发帖的人都是主权出版商,为其他互联网公民的信息食谱提供食粮。
在这种扩张的重压下,真相已经变得碎片化。不久前,个人只能从几个新闻来源获取报道。虽然大家的观点可能会有一些差异,但总的来说,对特定主题的观点数量是有限的。但今天,每一个话题都是通过数千甚至数百万相互抵触的观点折射出来的。
在浩瀚无尽的互联网空间腹地,分辨这些观点需要时间以及不断的认知消耗。鉴于个人报道的发展揭示了传统出版商的盲点和偏见,消费者不能再单纯默认相信单一来源,而必须在成百上千个来源之中跳转。由于缺乏仲裁者,而现有的平台又偏向极端立场,所以用户会遇到大量形形色色千奇百怪的立场。其结果就是真相的碎片化,在这种情况下,每个人都是盲人摸象,只能看到总体的一小部分,但仍然相信持自己相同立场的权威。每一个在网上分享的新观点都可以被分叉,导致进一步的碎片化。
无尽媒体会产生类似的影响,创造出越来越碎片化的文化。尽管互联网已经促成了子群(subgroups)和小众社区的繁荣,但仍有部分文化现象是具有跨越性的。比方说,如果你出生在 1990 年代,生活在贫困线以上,而且认识字的话,那么你与《哈利波特》存在某些关联其实是不可避免的。你对它态度也许是喜欢,也许是讨厌,也许漠不关心,但你知道《哈利波特》。而且你可以在这一领域与他人发生关联。每一本畅销书、票房大片、白金唱片和热门电视节目也大抵类似。虽然这些文化因为太过根深蒂固,以至于我们也许很少会意识到这一点;其实我们有广泛的文化能指(shared references)。
这些能在无尽媒体中幸存下来吗?如果我们的消费被定制生成内容巴尔干化的话,什么样的叙事会成为我们文化的一部分?我们会失去什么样的共同语言?
谢默斯·希尼(Seamus Heaney)写道:“诗的开始是第一行,结尾是最后一行是从什么时候开始的?”
人工智能会负责创造我们一生当中的许多奇迹。如果我们的发展方向明确,从医疗保健到教育再到重工业,每个领域都可能会被部分重塑。似乎有出现巨大飞跃的可能性。
与其他行业一样,媒体也会被改造得面目全非,我们与艺术、信息以及意义的关系会改变。这首诗还没有要结尾的迹象;电影继续放吧;音乐也不要停,你仔细聆听就行了。
原文链接:https://36kr.com/p/2032440085048583
译者:boxi;来源于神译局,36氪旗下翻译团队。
本文由@神译局 授权发布于人人都是产品经理。未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。