a16z:巧用“幻觉”的应用架构思考
就在最近,a16z发布的文章里提出了“概率性产品”这一概念,那么,什么是“概率性产品”?在生成式AI的发展背景下,产品开发者、设计师们又该如何看待“概率性产品”的出现?一起来看看作者的解读。
生成式 AI 作为一种概率计算机,能够产生多样且不确定性的输出。这些多样的输出开启了一个新的产品类别:概率性产品。a16z 最近发布文章提出“概率性产品”,并根据用户对不确定性的接受度将产品分为三类。笔者希望借这篇文章带来 Gen-AI 技术对产品设计和用例的思考,生成式 AI 的不确定性正在成为和用户交互的变量。
生成式内容不确定性下的三类产品:
受益于不确定性的产品/可容忍概率性输出的产品/需要准确输出的产品。
1)当我们还在诟病大模型会产生幻觉的时候,未曾想象概率性的不确定内容恰恰会成为其区别于冰冷计算机的变量所在。生成式内容的概率性像是赋予了 AI 以意识,更适用于与人更近的交互层和更需要创造力的领域(游戏、艺术创造、创新研究等)。
2)在 AI 的世界里,硬币有了多面。在产品设计的不同架构层或流程服务里,大模型的应用会更组合模块化,用模糊理解模糊,在非关键点上提供更多新鲜感,提取的信息在精确层上进行数理计算,相信会很快看到这样的产品。
3)当人的创造力枯竭,大模型成为早期的脑洞来源。然而像科学家异想天开的创造同样需要依赖长期探索的积累,通过训练领域模型让其产生更高质量的不确定性内容,是创业者值得思考的事情。
4)对于一个产品架构而言,随机与确定解决不同的问题,应当互补融合。平衡也是一门艺术。
生成式人工智能的一个显著特点是它是“概率计算机”的首批产物,能够产生多样且非确定性的输出。有些人期望这些系统表现得像传统系统一样,对其产生的“幻觉”提出了抱怨,然而,这些抱怨忽略了关键点。输出的多样性(包括幻觉)恰恰是这里的特别之处。事实上,它们开启了一个全新的产品设计类别:概率性产品。
所谓概率性产品,指的是具有非确定性和经常出现新特性的产品。社交网络就是概率性产品的一个例子。这些网络上出现的新行为通常是无法预测的,只能被观察到。a16z 将产品类别和产品用例分为三类来思考:
- 受益于不确定性的产品;
- 可容忍概率性输出,但不一定从不确定内容收益的产品;
- 需要准确性输出的产品。
第一类是那些受益于不确定性的产品。比如像 Midjourney 和 Stable Diffusion 这样的热门图像模型,它们之所以神奇,是因为它们会生成各种各样的输出。
这整个生成式媒体类别之所以能够产生惊人的结果,正是因为平台是非确定性的。
AI 伴侣类别也属于这一组,因为产品的整体价值在于其与人类非常相似的不可预测的互动;失去非确定性的输出将削弱产品体验。该领域中的另一个例子可能包括辅助购物,因为 AI 提供的意外和不寻常的服装推荐正是能够塑造个人风格和品味的关键。
第二类产品可以容忍概率性输出,但不一定从平台的非确定内容中受益。例如,考虑那些生成现有内容的产品,只要生成内容的要点准确无误,生成内容的方式变化通常是可以接受的。
举个例子,预测数值(例如股票组合表现)需要更高的准确性,而生成书面内容可以具有更大的变化范围而不会损失价值。甚至代码生成也能容忍一定的变化,只要代码按预期工作即可。
最后,还有大量需要确定性输出的用例。这些例子包括从财务预测到税务计算再到驾驶路线等,基本上涵盖了所有需要明确答案的领域。
我们还可以将个别产品分为根据对概率性输出的容忍程度进行划分的产品架构。
例如,想象一个旨在帮助您申报税务的 AI 助手。这样的助手可以分为三个子系统,各个子系统对底层平台有不同的期望。
- 在人机交互界面,自带不确定性基因的 LLM 能够完成与用户更弹性的聊天并收集用户税收相关信息。
- 其次,将用户信息作为背景信息能够作为税务引擎输入系统,而对用户背景信息的整理具有一定的包容性,可以接受不确定信息的输入。
- 最后,实际的税务计算可以且应该在一个传统引擎上完成,该引擎不受 LLM 的限制,从而确保输出的准确性。
一句话,新的计算架构需要新的产品架构,LLM 和生成式 AI Pipeline 平台的不确定性创造了独特的机遇和要求,产品和用例在设计输出多样性时要仔细考虑。尤其对于产品研究者和设计师们,在利用并设计这些新功能的交互体验时,需要认真考虑这一点。
参考材料:https://t.co/MHEajKedFW