-
AI绘画未来如何改进?来看斯坦福教授的预测!
UI交互 2023-04-07编者按:这篇文章是来自斯坦福的年轻教授 Maneesh Agrawala,他本人既是斯坦福计算机专业的教授,也是斯坦福大学布朗媒体创新研究所的所长。他在去年 HAI 2022 秋季会议上发布了演讲「AI回路:演进中的人类」,而这篇文章正是演讲内容修订后的版本。对于 AIGC 当下存在的深层问题,AI 的逻辑以及未...编者按: 这篇文章是来自斯坦福的年轻教授 Maneesh Agrawala ,他本人既是斯坦福计算机专业的教授,也是斯坦福大学布朗媒体创新研究所的所长。他在去年 HAI 2022 秋季会议上发布了演讲 「AI回路:演进中的人类」 ,而这篇文章正是演讲内容修订后的版本。对于 AIGC 当下存在的深层问题,AI 的逻辑以及未来可能的改进方式,给出了详尽的解读和预测。以下是正文:
最近我决定更新一下我的个人网站的图片资料:
作为一名计算机专业的教授,我觉得现在制作一张高质量照片,最简单的方法,就是使用 DALL-E2 来生成。所以我写了一个简单的 prompt:「Picture of a Professor named Maneesh Agrawala」,然后 DALL-E2 给我生成了……额……这张照片:
根据我文本提示,它生成了一张看起来有着明显印度裔特征的男性,给他穿上了看起来「专业」的服装,并且把场景设置在一个学术研究室当中。从整体上来看,物体、灯光、阴影和色彩都是连贯的,是单一且统一的照片。我对于 AI 生成的照片总体上是不会吹毛求疵的,不过手看起来比较奇怪,有一边眼镜腿没了,当然,从我更人需求的角度出发,我很希望它生成这个角色看起来年轻一点。
总体上来看,AI 能够生成如此之逼真的照片确实是令人惊艳的,这是人类历史上从未有过的数字超能力。
AI 能生成的不止是图片内容。先走的生成式 AI 对于用户而言,是一个巨大的黑箱。将自然语言作为输入内容,AI 能够生成素质惊人的文本内容(GPT4,ChatGPT),图片内容(DALL-E2、Stable Diffusion、Midjourney),视频内容(Make-a-Video),3D 模型(DreamFusion)甚至程序代码(Copilot , Codex )。
那么这次我们使用 DALL-E2 重新生成一张照片看看吧。这次, 我想看看如果斯坦福以《银翼杀手》的风格呈现出来的时候,会是什么样子。斯坦福最典型的建筑就它的主广场,中间是被棕榈树包围的纪念教堂,而谈及《银翼杀手》的时候,我能想到的是霓虹灯,拥挤的夜市,连绵的雨水和大排档。所以我撰写了 prompt:「stanford memorial church with neon signage in the style of bladerunner」。
在第一次迭代的时候,生成的图片并没有呈现主广场和棕榈树,所以我将「And main quad」添加到第二轮的 prompt 当中,在第三轮迭代中,我加入了「with palm tree」,生成的图像越来越像斯坦福的主广场,但是和《银翼杀手》的夜景没有啥关系。我开始周期性地修改 prompt,尝试找到更合适的 prompt,以产出我想要的图片内容。在第 21 次迭代之后,我在 DALL-E2 耗费了好几个小时,我决定在此止步。
实际上,最终生成的图片依然不符合我的预期。更糟糕的是,我不清楚如何更改 prompt 以确保 AI 生成的内容能够进一步靠近我的想法。
这个过程令人沮丧。(这大概才是绝大多数 AIGC 内容产出的真实情况吧?)
事实上,寻求有效的 prompt 是如此之艰难,以至于现在诞生了专门的论坛(比如 PromptHero 、 Arthub.ai 、 Reddit/StableDiffusion )来搜集和分享各种 prompt,甚至还诞生了专门买卖 prompt 的市场( promptbase ),还诞生了大量的关于 prompt 的研究性的论文。
良好的 UI 提供了可预测的概念模型 要理解为什么写出有效的 prompt 很困难,我认为唐纳德诺曼的《设计心理学》当中提及的一件轶事非常具有启发意义。这个故事说的是他自己拥有一个冰箱,而冰箱内设置温度的功能极度难用,因为它的温控大概是这样的:
这个冰箱有着典型的冷冻室和冷藏室,它的两套设温控设施让人觉得两者有着独立的控制系统,实际上这个冰箱仅有一个冷却装置,而控制两者温度主要依靠一个阀门,来分配两者所用的冷气。这也意味着,原本的控制功能已经很难理解很难用了,而实际上的体系比我们看到的更加复杂,使用一个你看不到的阀门来耦合控制。
使用不正确的概念模型,用户不仅无法预测输入的数值,也无法掌控输出的效果。实际在操作的时候,用户需要操控 (i) 设置控件进行调整,然后(ii)等待 24 小时等到温度稳定下来,并且 (iii) 检查最终的温度是否符合他们的预期,如果结果稳定且符合预期还好说,如果不符合,需要返回步骤 (i) 。这种操作带来的沮丧感,其实和当前 AI 给人的感觉类似。
对我来说,这件事情给我的主要启示有 2 点:
设计良好的界面能够给用户创建一个正确的概念模型,可以大体预测输入内容是如何控制输出内容的。 当概念模型不课预测的时候,用户就会被迫使用试错的方法。 UI 设计师 的工作之一,就是创建一个用户可预测的概念模型。
AI 黑匣子不提供预测概念模型 生成式 AI 的黑盒状态,其实是最糟糕的界面,因为它们还无法给用户提供可预测的概念模型,目前绝大多数人都不清楚 AI 是如何将自然语言 prompt 转化为最终的输出结果,即使是 AI 的设计者通常也无法确知,怎样去构建一个让用户可以理解和预测的概念模型,来帮助用户更好输出内容。
现在回到 DALL-E2 ,我试着使用「Picture of a cool, young Computer Science Professor named Maneesh Agrawala」来让它为我创建一个更好的照片:
很多时候我确实不知道 prompt 是如何影响图片的,比如我使用「Cool」这个词,它映射到图片当中的特征是运动外套和 T恤的组合,还是年轻的面容?而「Computer Science」 是否意味着 DALL-E3 需要输出写实的图片而非插画?没有逻辑顺畅的预测概念模型,我也不知道答案是什么。我唯一能做的和大家一样,就是不停输入和修改 prompt 来等待结果。
人类也是糟糕的 UI,但是比 AI 强一点 AI 的目标之一,是像人一样创造。你可能会说,自然语言是人和人进行沟通的语言,显然人是更好的 UI,这一点我不完全同意。人类本身也是产出垃圾内容的 UI。人类的可怕之处和 AI 黑箱的缺陷是完全相同的。当我们面对另外一个人的时候,我们其实面对着同样的问题,我们通常很难准确预测对方回复你的语言是什么。
就目前而言,人类比起 AI 黑箱更优,这主要有两方面的原因。
首先,身为人类的我们,在预测人类合作方的「行为模式」的时候,是根据自身响应需求的方式来预测的,也就是「以己度人」。我们对于行为模式和概念模型,有很强的先验性,因为我们会假设对方和我们一样。
其次, 根据 Herb Clark 等语言学家所指出的 ,我们可以和人类合作方通过交谈,来构建共识,共享相同的语义。我们可以在语言沟通中,逐步消除歧义和误解,并且完善和调整策略。
共同性、语义共享和修复策略是人类协作的基础。
尽管人类之间拥有这样的优势,和另一个人想要形成高质量的协作,依然需要通过多次迭代才能完成。最有效的合作通常需要数周、数月乃至于数年的对话,才能建立起共同点(想想婚姻关系吧)。
正如我所说的,人类是可怕的 UI,但是依然是比 AI 黑箱更好的 UI。
向拥有对话界面的 AIGC 前进 那么我们要如何才能创建出更好的 AI 工具呢?有一种方法是支持对话式的交互。ChatGPT 等文本生成式工具,已经开始这么做了。这些工具开始支持多轮对话,可以是作为未来人与 AI 进行有效沟通的基础。上下文环境让 AI 和用户都可以参考之前对话中内容的概念,以此为基础达成共识。不过不清楚目前的 AI 系统包含有多少常识,AI 对语义概念的理解似乎还有所不足。但是人类用户而言,ChatGPT 到底懂得多少其实是不确知的,因此对话通常需要进行多轮来回,双方才能构建起基本的共识。此外,AI 和用户对话本身并不会直接更新 AI 本身的模型,为这些模型增加常识、基础概念、推理能力,依然是目前 AI 研究的主要推动力。
Prompt-to-Prompt image editing [Hertz 2022]
自然语言通常是模棱两可的。人类通过对话,来逐步消减歧义,确保大家在讨论的是同一件事情。有研究人员已开始将这种修复机制应用到文本生成图片的 AI 系统当中,比如 Prompt-to-Prompt image editing [Hertz 2022] , 用户可以先用 prompt 生成图片,然后优化 prompt 生成新的图片,这个过程中只需要进行微小的调整即可,上图中,通过添加额外的关键词,生成了更加准确的内容。这本身就是一种改进的方式。
减少自然语言歧义的另外一种方法,是让用户添加约束条件。图到图转化 ( Image-to-image translation [Isola 2016] )就是一种典型的约束方式,通过机器学习生成对抗网络(GAN),在这种环境下,当你输入一种类型的图像(比如标签图、轮廓图),就能生成另外一类图像(比如照片或者地图),输入的图像会约束输入图像的特征。这样的约束方式比起用户模糊的语言描述会显得更强,提供了更加精确的空间特征。如今我们手底下很多小组在文本转图像的 AI 交互中,使用了这种方式来强化上下文环境。
对话式交互能超越自然语言单一命令。在文本转图像的 AI 模型研究中,很多 AI 研究者已经开始研究「建立共识」的方法。 Textual Inversion [Gal 2022] 和 DreamBooth [Ruiz 2022] 都会让用户提供示例图,AI 模型则会将文本 prompt 和这些图像示例关联起来,这样用户和 AI 会建立某种共通的信息基础。
而 「神经符号法」 则提供了另外一种创建 AI 模型对话界面的图形。一个 AI 模型不是直接生成内容,而是生成某种程序,只有运行了这种程序才能生成内容,这种程序在某种程度上就是 「共识」本身,它是人类和 AI 可以以相同方式理解的东西,而这就是将编程语言语义形式化的基础。这意味着,即使没有明确的语义,开发者依然可以通过检测代码内容来确定 AI 是否在做「正确的事情」。这个时候,开发者可以在编程语言层面上给 AI 提供修复建议,而不是简单的使用自然命令。
结语 AIGC 的模型是令人惊叹的,但是它依然是糟糕的界面,只要输入和输出之间的映射不明确,它就一直是个问题。我们可以启用对话式交互来改进 AI,创建更多的「共识」。
-
Midlibrary!收录 2000+ 风格关键词的Midjourney提示资源
UI交互 2023-04-07大家好,这里是和你们一起探索 AI 绘画的花生~今天为大家推荐一个实用超强的 Midjourney 提示词资源网站 Midlibrary,它由国外艺术家 Andrei Kovalev 主导建立,目前收录了 2078 种适用于 Midjourney 的风格流派、艺术运动、技法及艺术家关键词,能为我们生成不同风格样式...大家好,这里是和你们一起探索 AI 绘画的花生~
今天为大家推荐一个实用超强的 Midjourney 提示词资源网站 Midlibrary ,它由国外艺术家 Andrei Kovalev 主导建立,目前收录了 2078 种适用于 Midjourney 的风格流派、艺术运动、技法及艺术家关键词,能为我们生成不同风格样式的 AI 图像提供便捷的参考,下面为大家简单介绍一下它的主要功能~
AIGC神器 Midjourney V5 强势更新!逼真到令人发指! 大家好,这里是和你们一起探索 AI 绘画的花生~ 备受期待的 Midjourney V5 在上周四终于上线了,而且一发布就引起了不小的轰动,因此这次 V5 模型的图像生成效果“太惊人了”,无限逼近真实照片,让人难辨真假。
阅读文章 >
Midlibrary 简介 Midlibrary 网站直达: https://www.midlibrary.io/ (使用魔法速度更快)
Midlibrary 官网中主要包含风格(Styles)、特征(Features)、类别 (Categories)三大版块。
① 风格(Styles)
风格版块里以标签的形式陈列了 2078 种艺术风格、流派、技法以及艺术家关键词,分类非常清晰,方便大家直接点击,查看对应的图像生成效果。
比如点击“摄影师”进行内容筛选后,我们就能获得 200 多位世界知名摄影师的作品风格在 Midjourney 中的生成效果,只要我们在输入关键词的时候加上该摄影师的名字,就能生成类似的风格。点击摄影师的名字进入详情页后,可以对比查看同一摄影师作品风格在 v3、v4、v5 和 Niji 中的效果差异。
② 特征(Features)
这个版块会按更宽泛的概念对关键词进行分类,比如按画风特征进行区分,有黑白的、古典的、可爱的、史诗般的风格等等;或是以主体进行区分,有人物、动物、风景,城市景观等;还有以色彩和人物肤色进行区别的。
如果点击“柔和的色彩(Pastel Colors)”这一分类,就会得到 30 多个具备“柔和色彩”特征的关键词,涉及摄影师、插画师、动漫、技法等各个方面,关键词对应的效果也有直观的展示,我们可以直接复制用在自己的提示词中。
③ 类别(Categories)
这个版块有 13 个大类,包括艺术流派和运动、艺术技巧、日式动漫、建筑师、平面设计师、时装设计师、电影、插画师、画家、摄影师、版画家、雕塑+装饰艺术家、街头艺术家等。
个人感觉这个版块的实用性最强,也最适合我们设计师进行深入学习。比如进入“艺术流派和运动”分类,可以看到历史上各种风靡一时甚至延续至今的风格,比如抽象艺术、未来主义、新艺术风格、赛博朋克、包豪斯、达达主义、数字拼贴、野兽派、故障艺术、印象派、极简主义、波普艺术等等。尝试将这些关键词用在 Midjourney 中进行图像生成,说不定能给设计带来不一样的灵感。
然后是艺术技法,这个分类里包含 200 多种常见的艺术创作手法和媒介,包括但不限于素描、水彩、油画、蚀刻、雕刻、浮雕、刺绣、毛毡、镜头、胶片、中国画、数字艺术等各个类型,所展现的效果极具艺术性,感兴趣的小伙伴可以直接复制关键词到 Midjourney 中进行测试。
除了以上三大版块,Midlibrary 中还一个“MIDGUIDE(绘画指南)”版块,里面有对 V4、V5、Niji 模型的风格解析,以及各种流行主题的关键词合集推荐,从中可以学到一些更深入的 Midjourney 绘画知识和进阶提示词写作技巧。
以上就是本期为大家推荐的高质量 Midjourney 风格关键词参考库 Midlibrary, 如果你在 AI 绘画的过程中缺乏灵感,不妨多去里面看看,肯定有很多你之前没见过、或者见过但是不知道名字的风格关键词。而对设计师来说,浏览 Midlibrary 也是我们拓宽知识面、提升审美的好方法。
推荐阅读:
AI绘画哪家强?Midjourney、文心一格等 6 大工具出图效果大比拼 大家好,这里是和你们一起探索 AI 绘画的花生~ 3 月份以来 AI 绘画领域又有了不小的变化,Midjourney 更新了 V5 版本、Stable Diffusion 推出了 Clipdrop Reimagine;微软 Bing 也推出了 Image Create (图像生成)功能
阅读文章 >
AI绘画必学!5种 Midjourney 进阶提示用法 大家好,这里是和你们一起探索 AI 绘画的花生 ~ 上一期为大家介绍了 9 种在 Midjourney 绘画中常用的后缀参数,可以帮助我们生成更符合自己需要的图像。
阅读文章 >
-
如何高效做好设计评审?高手总结了10条建议!
UI交互 2023-04-07设计评审是每位设计师避不开的工作项目。你可能也有过这样的问题:做设计评审时如何清晰地阐述设计理念和亮点?设计评审的时候总被提问,我汇报的思路和节奏被带偏该怎么办?设计评审 是每位 设计师 避不开的工作项目。你可能也有过这样的问题:
做设计评审时如何清晰地阐述设计理念和亮点? 设计评审的时候总被提问,我汇报的思路和节奏被带偏该怎么办? 每次设计评审都超过一个小时,该怎么提效? 本文就来为你解答这些问题,聊聊设计评审到底该怎样做。
更多评审技巧:
如何顺利通过设计评审会?我总结了3个注意事项! 编者按:如何通过设计评审?
阅读文章 >
一、设计评审的目标 我们先建立一个关于设计评审的关键认知:
做 UI/UX 的设计评审,我们是为了展示自己的设计思路,更是为了让项目的相关方了解设计方案,评估方案的可行性,判断并解决潜在的问题,达成一致共识,从而推进项目稳步进展。
所以,不要把设计评审当成是设计师展示个人能力的舞台,而是要将其当作是使项目的相关方对方案达成共识的重要环节。设计师做设计评审的目标应该是:
“通过尽可能清楚地阐述设计方案,为大家提供解决问题的思路,最终促成一致的结论,推动项目进展。”
下图为对设计评审的“×误解”和“√正解”:
而作为设计评审的主角,你的工作任务是:
1. 讲解设计方案
清晰地描述设计方案,可视化地呈现设计细节。
2. 评估他人建议
当他人对于设计稿提出不同意见和想法时,能够综合评估,适当妥协之后仍能保证最基础的用户体验质量。
3. 把控评审节奏
控制评审的全局节奏,当大家因讨论某个问题而迟迟无法推进或得出结论时,你要及时控场。
4. 做好会议纪要
做好会议关键结论和问题的记录,并及时同步给相关人员,让评审结论有据可查,及时跟进。
二、设计评审的技巧 从评审的前、中、后三个环节,我总结了大厂工作中的 10 条注意事项和实用技巧:
1. 评审前:管理预期
在评审前要预先发送会议邀请,管理好参会人的预期。建议你做到:
① 会邀的标题要清晰。
会议邀请的标题写清会议性质、项目名称、评审内容,让参会人一目了然。你可以这么写标题:“「设计评审」XXX 功能名称”
② 附带设计稿的链接。
你可以在会议邀请中加上设计稿的链接,让参会人提前浏览。如果设计稿尚未完成,可以先写注明:“设计稿稍后附上”,做好再加上。
2. 评审中:把控节奏
在评审过程中始终要控制好节奏。建议你:
③ 先简述需求背景和设计目标。
评审开始时先简要说明设计需求背景和目标,尽量用几句话或一两张图来概括和介绍:
评审的主要目标和内容; 设计需求和设计主要解决的问题; 使用的设计手段和方法等。 ④ 约定简单的评审规则。
如果评审内容很多,在开始时就可以先和大家约定好简单的评审规则。你可以将评审内容分成几个部分,讲每一部分的过程中不接受提问,讲完一部分后给大家统一提问的时间,避免在过程中因为个别细节问题纠缠不清而影响整体评审。
⑤ 按照逻辑做设计讲解。
在讲解设计方案时,你要找到一个讲解逻辑,比如你可以按照用户的操作步骤 / 链路来做讲解,这样的设计讲解更接近用户的操作习惯,也更容易被大家理解和接受。
⑥ 成果优先,过程后补。
设计评审不是设计研究报告,参会人通常并不十分关心你的设计手法或设计过程,而更关注最终的设计产出。因此:
如果大家对设计方案没有异议,设计的研究过程和证据不说也可; 如果大家对方案有异议,那你再展开讲讲设计研究过程,来证明设计决策的正确性。 ⑦ 突出真正的设计亮点。
你可以突出讲解方案的设计亮点。不过这些“亮点”不仅是单纯的设计创意,更应该是能够体现业务价值、能够更好地实现产品和业务目标的设计方案。
真正有价值的设计创新,并不需要你做过多的解释说明就能够得到大家的认可。只有成本和资源有限时,才需要进行平衡和妥协。因此你要站在业务、产品、用户的立场上,判断业务真正需要的设计“亮点”是什么,并在设计稿和设计评审中有所体现。
⑧ 形式服务于内容/功能。
你不需要做花哨的设计方案汇报书或 ppt,因为汇报的样式和形式再丰富也不会为设计方案的质量加分。你可以将精力用于方案的清晰呈现,比如:如果某个 icon 的动画效果很重要,那就可以做个动效 demo 进行演示,简单的 demo 会减少很多沟通时间。
3. 评审后:推进落实
在评审后立即整理好会议纪要,并及时同步给相关方。建议你:
⑨ 执行项指定到负责人。
评审过后产生的不确定项或待完成事项,需要指定到具体负责人,并注意督促落实。
⑩ 评审纪要需做好归档。
评审纪要要同步给所有相关方和参会者,并做好归档,让结论有据可查。
相信这 10 条建议会帮你顺利做好设计评审。
欢迎关注作者微信公众号:「长弓小子」
-
AIGC案例实战!如何用AI为可视化大屏设计提效?
UI交互 2023-04-06随着 AI 的大火,大家都在考虑如何通过 AI 提升工作效率,接下来简述一下我在可视化领域使用 AI - Midjourney 进行设计提效的尝试。AIGC工具大比拼:AI绘画哪家强?Midjourney、文心一格等 6 大工具出图效果大比拼大家好,这里是和你们一起探索 AI 绘画的花生~ 3 月份以来 AI ...随着 AI 的大火,大家都在考虑如何通过 AI 提升工作效率,接下来简述一下我在可视化领域使用 AI - Midjourney 进行设计提效的尝试。
AIGC 工具大比拼:
AI绘画哪家强?Midjourney、文心一格等 6 大工具出图效果大比拼 大家好,这里是和你们一起探索 AI 绘画的花生~ 3 月份以来 AI 绘画领域又有了不小的变化,Midjourney 更新了 V5 版本、Stable Diffusion 推出了 Clipdrop Reimagine;微软 Bing 也推出了 Image Create (图像生成)功能
阅读文章 >
在正文开始之前先看五张图
五张图总花费时间为 1 小时左右,其中训练 Midjourney 生成图像花了 20 分钟左右,使用现有组件完成设计稿大概用了 40 分钟。
结论:针对日常可视化大屏视觉设计提效 80%以上。
近期随着 ChatGPT 和 Midjourney 的大火,大家都在探索如何使用 AIGC 对我们已有的工作进行提效。开始之前,首先说明一下什么是 AIGC。 内容产生分为三个阶段,分别是 PGC、UGC 和目前大火的 AIGC。分别对应了专家产生内容、用户产生内容以及目前的 AI 产生内容,对应到大的时间周期有两个时间节点,分别是 2008 年和 2023 年。其中 2008 年以前是 PGC 时代,即专家产生内容,2008 年之后随着移动互联的来临,开启了 UGC 时代,即用户产生内容。最后就是当下,2023 年,开年随着 ChatGPT 和 Midourney 的大火,同时开启了 AI 创造内容的时代。
随着 AI 的大火,作为一名可视化大屏设计师,我也在考虑如何通过 AI 提升我的工作效率,接下来简述一下我在可视化领域使用 AI 进行设计提效的尝试。
一、AI 绘图的分类及选型 由于市面上存在大量的 AI 绘画工具,每个工具擅长的画风也各有所长;选择合适的工具可以帮助我们在 AI 创作中事半功倍。
1. Midjourney、StableDiffsion、DALLE2 绘图案例及特点
Midjourney:画面注重细节的构建和表达;同时对不同材质的展示也非常细致。
Stable Diffusion:画风更偏写实;生成照片级别的作品
DALLE 2:笔触比较明显,更加偏向绘画风格
2. Midjourney、Stable Diffusion、DALLE 2 横向对比
三组 AI 模型输入同样的 Prompt,生成图像进行横向对比,总结不同 AI 模型所擅长的绘图风格。
Midjourney 生成的图像更加具有艺术风格,更偏向 CG 画面。Stable Diffusion、DALLE 2 生成的图像更偏向写实、具有照片感。因此选择 Midjourney 作为赋能可视化大屏设计的 AI 工具进行探索。
二、可视化大屏设计如何拥抱 AI 可视化大屏设计拥抱 AI,获得 AI 能力加持,提升工作效率。可以从两个方面综合思考,找准切入点。第一是工作流程,第二是页面结构。
1. 可视化大屏工作流程
从可视化大屏的产设研流程来看,一个产品的上线需要经历如下环节:提出需求 、视觉探索、交互设计、完成设计、开发文档、协助开发、设计走查、产品上线等。整个流程较为复杂。结合 AI 产出的内容,可将 AI 提效部分聚焦在视觉探索阶段。视觉探索是整个可视化大屏产品设计阶段较为重要的一环,也是最为耗费人力的阶段。好的视觉往往能够让人眼前一亮,为优秀的可视化作品奠定基础。
2. 可视化大屏页面结构
一个完整的可视化大屏设计方案从页面结构上分为视觉层和数据层。其中数据层是整个可视化大屏的核心,是核心要传达给用户有价值的数据的内容,辅助用户决策。视觉层则是灵魂,一个可视化大屏是否能获得用户的认可,通常看视觉层的表现。
根据对可视化大屏的在工作流程和页面结构的拆解,页面结构中的视觉层以及工作流程中的视觉设计更加偏向重复性以及设计探索类的工作。再结合 AI 绘图的特点:低成本的、快速的、批量产生设计内容。因此我尝试使用 AI 来辅助完成可视化的视觉探索方向的设计工作。
三、AI 辅助生成设计流程 1. 传统可视化视觉设计流程
传统的可视化视觉设计流程通常从获取地理信息数据开始,然后再进行数据建模、模型渲染、效果合成。其中完成数据建模之后的模型渲染和效果合成是一个循环反复的过程,需要不断打磨渲染效果以及合成效果,最终才能完成作品输出。对这个流程的优化也将是 AI 提效的关键节点。
2. Midjourney 辅助视觉设计流程
开始进行 AI 辅助设计之前,我们首先需要知道 Midjourney 的工作流程是什么以及一些相关参数与名词的介绍。
① Midjourney 工作流程
Midjourney 在 AI 生成图像过程中有两个路径,其一是文本生图,其二是以图生图的方式。其中文本生图 Text to img 是更为常见的一种方式,通过一段对画面描述的文字,告诉 AI 你想要的画面,AI 就可以帮你生成对应的图像。以图生图 Img to img 是通过输入一张原始图像给 AI,辅助描述文字生成一张基于原始图像的新图像。
② Midjourney 参数及名词介绍
--v 5:表示使用的是第几个版本的 Midjourney AI 模型(目前从 V1 到 V5 版本)
--ar 2:1:所生成图片的宽高比例 (1:1 到 2:1 之间)
--iw 1:以图生图模式中,新图和原始图的关联度(最小是 0.5,最大是 2)
--q 2: 预览质量(0.25 到 5。数值越高渲染所需时间越久)
--no XXX:XXX 代表不想让图像出现的元素(--no background 表示不要背景元素)
U1 U2 U3 U4:代表了显示的四张图;点击其中一个按钮,系统就会发给用户对应的图片 V1 V2 V3 V4:对应了四张图片,点击其中一个按钮系统会推给我们四张对应图片的细节调整版
3. 文本生图 Text to img
在使用 Midjourney 生成图像的过程中,整个流程的关键是“Prompt”的撰写。Prompt 作为用户和 AI 沟通的桥梁,书写的质量直接影响生成画面的效果。Prompt 写的越详细,越完善,生成的图像会越具体,更能符合用户对生成图片的预期。
Step 1 对我们想要的画面主体进行描述。
Prompt:Earth with China as the main body,
Step 2 对我们想要的画面主体以及画面风格进行描述。
Prompt:Earth with China as the main body, HUD, FUI, Data visualization, 3D render, C4D,
Step 3 对我们想要的画面主体、画面风格、视觉参考以及艺术流派进行描述。
Prompt:Earth with China as the main body, HUD, FUI, Data visualization, 3D render, C4D, Dennis Schaefer, Futurism, Artstation, Behance,
Step 4 对我们想要的画面主体、画面风格、视觉参考、艺术流派以及画面视角进行描述。
Prompt:Earth with China as the main body, HUD, FUI, Data visualization, 3D render, C4D, Dennis Schaefer, Futurism, Artstation, Behance, panoramic, screen is blue,
Step 5 对我们想要的画面主体、画面风格、视觉参考、艺术流派以及画面视角进行描述之后,如果有意向图片,可以选择对应图片点击“V”按钮,让系统推送细节调整版本。在这个过程中可以进行画质提升操作。
Step 6 在细节调整有意向图片后,可以选择对应图片点击“U”按钮,让系统发送我们所选图片的额大图。
在 Text to img 过程中生成的一些其他样式风格的图片,可供我们进行参考,提供灵感来源。
4. 以图生图 Img to img
Setp 1 使用和 text to img 相同的 Prompt,仅改变 iw 值,iw(生成的图片和原图片的相似性。0.5 为关联性最低,2 为关联性最高)值分别为 0.5、1、1.5 和 2。得到以下四组图片。
Step 2 选择 iw = 2 中的第四张图片 并按 V 键进行视觉调整。
Step 3 再选择 V4 进行视觉调整。最后选择 U2 进行图像输出。
最后完整看一下 Img to img 的过程
四、Midjourney 其他风格可视化设计图像生成
五、Midjourney 生成图像的应用 将 Midjourney 输出的图像应用于真实的场景中,同样需要从两方面来看。第一是可视化的页面结构划分,第二是 可视化设计 的工作流程。
首先:根据可视化大屏设计的页面结构划分来看,Midjourney 输出的图片只是作为背景视觉层来使用,仍需根据业务需求叠加数据层的内容。如开篇的两张图所示。
其次:从工作流程来看,目前产出的设计稿仅可应用于设计风格探索阶段,或者是作为飞机稿的素材使用。无法应用于真实项目中。具体原因看第六点。
六、Midjourney 辅助可视化大屏设计存在的问题 结论:Midjourney 辅助可视化大屏视觉设计可以为设计师提供部分灵感来源。提升可视化设计师的视觉探索效率,但无法在实际项目中运用。
在地理信息可视化中,针对视觉设计主要是将地理数据信息转化为 3D 模型,再将模型进行渲染。其中将地理信息数据转化为 3D 模型过程中核心就是保证 3D 模型对地理信息数据的准确还原。
然而基于当前对 midjourney V4 模型以及 V5 模型的研究,我理解 AI 生成图像的基本逻辑是将关键词分别映射到不同的图像,再将一个关键词组所对应的所有图像进行拼接,这个过程就像是 PS 的图片合成,或者叫视觉风格迁移。这样的一个生成方式会导致细节的不准确。在实际测试过程中,针对一个具体国家、省份的三维地图的生成结果基本都是不准确的。因此无法真正用于可视化设计工作中。
那什么时候 AIGC 会对可视化大屏设计效率有质的提升?那就是当 AI 能够理解并找到对应的地理信息数据后生成不同类型、风格的图像的时候,才能做到对普通可视化设计师的效率有质的提升。
这一天也许很远,也许就在明天!
-
AIGC案例实战!如何用AI为可视化大屏设计提效?
UI交互 2023-04-06随着 AI 的大火,大家都在考虑如何通过 AI 提升工作效率,接下来简述一下我在可视化领域使用 AI - Midjourney 进行设计提效的尝试。AIGC工具大比拼:AI绘画哪家强?Midjourney、文心一格等 6 大工具出图效果大比拼大家好,这里是和你们一起探索 AI 绘画的花生~ 3 月份以来 AI ...随着 AI 的大火,大家都在考虑如何通过 AI 提升工作效率,接下来简述一下我在可视化领域使用 AI - Midjourney 进行设计提效的尝试。
AIGC 工具大比拼:
AI绘画哪家强?Midjourney、文心一格等 6 大工具出图效果大比拼 大家好,这里是和你们一起探索 AI 绘画的花生~ 3 月份以来 AI 绘画领域又有了不小的变化,Midjourney 更新了 V5 版本、Stable Diffusion 推出了 Clipdrop Reimagine;微软 Bing 也推出了 Image Create (图像生成)功能
阅读文章 >
在正文开始之前先看五张图
五张图总花费时间为 1 小时左右,其中训练 Midjourney 生成图像花了 20 分钟左右,使用现有组件完成设计稿大概用了 40 分钟。
结论:针对日常可视化大屏视觉设计提效 80%以上。
近期随着 ChatGPT 和 Midjourney 的大火,大家都在探索如何使用 AIGC 对我们已有的工作进行提效。开始之前,首先说明一下什么是 AIGC。 内容产生分为三个阶段,分别是 PGC、UGC 和目前大火的 AIGC。分别对应了专家产生内容、用户产生内容以及目前的 AI 产生内容,对应到大的时间周期有两个时间节点,分别是 2008 年和 2023 年。其中 2008 年以前是 PGC 时代,即专家产生内容,2008 年之后随着移动互联的来临,开启了 UGC 时代,即用户产生内容。最后就是当下,2023 年,开年随着 ChatGPT 和 Midourney 的大火,同时开启了 AI 创造内容的时代。
随着 AI 的大火,作为一名可视化大屏设计师,我也在考虑如何通过 AI 提升我的工作效率,接下来简述一下我在可视化领域使用 AI 进行设计提效的尝试。
一、AI 绘图的分类及选型 由于市面上存在大量的 AI 绘画工具,每个工具擅长的画风也各有所长;选择合适的工具可以帮助我们在 AI 创作中事半功倍。
1. Midjourney、StableDiffsion、DALLE2 绘图案例及特点
Midjourney:画面注重细节的构建和表达;同时对不同材质的展示也非常细致。
Stable Diffusion:画风更偏写实;生成照片级别的作品
DALLE 2:笔触比较明显,更加偏向绘画风格
2. Midjourney、Stable Diffusion、DALLE 2 横向对比
三组 AI 模型输入同样的 Prompt,生成图像进行横向对比,总结不同 AI 模型所擅长的绘图风格。
Midjourney 生成的图像更加具有艺术风格,更偏向 CG 画面。Stable Diffusion、DALLE 2 生成的图像更偏向写实、具有照片感。因此选择 Midjourney 作为赋能可视化大屏设计的 AI 工具进行探索。
二、可视化大屏设计如何拥抱 AI 可视化大屏设计拥抱 AI,获得 AI 能力加持,提升工作效率。可以从两个方面综合思考,找准切入点。第一是工作流程,第二是页面结构。
1. 可视化大屏工作流程
从可视化大屏的产设研流程来看,一个产品的上线需要经历如下环节:提出需求 、视觉探索、交互设计、完成设计、开发文档、协助开发、设计走查、产品上线等。整个流程较为复杂。结合 AI 产出的内容,可将 AI 提效部分聚焦在视觉探索阶段。视觉探索是整个可视化大屏产品设计阶段较为重要的一环,也是最为耗费人力的阶段。好的视觉往往能够让人眼前一亮,为优秀的可视化作品奠定基础。
2. 可视化大屏页面结构
一个完整的可视化大屏设计方案从页面结构上分为视觉层和数据层。其中数据层是整个可视化大屏的核心,是核心要传达给用户有价值的数据的内容,辅助用户决策。视觉层则是灵魂,一个可视化大屏是否能获得用户的认可,通常看视觉层的表现。
根据对可视化大屏的在工作流程和页面结构的拆解,页面结构中的视觉层以及工作流程中的视觉设计更加偏向重复性以及设计探索类的工作。再结合 AI 绘图的特点:低成本的、快速的、批量产生设计内容。因此我尝试使用 AI 来辅助完成可视化的视觉探索方向的设计工作。
三、AI 辅助生成设计流程 1. 传统可视化视觉设计流程
传统的可视化视觉设计流程通常从获取地理信息数据开始,然后再进行数据建模、模型渲染、效果合成。其中完成数据建模之后的模型渲染和效果合成是一个循环反复的过程,需要不断打磨渲染效果以及合成效果,最终才能完成作品输出。对这个流程的优化也将是 AI 提效的关键节点。
2. Midjourney 辅助视觉设计流程
开始进行 AI 辅助设计之前,我们首先需要知道 Midjourney 的工作流程是什么以及一些相关参数与名词的介绍。
① Midjourney 工作流程
Midjourney 在 AI 生成图像过程中有两个路径,其一是文本生图,其二是以图生图的方式。其中文本生图 Text to img 是更为常见的一种方式,通过一段对画面描述的文字,告诉 AI 你想要的画面,AI 就可以帮你生成对应的图像。以图生图 Img to img 是通过输入一张原始图像给 AI,辅助描述文字生成一张基于原始图像的新图像。
② Midjourney 参数及名词介绍
--v 5:表示使用的是第几个版本的 Midjourney AI 模型(目前从 V1 到 V5 版本)
--ar 2:1:所生成图片的宽高比例 (1:1 到 2:1 之间)
--iw 1:以图生图模式中,新图和原始图的关联度(最小是 0.5,最大是 2)
--q 2: 预览质量(0.25 到 5。数值越高渲染所需时间越久)
--no XXX:XXX 代表不想让图像出现的元素(--no background 表示不要背景元素)
U1 U2 U3 U4:代表了显示的四张图;点击其中一个按钮,系统就会发给用户对应的图片 V1 V2 V3 V4:对应了四张图片,点击其中一个按钮系统会推给我们四张对应图片的细节调整版
3. 文本生图 Text to img
在使用 Midjourney 生成图像的过程中,整个流程的关键是“Prompt”的撰写。Prompt 作为用户和 AI 沟通的桥梁,书写的质量直接影响生成画面的效果。Prompt 写的越详细,越完善,生成的图像会越具体,更能符合用户对生成图片的预期。
Step 1 对我们想要的画面主体进行描述。
Prompt:Earth with China as the main body,
Step 2 对我们想要的画面主体以及画面风格进行描述。
Prompt:Earth with China as the main body, HUD, FUI, Data visualization, 3D render, C4D,
Step 3 对我们想要的画面主体、画面风格、视觉参考以及艺术流派进行描述。
Prompt:Earth with China as the main body, HUD, FUI, Data visualization, 3D render, C4D, Dennis Schaefer, Futurism, Artstation, Behance,
Step 4 对我们想要的画面主体、画面风格、视觉参考、艺术流派以及画面视角进行描述。
Prompt:Earth with China as the main body, HUD, FUI, Data visualization, 3D render, C4D, Dennis Schaefer, Futurism, Artstation, Behance, panoramic, screen is blue,
Step 5 对我们想要的画面主体、画面风格、视觉参考、艺术流派以及画面视角进行描述之后,如果有意向图片,可以选择对应图片点击“V”按钮,让系统推送细节调整版本。在这个过程中可以进行画质提升操作。
Step 6 在细节调整有意向图片后,可以选择对应图片点击“U”按钮,让系统发送我们所选图片的额大图。
在 Text to img 过程中生成的一些其他样式风格的图片,可供我们进行参考,提供灵感来源。
4. 以图生图 Img to img
Setp 1 使用和 text to img 相同的 Prompt,仅改变 iw 值,iw(生成的图片和原图片的相似性。0.5 为关联性最低,2 为关联性最高)值分别为 0.5、1、1.5 和 2。得到以下四组图片。
Step 2 选择 iw = 2 中的第四张图片 并按 V 键进行视觉调整。
Step 3 再选择 V4 进行视觉调整。最后选择 U2 进行图像输出。
最后完整看一下 Img to img 的过程
四、Midjourney 其他风格可视化设计图像生成
五、Midjourney 生成图像的应用 将 Midjourney 输出的图像应用于真实的场景中,同样需要从两方面来看。第一是可视化的页面结构划分,第二是 可视化设计 的工作流程。
首先:根据可视化大屏设计的页面结构划分来看,Midjourney 输出的图片只是作为背景视觉层来使用,仍需根据业务需求叠加数据层的内容。如开篇的两张图所示。
其次:从工作流程来看,目前产出的设计稿仅可应用于设计风格探索阶段,或者是作为飞机稿的素材使用。无法应用于真实项目中。具体原因看第六点。
六、Midjourney 辅助可视化大屏设计存在的问题 结论:Midjourney 辅助可视化大屏视觉设计可以为设计师提供部分灵感来源。提升可视化设计师的视觉探索效率,但无法在实际项目中运用。
在地理信息可视化中,针对视觉设计主要是将地理数据信息转化为 3D 模型,再将模型进行渲染。其中将地理信息数据转化为 3D 模型过程中核心就是保证 3D 模型对地理信息数据的准确还原。
然而基于当前对 midjourney V4 模型以及 V5 模型的研究,我理解 AI 生成图像的基本逻辑是将关键词分别映射到不同的图像,再将一个关键词组所对应的所有图像进行拼接,这个过程就像是 PS 的图片合成,或者叫视觉风格迁移。这样的一个生成方式会导致细节的不准确。在实际测试过程中,针对一个具体国家、省份的三维地图的生成结果基本都是不准确的。因此无法真正用于可视化设计工作中。
那什么时候 AIGC 会对可视化大屏设计效率有质的提升?那就是当 AI 能够理解并找到对应的地理信息数据后生成不同类型、风格的图像的时候,才能做到对普通可视化设计师的效率有质的提升。
这一天也许很远,也许就在明天!
-
设计系统搭建全流程:开始前的准备工作
UI交互 2023-04-06上一篇文章我们主要讲的是设计系统的必要性,接下来我将会继续用后续的文章详细讲解怎么搭建设计系统,希望可以帮助到有需要的人。上篇回顾:设计系统搭建全流程:认识设计系统设计系统这个词,是近些年的一个热门话题,在初期的讨论关注点主要聚焦在是否有必要搭建?阅读文章 > 在开始之前,我需要先解释一个问题:为什么要制作...上一篇文章我们主要讲的是设计系统的必要性,接下来我将会继续用后续的文章详细讲解怎么搭建设计系统,希望可以帮助到有需要的人。
上篇回顾:
设计系统搭建全流程:认识设计系统 设计系统这个词,是近些年的一个热门话题,在初期的讨论关注点主要聚焦在是否有必要搭建?
阅读文章 >
在开始之前,我需要先解释一个问题:
为什么要制作自己的设计系统
很多团队一提到搭建设计系统,就会有人说,网上有很多公开的设计系统,我们直接使用现成的不好吗?为什么要费时费力的搭建自己的设计系统,真的有必要吗?
首先,网上公开的设计系统,一般是指该企业的设计语言,是该企业产品的设计基石。但是这并不适用于所有的团队,比如,笔者所在行业是 HMI 行业,但是网上的设计系统基本上都集中在 pc 端,那么就有很多的规则无法在 HMI 设计中使用,毕竟设计系统的建立是为了提高效率,不能使用或者不合适的设计系统很有可能对设计造成阻碍。
如果对网上公开的设计系统了解多的话,就会发现,很多的 设计系统 对研发更加友好,但是并不适合 设计师 使用,它更多是一个说明文档,让别人看的,但不能用。所以对于一定规模的团队来讲,搭建自己团队的设计系统就势在必行了。
一、如何搭建设计系统 1. 搭建重点
要有全局观,创建的设计系统要是可维护的,可迭代的,要保证设计系统的适应性。
凡事有度,不要追求大而全,要根据公司产品,创建合理的设计资产,毕竟设计系统为的是更好用,提高效率。
2. 搭建流程
由于设计系统搭建需要多角色、多部门协作,如果公司或者团队无法组建一个完整的设计系统团队,那么我们就需要循序渐进,慢慢扩展设计系统的边界,让设计系统逐渐成长,完善。
一般来讲,刚开始搭建设计系统的是设计师和开发人员,以设计师为主,梳理当前业务的完整页面,提炼相同的元素,构成初版的设计系统,并在构建期间,和开发紧密协作,及时沟通。对设计出的组件进行代码化,同步搭建研发的基础组件库。当完成以后,可以加入动效规范、声效规范、图标规范……逐步的去完善设计系统,最终形成团队的设计资产库。
3. 使用工具
由于笔者是 HMI 设计师,所以只针对设计师在用的工具进行简单描述,其他角色的工具就不进行缀续了。
对于目前的设计师来讲,用得最多的就是 Sketch 和 Figma 了,Sketch 对于 UI 设计师来讲大都非常熟悉,Figma 更是最近几年设计协同的利器,虽然这两个软件都是设计软件,但是由于这两个软件底层逻辑并不相同,所以在制作设计师的样式库和组件库时略有不同,如果后续有必要的话,我会专门出一篇文章来讲解怎么用 Sketch 和 Figma 创建 UI 控件组件库。
二、设计资产 随着设计系统逐步完善,设计资产也会越来越多,最开始是 UI Kit 和开发代码库。然后慢慢扩展设计系统边界,增加其他内容。总的来讲,包含以下内容:
设计价值观及原则 样式库 控件组件库 设计说明文档 开发说明文档 图标库 动效 声效 ……
三、设计语言 为了让设计系统可以保持统一性和延展性,那么必须要有一个统一的设计指导理念,让每一个使用者可以通过设计语言,明确我们的设计目标和方向,减少设计中出现的偏差。所以对于一个设计系统来讲,提炼自己的设计语言是必要且有效的。
下面可以先看一看一些公开的设计系统的设计语言:
1. Microsoft Design
Fluent Design System 组成构件的设计理念就是:Light, Depth, Motion, Material, Scale.
2. Apple Design
苹果的设计规范包括:完整性,一致性,直接操作,反馈,隐喻,用户控制等几个设计原则。
3. Ant Design
Ant Design 设计价值观包括自然、确定性、意义感、生长性。
4. Arco Design
Arco Design 基于「清晰」、「一致」、「韵律」和「开放」的设计价值观,试图建立务实而浪漫的工作方式。
5. TDesign
TDesign 为了在开源体系的基础上打造具有自身品牌特色且好⽤的产品,秉承包容、多元、进化、连接的价值观。
通过对上述公开的设计语言的学习,我想大家都应该对设计语言的必要性和内容有一定的了解了,那么在开始进行设计系统搭建之前,先为你的设计系统构建专属于你的设计语言吧。
四、组件库分类逻辑 接下来我们就进入到设计系统的具体设计了,对于那么多的设计元素,我们该怎么进行分类呢?由于业务组件和元素划分完全取决于不同公司的实际需求,并无定式,所以我这里说的组件库划分主要指基础组件库的划分。并且并不一定适合所有团队。仅供参考。
接下来我们先来看下一些设计系统的组件划分:
Ant Design 的组件划分为:通用组件,布局组件,导航组件,数据录入和数据展示组件,反馈型组件、其他组件和重型组件。
TDesign 的组件划分为:基础组件、布局组件、导航组件、输入组件和数据展示组件、消息提醒组件。
Arco Design 的组件划分为:通用组件,布局组件,数据录入和数据展示组件,反馈型组件、导航组件和其他组件。
……
这些分类都是非常合理的划分,所以我们在设计组件库时可以参考或者直接使用。不过这里我想提一些不同的意见,因为组件库的分类主要是为了好用,便于识别,虽然上述的分类标准很清晰,但是也出现了过于详细的问题,那么我们在找一些需要的控件组件的时候,就需要先去思考它属于哪个分类下,所以需要团队内的成员对组件库的分类标准非常清晰,并且对于每个控件组件的归类也非常清晰。
在我构建组件库的分类时,为了尽可能的减少使用者的学习成本,所以用最简单的分类方式进行划分:全局样式、基础控件和系统组件三种分类。
通过简单的进行分类,大家不需要增加学习成本,可以更好的找到需要的控件组件,方便调用,也方便于资源库的推广。以上只是我这些年工作的经验之谈,仅供参考。
总结 本篇文章主要是想要和大家讲述下具体搭建设计系统之前的工作,不管是设计语言还是组件库分类,都是为了让我们的设计系统搭建的更加具有逻辑性。所以还是很有必要的,但是由于笔者是在 HMI 行业做设计师的,所以很多内容是具有很强行业特性的,大家不必完全保持一致,可以根据自己具体的团队和实际情况进行适当调整。还是那句老话,设计系统是为了提高效率。所以好用、易用是我们的一切出发点。接下来我们就进入到设计系统的详细设计阶段了,敬请期待!
-
7600字干货!腾讯高手如何用ChatGPT做用户研究?
UI交互 2023-04-06导语:ChatGPT 火出圈,各行各业纷纷在思考和实践如何借助 ChatGPT 降本增效。用户研究工作中涉及到大量知识获取、文本总结、数据分析、价值洞察等工作,无疑也是 ChatGPT 发挥作用的场景之一。本文就 ChatGPT 在用户研究场景中的作用做了初步探索,总体来看 ChatGPT 尚不能完全取代用户研究...导语:ChatGPT 火出圈,各行各业纷纷在思考和实践如何借助 ChatGPT 降本增效。用户研究工作中涉及到大量知识获取、文本总结、数据分析、价值洞察等工作,无疑也是 ChatGPT 发挥作用的场景之一。本文就 ChatGPT 在用户研究场景中的作用做了初步探索,总体来看 ChatGPT 尚不能完全取代用户研究员,但也展现出多种辅助 用户研究 工作的潜力。
更多ChatGPT案例:
设计师如何使用ChatGPT辅助工作?高手总结了9个技巧! 编者按:这篇文章的作者 Edward Chechique 是一名从事复杂产品和设计系统方面的专家,撰写过大量的产品相关的文章。
阅读文章 >
一、ChatGPT 简介 ChatGPT 是 OpenAI 推出的自然语言对话机器人,在推出不到两个月的时间里,月活就突破了一亿。与之相比,TikTok 和 Instagram 达到这一成绩分别用时九个月和两年半。在业界,微软于 2 月初火速上线整合 ChatGPT 的 Bing 搜索,还计划将其整合进 Office 全家桶,在落地应用上大踏步前进。与此同时,谷歌也紧急上线竞品 Bard,正面硬刚(虽然首秀翻车,给出错误答案,导致股价大跌)。此外,百度、阿里等国内科技企业也纷纷开始类 ChatGPT 的开发和内测。
对于 ChatGPT 是什么,相信大家已经有所了解,这里就偷懒让 ChatGPT 亲自答一下(图 1)。相比于之前的聊天机器人,ChatGPT 在语言理解、表达等方面都有非常惊艳的表现,而这离不开其背后强大的技术。
图 1 ChatGPT 自我介绍
ChatGPT 的这些能力在整合搜索结果、写代码、Debug、写文章等应用场景中表现亮眼。但同时也存在不少局限,比如数学能力低、回复啰嗦等。此外 ChatGPT 虽然可以拒绝回答违法违规(比如如何偷东西等)、超出能力范围(比如预测大赛冠军等)的问题,但目前其实是可以通过“我们来玩角色扮演的游戏吧”的方式绕过去。
比如“赛博算卦”~~首先直接让 ChatGPT 算卦会被无情拒绝(图 2),ChatGPT 说作为一个 AI 模型,它无法推算八字排盘和流年运势。但换一种思路,我们可以和 ChatGPT“商量”玩算命先生的游戏,让 ChatGPT 扮演算命先生,我们来扮演顾客,从而获得回答(图 3),虽然我不懂算卦,但答案看上去还是很专业的。
图 2 ChatGPT 拒绝算卦
图 3 和 ChatGPT 玩算命先生的游戏(参考自 https://www.zhihu.com )
二、ChatGPT 能替代用户研究吗? 虽然还存在着这样那样的局限性,但 ChatGPT 所显现出的巨大应用潜力使得关于 ChatGPT 可以取代哪些职业的讨论成为当下的热门话题。不禁让从事用户研究工作的我好奇:ChatGPT 能够给用户研究带来什么样的改变?会让用户研究员失业吗?
怀着这样的想法,我试着使用 ChatGPT 对数字藏品的价值进行用户调研,包括案头分析、研究设计、访谈执行和分析、问卷设计和分析以及报告撰写等主要研究环节。从初步的探索来看,当前 ChatGPT 显然不能完全取代用户研究员的工作,但是在以下四个方面已经展现出其作为辅助工具,为用户研究降本增效的潜力:
高效整合内容的搜索引擎:提升在理解需求和概念、获得 HowTo 答案(尤其是程序相关)等方面的效率;
能力多样的“配菜员”:提供初步的研究框架、访谈提纲等,针对访谈记录、数据结果总结关键信息等,辅助研究员在此基础上修改提升;
提升内容表达的润色工具:根据需求转换成不同风格的表达、识别错别字等,但当前英文比中文的润色效果更好;
用户访谈降本增效的“模拟器”:通过让 ChatGPT 扮演主持人访谈用户,或者扮演典型用户接受访谈,提升用户访谈的效率。
让我们依次看下 ChatGPT 在这些方面的具体表现:
1. 高效整合内容的搜索引擎
和传统搜索提供多个相关结果不同,ChatGPT 能够根据多个搜索结果,提供整合后的内容。这种高效整合内容的能力可以帮助用户研究员在需求理解、案头研究、数据分析等环节更快速地获得高价值(如相关性高、总结性强、废话少等)的知识性内容。
比如针对“数字藏品的核心价值”的研究问题,在需求理解、案头研究阶段,通过询问“什么是数字藏品”(图 4),ChatGPT 用清晰有条理的内容介绍了数字藏品的概念、技术特点等。还可以通过进一步追问,得到如 ChatGPT 对数字藏品的价值(图 5)、具体的艺术价值(图 6)、相关研究资源推荐(图 7)等更为详实的回答,这些内容确实可以帮助我们更快速地加深对研究主题的理解,辅助和启发研究方案设计等。
图 4 数字藏品概念释义
图 5 数字藏品有哪些价值
图 6 追问数字藏品的艺术价值
图 7 推荐相关研究资源
但在此过程中,特别需要我们提高警惕,注意对 ChatGPT 答案的真实性和准确性进行判断、交叉验证等。这是因为 ChatGPT 会很“自信地”输出一番胡扯的内容(图 8),如果缺乏相关背景知识的话,就很容易被误导。此外 ChatGPT 无法提供生成答案所依据的特定参考文献(图 9),也提升了对内容交叉验证的难度。
图 8 对某数字藏品平台的一番胡扯
图 9ChatGPT 无法提供答案的参考文献
除了可以提供研究主题相关的知识外,ChatGPT 也可以在数据分析等阶段对数据分析的方法、实现代码提供直接的指导,比如“如何使用 Excel 计算平均值、TGI 指数”(图 10),ChatGPT 就给出了公式和操作步骤,研究员照着答案操作即可。但目前 ChatGPT 对常用的数据分析软件 SPSS 的支持效果有限,比如“根据变量 A 的选项生成新的变量 B”的 SPSS 语句(图 11)就是错误的,猜测和 ChatGPT 训练数据集中 SPSS 相关知识内容较少有关。
图 10 ChatGPT 对使用 Excel 计算平均值、TGI 指数的指导
图 11 针对 SPSS 语句实现,ChatGPT 给出错误答案
但总的来说,作为高效整合内容的搜索引擎,ChatGPT 可以帮助研究员快速地了解相关的研究主题,辅助和启发研究方案设计等,也能提供数据分析方法的指导。但在此过程中,需要研究员特别注意 ChatGPT 答案的真实性、准确性,且目前对 SPSS 的支持不如 Python、Excel 的效果好。
2. 能力多样的“配菜员”
ChatGPT 在用户研究工作中,第二个可能的应用是作为能力多样的“配菜员”,从访谈逐字稿、问卷数据中提炼关键信息,或者根据研究员的诉求提供诸如方案设计、问卷大纲等多种建议,提高研究员分析数据获得洞察、撰写访谈提纲或者问卷等任务的效率。
在这一部分,让我印象最为深刻的是 ChatGPT 分析总结原始数据的能力,比如我根据真实用户的访谈记录改编出以下三个用户对使用过的数字藏品平台的评价:
用户 1:“我玩的跟他差不多,也就两个,一个平台 A 一个平台 B,像那种官方发出来的那种在自己那里抽奖的那些我也会看,但是像那种野牌子我一般是不会去玩,那种野牌子感觉没有什么大公司,我怕我买完收藏了,他就什么都没了,这种就不会错的。然后区别其实我主要是看文物的,别的我其实看的少,我感觉也没啥区别。”
用户 2:“首先第一个最大区别就是因为国内的数字藏品发售的话都是以公司为主题,但是国外的首先他只是在中介平台上传自己的图片,然后进行发布,这其实是国内外最大的一个区别,然后国内的区别的话,第一个我觉得是公司可信度不同,就比如说在平台 B 上面买的话我完全不用担心这个数字藏品会不见了,然后还有就是小公司的话就是像他说的会非常容易怕跑路,我收藏的东西就不见了,然后每个平台的话其实他会有锚定的点,就是我发售的藏品的主题内容会有什么不同,有一些他会发售类似说什么古代人物这种,有一些像平台 B 这种的话就是主做博物馆里面的藏品什么的,还有类似我刚才说的明星那种,就每个做的内容他会不同,大概就这些。”
用户 3: “我主要玩的话就是平台 C 和平台 D,他们不同的话那个平台 D 大部分都是古风还有文物之类的,然后平台 C 很多衍生的吧,就改的比较厉害的,很多二创的那种,然后他发行的东西也就不一样,就经常很多种类嘛,买的就比较多了,平台 D 就要少一点,他那个发行时间要慢一点,东西就少一点,可以选择就少一点。”
然后让 ChatGPT 从中总结出和数字藏品平台有关的关键信息(图 12)。我们看到 ChatGPT 总结的质量已经比较高了,基本上覆盖了用户提到的关键点,比如平台可信度很重要、不同平台的内容存在差异等。虽然 ChatGPT 的总结还仅限于原文观点的提炼,而不能进行更多的关联分析(比如从第一点平台可信度可以得出用户需要平台背书来确保数字藏品的安全,但基于区块链的数字藏品在技术上本身就具有永久有效、公开透明的特性,造成这种差异的原因可能是现实中数字藏品依然依托于中心化平台的运营,也可能是用户对数字藏品的技术特性缺乏认同等),但已经可以很好地作为进一步提炼洞察的材料了。
图 12 ChatGPT 总结出的与数字藏品相关的关键信息
除了总结访谈记录,ChatGPT 也能从问卷数据中得出关键信息,比如表 1 是两种数字藏品用户类型在选购数字藏品时,会主要考虑哪些因素的统计数据(非真实数据):
表 1 收藏用户和投资用户选购数字藏品时主要考虑的因素(非真实数据)
我们可以让 ChatGPT 分析两种类型用户在选购因素上的差异(图 13),甚至可以直接让 ChatGPT 根据选购因素得出如何设计数字藏品的建议(图 14)。可以看到,和访谈记录总结类似,ChatGPT 能够针对统计数据得出初步分析结果(比如两种用户更看重的选购因素),但需要研究员在此基础上做更深度的洞察提炼。
图 13 对比两种用户在选购因素上的异同
图 14 根据选购因素得出数字藏品设计的建议
此外,ChatGPT 还可以针对研究方案(图 15 和图 16)、访谈提纲(图 17 和图 18)、访谈中追问(图 19)、问卷设计(图 20)、数据可视化(图 21)等提供初步建议,这些建议的质量参差不齐,总体来看离真正可用的方案、提纲等尚有不小的距离(比如问卷题目和选项过于简单、数据可视化建议效果不佳等),但已经可以用来启发研究员在此基础上修改完善。
图 15 ChatGPT 撰写研究计划
图 16 追问研究对象如何分组
图 17 撰写深度访谈大纲
图 18 根据访谈提纲追问具体的访谈问题
图 19 访谈中追问什么问题
图 20 撰写问卷题目和选项
图 21 数据可视化建议
总的来看,ChatGPT 在用户研究的多个环节中均有着扮演“配菜员”的潜力,如分析访谈记录、问卷数据,总结其中的关键信息,或者就研究方案、访谈提纲、问卷题目等提供建议。从目前的效果来看,ChatGPT 的答案并不是真正可用的方案、提纲、问卷、洞察等,但确实可以提高如总结访谈记录、分析问卷数据的效率,为研究员进一步分析,得出更高价值的洞察提供了丰富的原材料。
3. 提升内容表达的润色工具
ChatGPT 修改文案的能力在用户研究工作中也有用武之地,比如修改问卷题目、报告内容中的错别字。如图 22 所示,ChatGPT 成功识别并修改了“参于”、“资质”、“隆资”这几处错别字,并在“甚至”前添加了逗号提升表达准确性。其修改效果还是比较惊艳的。
图 22 错别字修改
此外相信有不少研究员在撰写英文报告时,担心自己写出的句子比较生硬、词不达意。在这方面,ChatGPT 可以很好地帮助我们提升英文报告的表达,比如使用更精准更地道的词汇、更符合英语母语的表达习惯等。
要实现这一点的话,需要用到 ChatGPT 更“高端“的玩法,即通过适当的提示语(Prompt)让 ChatGPT 扮演特定风格的英文翻译,将输入的内容在不改变其意思的情况下,翻译成更优美高端的英文(当然也可以尝试其他风格,比如更 concise 等):
I want you to act as an English translator, spelling corrector and improver. I will speak to you in any language and you will detect the language, translate it and answer in the corrected and improved version of my text, in English. I want you to replace my simplified A0-level words and sentences with more beautiful and elegant, upper level English words and sentences. Keep the meaning same, but make them more literary. I want you to only reply the correction, the improvements and nothing else, do not write explanations. My first sentence is “很高兴认识你"
图 23 展示的就是“数字藏品交易的投机炒作氛围浓厚,买家会面临如庄家控盘、平台跑路、内容侵权、无人接盘等风险”这句话的英文翻译结果,和直接翻译的结果对比(图 24),确实效果更好一些。
图 23 翻译并提升英文表达
图 24 直接翻译成英文
总的来说,ChatGPT 在修改错别字、提高英文表达方面均有不错的表现,确实可以帮助我们更高效的润色输出的内容,比如访谈提纲、问卷题目、洞察报告等。
4. 用户访谈降本增效的“模拟器”
在作为润色工具的部分,我们分享了 ChatGPT 的“高端”玩法,即使用 Prompt 将其“调教”成特定风格的英文翻译。这种玩法可以使 ChatGPT 扮演各种各样的角色,比如心理咨询师、面试官、体育评论员等等(在此推荐一个相关 Prompt 的 GitHub 仓: https://github.com/f/awesome-chatgpt-prompts ),让 ChatGPT 的应用场景扩展了不少。
回到用户研究,很自然地就会想到:让 ChatGPT 扮演主持人的角色,访谈用户的效果如何,能不能自动化访谈?或者反过来,让 ChatGPT 扮演某类典型用户接受访谈,它的回答和真实用户的回答相差多少?能不能作为典型用户的初步洞察?
我们先来看下 ChatGPT 扮演主持人访谈用户的效果(图 25),这里我让 ChatGPT 扮演成一位访谈主持人,目的是通过询问用户问题来弄清楚“数字藏品(NFT)的核心用户价值是什么”,相应的 Prompt 是:
I want you to act as an user interviewer, you job is to figure out the core user value of NFT. I will be the user and you will ask me the interview questions about NFT. I want you to only reply as the interviewer. Do not write all the conversation at once. I want you to only do the interview with me. Ask me the questions and wait for my answers. Do not write explanations. Ask me the questions one by one like an interviewer does and wait for my answers. My first sentence is “Hi”
我们看到 ChatGPT 的表现还是比较惊艳的,它没有直接询问“你觉得数字藏品有哪些核心价值?”,而是从如何理解数字藏品这个概念入手,询问了一系列相关问题,比如如何知道数字藏品、如何在日常生活中使用数字藏品、数字藏品最大的好处等等。虽然在这个 case 中,ChatGPT 并没有能够结合上下文来追问用户,但当前的表现已经足以让我们思考 ChatGPT 是不是能够代替我们自动访谈用户,就一些简单的、结构清晰的研究问题提供访谈洞察。
图 25 ChatGPT 扮演主持人访谈用户
看完 ChatGPT 扮演主持人的效果,让我们继续看下它扮演某类典型用户接受访谈的表现(图 26)。首先通过以下 Prompt 让 ChatGPT 扮演一位年轻的数字藏品用户:“她”是一位 20 岁的在校大学生,爱好广泛比如聚会、看电影、逛街等等。然后就可以通过询问数字藏品相关的问题来挖掘“她”对数字藏品的看法。
I want you to act as a NFT user, you are a 20-year-old college girl, you have a lot of hoppies, like partying, watching movies, shopping with your besties etc. I will be the interviewer and I will ask you the interview questions about NFT. I want you to only reply as this girl. Do not write all the conversation at once. Wait for my questions and give me answers. Do not write explanations. My first sentence is "Hi"
图 26 ChatGPT 扮演典型用户接受访谈
总体来看,ChatGPT 的表现持续惊艳,比如询问“她”是如何知道数字藏品的,“她”给出的回答是“玩数字藏品的好友分享给她的”。当重复“她”觉得 NFT 很 cool 的看法后,“她”回答到“数字藏品改变了我们对数字世界所有权和价值的看法”等。这些回答从主观感受上看确实很贴近我们访谈到实际用户。
所以展开想象力,这会不会改变今后用户研究的流程?比如在访谈真实用户前,能不能先让 ChatGPT 扮演几种典型用户来获得初步洞察,之后再进行真实用户访谈以验证和补充?当然在此之前还有很多的问题要回答,比如如何使用 Prompt 更准确地描述典型用户(如需要哪些变量?),ChatGPT 扮演典型用户的准确性和有效性有多高等等。但无疑 ChatGPT 的表现已经足以让我们开始类似的思考。
总结 总结一下,通过上述初步的探索,我会觉得 ChatGPT 在未来的用户研究工作中,可能成为降本增效的辅助工具:作为高效的搜索引擎,提升获取知识的效率;也可以作为能力多样的“配菜员”,提供诸如访谈初步总结、数据分析结果、访谈大纲等内容,辅助研究员完成研究设计、洞察分析等;还能作为内容(尤其是英文内容)的润色工具,修改错别字、转换不同表达风格等;最后也显示了其作为主持人执行访谈或者扮演典型用户接受访谈的潜力。
当然 ChatGPT 距离真正可用的用户研究辅助工具还有一段距离,比如需要用户研究领域的知识对模型进行 Fine-tune 以提升答案质量,再比如需要定制化的交互方式,以提升在用户研究工作中,与 ChatGPT 交互的体验和效率等等。
此外,对于有兴趣继续探索 ChatGPT 应用的同学,分享三个 Tips:
多试几次,以比较不同的回答; 学会提问,明确需求,由粗到细引导,并且注意之前输入内容的影响; 保持独立思考和批判性思维,时刻警惕内容的真实性、准确性,避免被 ChatGPT 牵着鼻子走。 最后,对于 ChatGPT 能否替代用户研究,我认同:“AI will not replace you. A person using AI will.
欢迎关注作者「腾讯CDC体验设计」的微信公众号:
-
7600字干货!腾讯高手如何用ChatGPT做用户研究?
UI交互 2023-04-06导语:ChatGPT 火出圈,各行各业纷纷在思考和实践如何借助 ChatGPT 降本增效。用户研究工作中涉及到大量知识获取、文本总结、数据分析、价值洞察等工作,无疑也是 ChatGPT 发挥作用的场景之一。本文就 ChatGPT 在用户研究场景中的作用做了初步探索,总体来看 ChatGPT 尚不能完全取代用户研究...导语:ChatGPT 火出圈,各行各业纷纷在思考和实践如何借助 ChatGPT 降本增效。用户研究工作中涉及到大量知识获取、文本总结、数据分析、价值洞察等工作,无疑也是 ChatGPT 发挥作用的场景之一。本文就 ChatGPT 在用户研究场景中的作用做了初步探索,总体来看 ChatGPT 尚不能完全取代用户研究员,但也展现出多种辅助 用户研究 工作的潜力。
更多ChatGPT案例:
设计师如何使用ChatGPT辅助工作?高手总结了9个技巧! 编者按:这篇文章的作者 Edward Chechique 是一名从事复杂产品和设计系统方面的专家,撰写过大量的产品相关的文章。
阅读文章 >
一、ChatGPT 简介 ChatGPT 是 OpenAI 推出的自然语言对话机器人,在推出不到两个月的时间里,月活就突破了一亿。与之相比,TikTok 和 Instagram 达到这一成绩分别用时九个月和两年半。在业界,微软于 2 月初火速上线整合 ChatGPT 的 Bing 搜索,还计划将其整合进 Office 全家桶,在落地应用上大踏步前进。与此同时,谷歌也紧急上线竞品 Bard,正面硬刚(虽然首秀翻车,给出错误答案,导致股价大跌)。此外,百度、阿里等国内科技企业也纷纷开始类 ChatGPT 的开发和内测。
对于 ChatGPT 是什么,相信大家已经有所了解,这里就偷懒让 ChatGPT 亲自答一下(图 1)。相比于之前的聊天机器人,ChatGPT 在语言理解、表达等方面都有非常惊艳的表现,而这离不开其背后强大的技术。
图 1 ChatGPT 自我介绍
ChatGPT 的这些能力在整合搜索结果、写代码、Debug、写文章等应用场景中表现亮眼。但同时也存在不少局限,比如数学能力低、回复啰嗦等。此外 ChatGPT 虽然可以拒绝回答违法违规(比如如何偷东西等)、超出能力范围(比如预测大赛冠军等)的问题,但目前其实是可以通过“我们来玩角色扮演的游戏吧”的方式绕过去。
比如“赛博算卦”~~首先直接让 ChatGPT 算卦会被无情拒绝(图 2),ChatGPT 说作为一个 AI 模型,它无法推算八字排盘和流年运势。但换一种思路,我们可以和 ChatGPT“商量”玩算命先生的游戏,让 ChatGPT 扮演算命先生,我们来扮演顾客,从而获得回答(图 3),虽然我不懂算卦,但答案看上去还是很专业的。
图 2 ChatGPT 拒绝算卦
图 3 和 ChatGPT 玩算命先生的游戏(参考自 https://www.zhihu.com )
二、ChatGPT 能替代用户研究吗? 虽然还存在着这样那样的局限性,但 ChatGPT 所显现出的巨大应用潜力使得关于 ChatGPT 可以取代哪些职业的讨论成为当下的热门话题。不禁让从事用户研究工作的我好奇:ChatGPT 能够给用户研究带来什么样的改变?会让用户研究员失业吗?
怀着这样的想法,我试着使用 ChatGPT 对数字藏品的价值进行用户调研,包括案头分析、研究设计、访谈执行和分析、问卷设计和分析以及报告撰写等主要研究环节。从初步的探索来看,当前 ChatGPT 显然不能完全取代用户研究员的工作,但是在以下四个方面已经展现出其作为辅助工具,为用户研究降本增效的潜力:
高效整合内容的搜索引擎:提升在理解需求和概念、获得 HowTo 答案(尤其是程序相关)等方面的效率;
能力多样的“配菜员”:提供初步的研究框架、访谈提纲等,针对访谈记录、数据结果总结关键信息等,辅助研究员在此基础上修改提升;
提升内容表达的润色工具:根据需求转换成不同风格的表达、识别错别字等,但当前英文比中文的润色效果更好;
用户访谈降本增效的“模拟器”:通过让 ChatGPT 扮演主持人访谈用户,或者扮演典型用户接受访谈,提升用户访谈的效率。
让我们依次看下 ChatGPT 在这些方面的具体表现:
1. 高效整合内容的搜索引擎
和传统搜索提供多个相关结果不同,ChatGPT 能够根据多个搜索结果,提供整合后的内容。这种高效整合内容的能力可以帮助用户研究员在需求理解、案头研究、数据分析等环节更快速地获得高价值(如相关性高、总结性强、废话少等)的知识性内容。
比如针对“数字藏品的核心价值”的研究问题,在需求理解、案头研究阶段,通过询问“什么是数字藏品”(图 4),ChatGPT 用清晰有条理的内容介绍了数字藏品的概念、技术特点等。还可以通过进一步追问,得到如 ChatGPT 对数字藏品的价值(图 5)、具体的艺术价值(图 6)、相关研究资源推荐(图 7)等更为详实的回答,这些内容确实可以帮助我们更快速地加深对研究主题的理解,辅助和启发研究方案设计等。
图 4 数字藏品概念释义
图 5 数字藏品有哪些价值
图 6 追问数字藏品的艺术价值
图 7 推荐相关研究资源
但在此过程中,特别需要我们提高警惕,注意对 ChatGPT 答案的真实性和准确性进行判断、交叉验证等。这是因为 ChatGPT 会很“自信地”输出一番胡扯的内容(图 8),如果缺乏相关背景知识的话,就很容易被误导。此外 ChatGPT 无法提供生成答案所依据的特定参考文献(图 9),也提升了对内容交叉验证的难度。
图 8 对某数字藏品平台的一番胡扯
图 9ChatGPT 无法提供答案的参考文献
除了可以提供研究主题相关的知识外,ChatGPT 也可以在数据分析等阶段对数据分析的方法、实现代码提供直接的指导,比如“如何使用 Excel 计算平均值、TGI 指数”(图 10),ChatGPT 就给出了公式和操作步骤,研究员照着答案操作即可。但目前 ChatGPT 对常用的数据分析软件 SPSS 的支持效果有限,比如“根据变量 A 的选项生成新的变量 B”的 SPSS 语句(图 11)就是错误的,猜测和 ChatGPT 训练数据集中 SPSS 相关知识内容较少有关。
图 10 ChatGPT 对使用 Excel 计算平均值、TGI 指数的指导
图 11 针对 SPSS 语句实现,ChatGPT 给出错误答案
但总的来说,作为高效整合内容的搜索引擎,ChatGPT 可以帮助研究员快速地了解相关的研究主题,辅助和启发研究方案设计等,也能提供数据分析方法的指导。但在此过程中,需要研究员特别注意 ChatGPT 答案的真实性、准确性,且目前对 SPSS 的支持不如 Python、Excel 的效果好。
2. 能力多样的“配菜员”
ChatGPT 在用户研究工作中,第二个可能的应用是作为能力多样的“配菜员”,从访谈逐字稿、问卷数据中提炼关键信息,或者根据研究员的诉求提供诸如方案设计、问卷大纲等多种建议,提高研究员分析数据获得洞察、撰写访谈提纲或者问卷等任务的效率。
在这一部分,让我印象最为深刻的是 ChatGPT 分析总结原始数据的能力,比如我根据真实用户的访谈记录改编出以下三个用户对使用过的数字藏品平台的评价:
用户 1:“我玩的跟他差不多,也就两个,一个平台 A 一个平台 B,像那种官方发出来的那种在自己那里抽奖的那些我也会看,但是像那种野牌子我一般是不会去玩,那种野牌子感觉没有什么大公司,我怕我买完收藏了,他就什么都没了,这种就不会错的。然后区别其实我主要是看文物的,别的我其实看的少,我感觉也没啥区别。”
用户 2:“首先第一个最大区别就是因为国内的数字藏品发售的话都是以公司为主题,但是国外的首先他只是在中介平台上传自己的图片,然后进行发布,这其实是国内外最大的一个区别,然后国内的区别的话,第一个我觉得是公司可信度不同,就比如说在平台 B 上面买的话我完全不用担心这个数字藏品会不见了,然后还有就是小公司的话就是像他说的会非常容易怕跑路,我收藏的东西就不见了,然后每个平台的话其实他会有锚定的点,就是我发售的藏品的主题内容会有什么不同,有一些他会发售类似说什么古代人物这种,有一些像平台 B 这种的话就是主做博物馆里面的藏品什么的,还有类似我刚才说的明星那种,就每个做的内容他会不同,大概就这些。”
用户 3: “我主要玩的话就是平台 C 和平台 D,他们不同的话那个平台 D 大部分都是古风还有文物之类的,然后平台 C 很多衍生的吧,就改的比较厉害的,很多二创的那种,然后他发行的东西也就不一样,就经常很多种类嘛,买的就比较多了,平台 D 就要少一点,他那个发行时间要慢一点,东西就少一点,可以选择就少一点。”
然后让 ChatGPT 从中总结出和数字藏品平台有关的关键信息(图 12)。我们看到 ChatGPT 总结的质量已经比较高了,基本上覆盖了用户提到的关键点,比如平台可信度很重要、不同平台的内容存在差异等。虽然 ChatGPT 的总结还仅限于原文观点的提炼,而不能进行更多的关联分析(比如从第一点平台可信度可以得出用户需要平台背书来确保数字藏品的安全,但基于区块链的数字藏品在技术上本身就具有永久有效、公开透明的特性,造成这种差异的原因可能是现实中数字藏品依然依托于中心化平台的运营,也可能是用户对数字藏品的技术特性缺乏认同等),但已经可以很好地作为进一步提炼洞察的材料了。
图 12 ChatGPT 总结出的与数字藏品相关的关键信息
除了总结访谈记录,ChatGPT 也能从问卷数据中得出关键信息,比如表 1 是两种数字藏品用户类型在选购数字藏品时,会主要考虑哪些因素的统计数据(非真实数据):
表 1 收藏用户和投资用户选购数字藏品时主要考虑的因素(非真实数据)
我们可以让 ChatGPT 分析两种类型用户在选购因素上的差异(图 13),甚至可以直接让 ChatGPT 根据选购因素得出如何设计数字藏品的建议(图 14)。可以看到,和访谈记录总结类似,ChatGPT 能够针对统计数据得出初步分析结果(比如两种用户更看重的选购因素),但需要研究员在此基础上做更深度的洞察提炼。
图 13 对比两种用户在选购因素上的异同
图 14 根据选购因素得出数字藏品设计的建议
此外,ChatGPT 还可以针对研究方案(图 15 和图 16)、访谈提纲(图 17 和图 18)、访谈中追问(图 19)、问卷设计(图 20)、数据可视化(图 21)等提供初步建议,这些建议的质量参差不齐,总体来看离真正可用的方案、提纲等尚有不小的距离(比如问卷题目和选项过于简单、数据可视化建议效果不佳等),但已经可以用来启发研究员在此基础上修改完善。
图 15 ChatGPT 撰写研究计划
图 16 追问研究对象如何分组
图 17 撰写深度访谈大纲
图 18 根据访谈提纲追问具体的访谈问题
图 19 访谈中追问什么问题
图 20 撰写问卷题目和选项
图 21 数据可视化建议
总的来看,ChatGPT 在用户研究的多个环节中均有着扮演“配菜员”的潜力,如分析访谈记录、问卷数据,总结其中的关键信息,或者就研究方案、访谈提纲、问卷题目等提供建议。从目前的效果来看,ChatGPT 的答案并不是真正可用的方案、提纲、问卷、洞察等,但确实可以提高如总结访谈记录、分析问卷数据的效率,为研究员进一步分析,得出更高价值的洞察提供了丰富的原材料。
3. 提升内容表达的润色工具
ChatGPT 修改文案的能力在用户研究工作中也有用武之地,比如修改问卷题目、报告内容中的错别字。如图 22 所示,ChatGPT 成功识别并修改了“参于”、“资质”、“隆资”这几处错别字,并在“甚至”前添加了逗号提升表达准确性。其修改效果还是比较惊艳的。
图 22 错别字修改
此外相信有不少研究员在撰写英文报告时,担心自己写出的句子比较生硬、词不达意。在这方面,ChatGPT 可以很好地帮助我们提升英文报告的表达,比如使用更精准更地道的词汇、更符合英语母语的表达习惯等。
要实现这一点的话,需要用到 ChatGPT 更“高端“的玩法,即通过适当的提示语(Prompt)让 ChatGPT 扮演特定风格的英文翻译,将输入的内容在不改变其意思的情况下,翻译成更优美高端的英文(当然也可以尝试其他风格,比如更 concise 等):
I want you to act as an English translator, spelling corrector and improver. I will speak to you in any language and you will detect the language, translate it and answer in the corrected and improved version of my text, in English. I want you to replace my simplified A0-level words and sentences with more beautiful and elegant, upper level English words and sentences. Keep the meaning same, but make them more literary. I want you to only reply the correction, the improvements and nothing else, do not write explanations. My first sentence is “很高兴认识你"
图 23 展示的就是“数字藏品交易的投机炒作氛围浓厚,买家会面临如庄家控盘、平台跑路、内容侵权、无人接盘等风险”这句话的英文翻译结果,和直接翻译的结果对比(图 24),确实效果更好一些。
图 23 翻译并提升英文表达
图 24 直接翻译成英文
总的来说,ChatGPT 在修改错别字、提高英文表达方面均有不错的表现,确实可以帮助我们更高效的润色输出的内容,比如访谈提纲、问卷题目、洞察报告等。
4. 用户访谈降本增效的“模拟器”
在作为润色工具的部分,我们分享了 ChatGPT 的“高端”玩法,即使用 Prompt 将其“调教”成特定风格的英文翻译。这种玩法可以使 ChatGPT 扮演各种各样的角色,比如心理咨询师、面试官、体育评论员等等(在此推荐一个相关 Prompt 的 GitHub 仓: https://github.com/f/awesome-chatgpt-prompts ),让 ChatGPT 的应用场景扩展了不少。
回到用户研究,很自然地就会想到:让 ChatGPT 扮演主持人的角色,访谈用户的效果如何,能不能自动化访谈?或者反过来,让 ChatGPT 扮演某类典型用户接受访谈,它的回答和真实用户的回答相差多少?能不能作为典型用户的初步洞察?
我们先来看下 ChatGPT 扮演主持人访谈用户的效果(图 25),这里我让 ChatGPT 扮演成一位访谈主持人,目的是通过询问用户问题来弄清楚“数字藏品(NFT)的核心用户价值是什么”,相应的 Prompt 是:
I want you to act as an user interviewer, you job is to figure out the core user value of NFT. I will be the user and you will ask me the interview questions about NFT. I want you to only reply as the interviewer. Do not write all the conversation at once. I want you to only do the interview with me. Ask me the questions and wait for my answers. Do not write explanations. Ask me the questions one by one like an interviewer does and wait for my answers. My first sentence is “Hi”
我们看到 ChatGPT 的表现还是比较惊艳的,它没有直接询问“你觉得数字藏品有哪些核心价值?”,而是从如何理解数字藏品这个概念入手,询问了一系列相关问题,比如如何知道数字藏品、如何在日常生活中使用数字藏品、数字藏品最大的好处等等。虽然在这个 case 中,ChatGPT 并没有能够结合上下文来追问用户,但当前的表现已经足以让我们思考 ChatGPT 是不是能够代替我们自动访谈用户,就一些简单的、结构清晰的研究问题提供访谈洞察。
图 25 ChatGPT 扮演主持人访谈用户
看完 ChatGPT 扮演主持人的效果,让我们继续看下它扮演某类典型用户接受访谈的表现(图 26)。首先通过以下 Prompt 让 ChatGPT 扮演一位年轻的数字藏品用户:“她”是一位 20 岁的在校大学生,爱好广泛比如聚会、看电影、逛街等等。然后就可以通过询问数字藏品相关的问题来挖掘“她”对数字藏品的看法。
I want you to act as a NFT user, you are a 20-year-old college girl, you have a lot of hoppies, like partying, watching movies, shopping with your besties etc. I will be the interviewer and I will ask you the interview questions about NFT. I want you to only reply as this girl. Do not write all the conversation at once. Wait for my questions and give me answers. Do not write explanations. My first sentence is "Hi"
图 26 ChatGPT 扮演典型用户接受访谈
总体来看,ChatGPT 的表现持续惊艳,比如询问“她”是如何知道数字藏品的,“她”给出的回答是“玩数字藏品的好友分享给她的”。当重复“她”觉得 NFT 很 cool 的看法后,“她”回答到“数字藏品改变了我们对数字世界所有权和价值的看法”等。这些回答从主观感受上看确实很贴近我们访谈到实际用户。
所以展开想象力,这会不会改变今后用户研究的流程?比如在访谈真实用户前,能不能先让 ChatGPT 扮演几种典型用户来获得初步洞察,之后再进行真实用户访谈以验证和补充?当然在此之前还有很多的问题要回答,比如如何使用 Prompt 更准确地描述典型用户(如需要哪些变量?),ChatGPT 扮演典型用户的准确性和有效性有多高等等。但无疑 ChatGPT 的表现已经足以让我们开始类似的思考。
总结 总结一下,通过上述初步的探索,我会觉得 ChatGPT 在未来的用户研究工作中,可能成为降本增效的辅助工具:作为高效的搜索引擎,提升获取知识的效率;也可以作为能力多样的“配菜员”,提供诸如访谈初步总结、数据分析结果、访谈大纲等内容,辅助研究员完成研究设计、洞察分析等;还能作为内容(尤其是英文内容)的润色工具,修改错别字、转换不同表达风格等;最后也显示了其作为主持人执行访谈或者扮演典型用户接受访谈的潜力。
当然 ChatGPT 距离真正可用的用户研究辅助工具还有一段距离,比如需要用户研究领域的知识对模型进行 Fine-tune 以提升答案质量,再比如需要定制化的交互方式,以提升在用户研究工作中,与 ChatGPT 交互的体验和效率等等。
此外,对于有兴趣继续探索 ChatGPT 应用的同学,分享三个 Tips:
多试几次,以比较不同的回答; 学会提问,明确需求,由粗到细引导,并且注意之前输入内容的影响; 保持独立思考和批判性思维,时刻警惕内容的真实性、准确性,避免被 ChatGPT 牵着鼻子走。 最后,对于 ChatGPT 能否替代用户研究,我认同:“AI will not replace you. A person using AI will.
欢迎关注作者「腾讯CDC体验设计」的微信公众号:
-
设计系统搭建全流程:开始前的准备工作
UI交互 2023-04-06上一篇文章我们主要讲的是设计系统的必要性,接下来我将会继续用后续的文章详细讲解怎么搭建设计系统,希望可以帮助到有需要的人。上篇回顾:设计系统搭建全流程:认识设计系统设计系统这个词,是近些年的一个热门话题,在初期的讨论关注点主要聚焦在是否有必要搭建?阅读文章 > 在开始之前,我需要先解释一个问题:为什么要制作...上一篇文章我们主要讲的是设计系统的必要性,接下来我将会继续用后续的文章详细讲解怎么搭建设计系统,希望可以帮助到有需要的人。
上篇回顾:
设计系统搭建全流程:认识设计系统 设计系统这个词,是近些年的一个热门话题,在初期的讨论关注点主要聚焦在是否有必要搭建?
阅读文章 >
在开始之前,我需要先解释一个问题:
为什么要制作自己的设计系统
很多团队一提到搭建设计系统,就会有人说,网上有很多公开的设计系统,我们直接使用现成的不好吗?为什么要费时费力的搭建自己的设计系统,真的有必要吗?
首先,网上公开的设计系统,一般是指该企业的设计语言,是该企业产品的设计基石。但是这并不适用于所有的团队,比如,笔者所在行业是 HMI 行业,但是网上的设计系统基本上都集中在 pc 端,那么就有很多的规则无法在 HMI 设计中使用,毕竟设计系统的建立是为了提高效率,不能使用或者不合适的设计系统很有可能对设计造成阻碍。
如果对网上公开的设计系统了解多的话,就会发现,很多的 设计系统 对研发更加友好,但是并不适合 设计师 使用,它更多是一个说明文档,让别人看的,但不能用。所以对于一定规模的团队来讲,搭建自己团队的设计系统就势在必行了。
一、如何搭建设计系统 1. 搭建重点
要有全局观,创建的设计系统要是可维护的,可迭代的,要保证设计系统的适应性。
凡事有度,不要追求大而全,要根据公司产品,创建合理的设计资产,毕竟设计系统为的是更好用,提高效率。
2. 搭建流程
由于设计系统搭建需要多角色、多部门协作,如果公司或者团队无法组建一个完整的设计系统团队,那么我们就需要循序渐进,慢慢扩展设计系统的边界,让设计系统逐渐成长,完善。
一般来讲,刚开始搭建设计系统的是设计师和开发人员,以设计师为主,梳理当前业务的完整页面,提炼相同的元素,构成初版的设计系统,并在构建期间,和开发紧密协作,及时沟通。对设计出的组件进行代码化,同步搭建研发的基础组件库。当完成以后,可以加入动效规范、声效规范、图标规范……逐步的去完善设计系统,最终形成团队的设计资产库。
3. 使用工具
由于笔者是 HMI 设计师,所以只针对设计师在用的工具进行简单描述,其他角色的工具就不进行缀续了。
对于目前的设计师来讲,用得最多的就是 Sketch 和 Figma 了,Sketch 对于 UI 设计师来讲大都非常熟悉,Figma 更是最近几年设计协同的利器,虽然这两个软件都是设计软件,但是由于这两个软件底层逻辑并不相同,所以在制作设计师的样式库和组件库时略有不同,如果后续有必要的话,我会专门出一篇文章来讲解怎么用 Sketch 和 Figma 创建 UI 控件组件库。
二、设计资产 随着设计系统逐步完善,设计资产也会越来越多,最开始是 UI Kit 和开发代码库。然后慢慢扩展设计系统边界,增加其他内容。总的来讲,包含以下内容:
设计价值观及原则 样式库 控件组件库 设计说明文档 开发说明文档 图标库 动效 声效 ……
三、设计语言 为了让设计系统可以保持统一性和延展性,那么必须要有一个统一的设计指导理念,让每一个使用者可以通过设计语言,明确我们的设计目标和方向,减少设计中出现的偏差。所以对于一个设计系统来讲,提炼自己的设计语言是必要且有效的。
下面可以先看一看一些公开的设计系统的设计语言:
1. Microsoft Design
Fluent Design System 组成构件的设计理念就是:Light, Depth, Motion, Material, Scale.
2. Apple Design
苹果的设计规范包括:完整性,一致性,直接操作,反馈,隐喻,用户控制等几个设计原则。
3. Ant Design
Ant Design 设计价值观包括自然、确定性、意义感、生长性。
4. Arco Design
Arco Design 基于「清晰」、「一致」、「韵律」和「开放」的设计价值观,试图建立务实而浪漫的工作方式。
5. TDesign
TDesign 为了在开源体系的基础上打造具有自身品牌特色且好⽤的产品,秉承包容、多元、进化、连接的价值观。
通过对上述公开的设计语言的学习,我想大家都应该对设计语言的必要性和内容有一定的了解了,那么在开始进行设计系统搭建之前,先为你的设计系统构建专属于你的设计语言吧。
四、组件库分类逻辑 接下来我们就进入到设计系统的具体设计了,对于那么多的设计元素,我们该怎么进行分类呢?由于业务组件和元素划分完全取决于不同公司的实际需求,并无定式,所以我这里说的组件库划分主要指基础组件库的划分。并且并不一定适合所有团队。仅供参考。
接下来我们先来看下一些设计系统的组件划分:
Ant Design 的组件划分为:通用组件,布局组件,导航组件,数据录入和数据展示组件,反馈型组件、其他组件和重型组件。
TDesign 的组件划分为:基础组件、布局组件、导航组件、输入组件和数据展示组件、消息提醒组件。
Arco Design 的组件划分为:通用组件,布局组件,数据录入和数据展示组件,反馈型组件、导航组件和其他组件。
……
这些分类都是非常合理的划分,所以我们在设计组件库时可以参考或者直接使用。不过这里我想提一些不同的意见,因为组件库的分类主要是为了好用,便于识别,虽然上述的分类标准很清晰,但是也出现了过于详细的问题,那么我们在找一些需要的控件组件的时候,就需要先去思考它属于哪个分类下,所以需要团队内的成员对组件库的分类标准非常清晰,并且对于每个控件组件的归类也非常清晰。
在我构建组件库的分类时,为了尽可能的减少使用者的学习成本,所以用最简单的分类方式进行划分:全局样式、基础控件和系统组件三种分类。
通过简单的进行分类,大家不需要增加学习成本,可以更好的找到需要的控件组件,方便调用,也方便于资源库的推广。以上只是我这些年工作的经验之谈,仅供参考。
总结 本篇文章主要是想要和大家讲述下具体搭建设计系统之前的工作,不管是设计语言还是组件库分类,都是为了让我们的设计系统搭建的更加具有逻辑性。所以还是很有必要的,但是由于笔者是在 HMI 行业做设计师的,所以很多内容是具有很强行业特性的,大家不必完全保持一致,可以根据自己具体的团队和实际情况进行适当调整。还是那句老话,设计系统是为了提高效率。所以好用、易用是我们的一切出发点。接下来我们就进入到设计系统的详细设计阶段了,敬请期待!