-
阿里大模型也来了,聊聊我的几点看法
设计动态 2023-04-10距离阿里大模型推出时间越来越近,市场上的声音也比较杂,由于近期张勇刚刚宣布了阿里巴巴成立24年来最重要的组织变革决定,大模型隶属的云智能集团由逍遥子直接负责,这件事就变得更加微妙起来。 《新眸》也第一时间拿到了阿里大模型的测试邀请码,体验下来最直观的感觉是,可近日,阿里版ChatGPT“通义千问”官宣对外开放企业邀测,不少人也已经拿到了邀请码进入测试。那么,回顾目前有关大模型应用的消息,当前这一领域的发展,已经行进至了哪一阶段?一起来看看作者的分析与看法。
距离阿里大模型推出时间越来越近,市场上的声音也比较杂,由于近期张勇刚刚宣布了阿里巴巴成立24年来最重要的组织变革决定,大模型隶属的云智能集团由逍遥子直接负责,这件事就变得更加微妙起来。
《新眸》也第一时间拿到了阿里大模型的测试邀请码,体验下来最直观的感觉是,可圈可点,反应速度还不错,但无论是百度还是阿里,大模型还停留在transformer水平,并没有涌现出对于文本出色的理解能力。
总体上说,通义千问和文心一言在能力上还是旗鼓相当,但这才刚刚开始,相比文本问答能力,其实我们更好奇“通义千问”接下来的动作。
因为就行业层面来看,由于字节跳动节奏感未知(原阿里M6大模型带头人现加入字节AI Lab),第一梯队的关注点更多落在了腾讯、百度、阿里和华为身上,一是这几家公司都有这方面的底蕴和人才技术储备,二是因为从业务上看,这几家大厂都需要大模型的支持。
现在百度已经勇敢地迈出了第一步,发布了初阶版本的文心一言,但囿于当时百度比较激进的品牌打法,导致外界对于阿里大模型的期望更大了,但据《合纵投研》披露出的信息,现在阿里大模型仍处于追赶GPT 3.5的阶段,距离GPT 4还有一段路要走。
造成这种“卡脖子”的关键因素主要有3块: 一是数据量,这个权重占比30%左右;二是大模型结构的创新性,目前国内还做不成高层级的架构,这个权重占比在40%-50%左右;最后的30%权重是工程化落地,现在这块国内也没有比较好的参照。
再联想到Open AI以及它背后的GPT的进化逻辑,大家已经开始意识到,这次的AGI较量已经不单单是财力和人力上的比拼,而是从理论、到工程、到产品,再到商业、人文上的全面的颠覆,回到阿里大模型这件事上,或许我们更应该把关注点放在大模型和阿里现有业务模块的应用上。
清华大学智能产业研究院院长、中国工程院院士张亚勤曾在近期聊到过这个话题,他认为可以把GPT这个系列的生成式AI模型看作一个由大模型组成的AI操作系统,和当年PC上的windows,以及移动的安卓、IOS基本具有相似的意义。
而一个新的操作系统的诞生,往往意味着下面的硬件、上面的应用都会被重构,形成一个全新的生态。甚至他还断言,如果说PC互联网的生态价值是1X,移动互联网的生态价值是10X,那么AI生态至少是100X。
张亚勤的判断很大程度上来源于微软和Open AI的结合,有了GPT 4的加持,微软曾经一度式微的业务板块都变得富有想象力,其中就包括此前被打得节节败退的搜索业务Bing。
这也解释了为什么包括百度、阿里、华为在内的大厂们都纷纷押注大模型,说白了,chatGPT就是一个钩子,如果你还把目光放在大模型会如何颠覆搜索场景,那我只能说你不仅不懂大模型,而且不懂商业玩法,这也是很多大厂选择下场的真正原因,即便它现在看起来还比较模糊。
确切地说,这和几年前被资本催熟的“假风口”有着本质上的不同,LLM、包括AGI是已经得到微软验证的真风口,甚至还一度被埃隆·马斯克警告——人工智能正在朝着人类不可控的方向演进。
很显然,马斯克的担忧更多的是伦理和道德层面上的,这也是人工智能这门科学最让人敬畏的地方,一旦被别有用心的人和公司操纵,它极有可能带来比较大的灾难。但如果我们在规范和法律标准下看LLM和AGI,它明显是个很好的工具,就像是一个人类智慧收纳盒,通过大模型的方式进行能力输出。
结合目前微软的动作来看,大模型在云计算、文本办公、搜索领域都有着很好的契合点。不难推测,国内的大模型方向也会依葫芦画瓢,先从这几个方面开始试点,巧合的是,这几块业务阿里都有,云有阿里云、文本办公有钉钉、搜索有夸克。
更重要的是,阿里还有微软手上没有的底牌—— 电商 。电商是阿里巴巴的根基,但就像亚马逊之于贝索斯,面对直播电商、兴趣电商等各种势力的崛起,地盘被冲击,这块一直是阿里巴巴这些年难以言说的“心病”。
所以对于阿里来说,大模型得做、而且必须要做,即便增收路径模糊,但它也有可能是一个很好的智能工具,而且,要远比前些年搭建的数据中台想象力更高一些,前端的灵活性,其实可以让阿里找到新的增长可能性。
关于LLM和AGI,现在大家的想法还是比较局限的,就比如针对“大模型究竟会颠覆什么”这个问题,我们在给出答案时,可能更倾向于回答“大模型不能颠覆什么”。造成这种局面的原因,既有大众认知水平的因素,也有行业发展现状的因素。
这就跟看科幻片同一个道理,早在10几年前,我们就能在美国大片里看到各种智能的场景,但事实上,即便发展至今,我们距离所谓的AGI还有很长一段路要走,但可以确定的是,以百度、阿里为首的大厂纷纷下场后,真正的人工智能浪潮已经开启。
在长达10年的移动互联网浪潮中,生活中很多场景被颠覆,衣食住行,无一例外。但如果你深究的话,这种变化的根本原因其实是由供需端在成本因素上推动的,总有性价比更高的方案出现,然后替代掉老旧的方案,这是数字经济时代的新法则。
所以如果我们把视角放在大模型的供需视角来看,会发现,这个市场还远未被很好地开发。就像在特斯拉出来前,没有人会想到当年的全球霸主丰田汽车会受到如此大的挑战,按照这个逻辑推演的话,现在市面上所有的判断,都不可信,或者说不可全信。
也许再过一年后,随着这些大厂陆续把大模型应用起来,做到既好用,又实惠,可能我们对大模型的理解或许会更客观些。
最后聊聊大家最关心的失业话题,这个问题很显然过于杞人忧天了。
很多时候,我们往往过度高估了人工智能,而低估了我们自己的创造力。
作者:桑明强
来源公众号:新眸(ID:xinmouls),专注于全球商业科技研究
本文由人人都是产品经理合作媒体 @新眸 授权发布,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
{{{path> 收藏 已收藏 {{ postmeta.bookmark }} {{{path> 点赞 已赞 {{ postmeta.postlike }}
-
B站UP主停更背后
设计动态 2023-04-10“暂时告别,有缘再见。” 3月31日,B站游戏UP主“靠脸吃饭的徐大王”发布视频宣布停更,黑底黄字在屏幕上定格,“等你回来”的弹幕齐刷刷飘过。而他,并不是唯一一个停更的UP主。 关掉一个停更视频,再满怀惆怅地点进另一个,用户好奇的除了“怎么了”,还有“为什么”最近有关B站UP主停更的消息引起了外界众多关注,而在这一消息背后所展露的,其实是UP主、品牌与平台方在ROI上的“共同追逐”,这也要求B站加快商业化步伐,找到合适的商业化发展道路。具体如何理解?一起来看看作者的解读。
“暂时告别,有缘再见。”
3月31日,B站游戏UP主“靠脸吃饭的徐大王”发布视频宣布停更,黑底黄字在屏幕上定格,“等你回来”的弹幕齐刷刷飘过。而他,并不是唯一一个停更的UP主。
关掉一个停更视频,再满怀惆怅地点进另一个,用户好奇的除了“怎么了”,还有“为什么”。尤其是当停更原因涉及变现焦虑,与UP主“为爱发电”及平台商业化相关的讨论又一次将B站送上了微博热搜,且不止一个。
截至发稿,B站并未对此给出官方回应。不过,“停更潮”的表述或许有待商榷。有接近B站的人士称,B站50万粉丝以上UP主为近万人规模,在此基数上,个位数的停更属于正常范围。
一位B站百大UP主告诉电厂,一些UP主其实只是希望暂时休息一下,或者改变工作室模式之后重新出发。拥有300余万粉丝的UP主“-LKs-”就明确表示,其停更是基于“完全随机的个人放假加装修”,除此之外,“今年发展一切正常”。
然而,问题真实存在。一方面,持续不断的视频创作意味着精力、成本的巨大消耗,部分以此为生的全职UP主不仅期待正向反馈,更需要金钱回报。另一方面,强调降本增效的品牌越来越追求ROI(投入产出比),这显然并非B站擅长的商业化方向。换句话说,所谓的“停更潮”背后,其实是一场对ROI的共同追逐,参与其中的不仅有UP主、品牌,还有设立“2024年实现盈亏平衡”目标的B站。
一、UP主创作需要动力 停更一年半之后,知识区UP主“正文”偶尔登录B站账号,却依然不敢浏览账号收到的回复和私信,屏幕右上角的数字定格在“99+”。“心疼粉丝,看到催更,就会觉得对不起他们。”
停更的原因比较简单——读博实在是太累了,更新频率难以保证。和许多知识区UP主一样,正文产出一条视频需要搜集大量资料,每次用时至少10天。由于视频内容围绕城市主题展开,涉及面广泛,为了保证数据的准确性,验证必不可少。再加上文案撰写、视频录制、素材挑选及成片剪辑,“大家看到的可能是半个月或一个月才更新了一条,但实际上我一直都在赶工”。
“单打独斗”不易,以工作室模式运行的UP主同样如此。作为百大UP主,江圆将爱好发展成了职业。她和团队曾经创下连续工作半个月的记录,“只睡了两天,每天大概四个小时”。用她的话说:“多劳多得,想养活团队,付出的肯定会更多。”
目前,B站UP主的变现方式主要包括以下几种:创作激励、充电计划、带货佣金、广告商单与直播收益,分别来自平台补贴、品牌投放与用户打赏。具体到创作激励,其上线于2018年1月。彼时,只要UP主粉丝数量达到1000或视频累计播放量在10万以上,即可加入该计划并获得激励收益。
不过,正文和江圆都认为,创作激励的规则仿佛一个“黑箱”,涉及所在分区、内容质量、互动指标等多个因素,存在一定波动。UP主“宝剑嫂”曾经发布视频透露,2019年账号共获得7000万视频播放量,税后激励收益为7万元,相当于1万播放量获得10元。而在正文的印象中,1万播放量到手约为3元。“B站带来的收入其实不高,何况激励制度调整后还在持续下降,同样的一条视频,之前在西瓜视频不仅播放量更高,播放单价也接近翻倍,收入可以达到B站的4倍以上。”
激励收益对江圆而言可有可无,她更在意的是广告商单——这也是头部UP主最主要的收入来源。根据B站对外披露的数据,截至2021年年底,官方商业合作平台花火已入驻2.2万名UP主、4200个商家,年度合作TOP 5行业为美妆、食品饮料、数码3C、电商和手机游戏。
在花火平台,可以查到入驻UP主的详细信息和具体报价。以宣布停更的游戏UP主“靠脸吃饭的徐大王”为例,其定制视频、植入视频、直发动态和转发动态的报价分别为15万元、12万元、2.5万元和1.8万元。
“靠脸吃饭的徐大王”称,视频创作“真的不赚钱,甚至是亏钱”。以往,江圆平均每月会接到1-2个商单,但在今年,“4月之前几乎什么都没有”。她还发现,越来越多的品牌开始入驻B站。“市场行情变了,品牌自己下场,运营更精细化了。”
二、品牌追求投放效果 有别于以江圆为代表的UP主,品牌显然需要明确而即时的回报。
多个行业降本增效带来的结果是,身处其中的品牌对广告及营销预算进行了缩减。《2022中国互联网广告数据报告》显示,去年中国互联网广告市场规模同比下降6.38%,近七年来首次出现负增长。江圆也被长期合作的客户告知,今年“没钱了”,不得不勒紧裤腰带过日子。
情况同样直观地体现在互联网公司的财报上。2022年第四季度,百度、微博、知乎、B站的广告收入分别同比下滑了6%、29%、27%、5%。
B站副董事长兼COO李旎在财报后的分析师会议上称,进入2023年,随着广告主信心的恢复,预计行业整体仍旧有机会达到两位数增速。她话锋一转:“但广告主还是会比以往更谨慎,更关注投放广告的核心价值是什么,也会更关注广告整体的有效性。”
对接过B站商业化合作项目的王之远向电厂分析,当下,多数品牌不再愿意投放单纯的品宣型广告,而是转向对效果的追求。“特别是电商行业,所以他们讲究流量投放的ROI,相对可控,也相对标准;但UP主商单则不然,定价非常不标准,假如你给一个UP主投放了几十万,内容又没有出圈,品牌的执行根本无法对内部交代。”
王之远透露,B站电商型内容投放的整体ROI约为0.8(即交易总额/投放成本)。她称这个数值“比上不足比下有余”。不过,不能将头部UP主的内容成本计算在内,“那样可能就毫无ROI可言了”。
某种程度上来说,这是品牌与UP主之间的供需关系矛盾,当前者开始寻求确定的增长和健康的ROI,后者却依然停留在以打响口碑、扩大声量为导向的阶段,自然难以满足对方的需求。
一位美妆品牌运营人士表示,其从未也不会考虑在B站进行投放——虽然B站用户乐于表达与分享,消费意愿却不高,UP主能够为品牌创造的收益有限。
从事内容营销工作的李诺认为,品牌与UP主合作的出发点在于对后者“清奇脑洞”的认可。“比如爆改洗地机之类的,很有意思,你会惊叹‘还能这么搞’?”不过,内容引爆只适用于处于人群拓展、声量强化阶段的品牌,如果品牌渴求销量,B站并非最佳选择。
王之远和李诺都提到,B站是“第二梯队投放渠道”。尽管已经加速破圈,但和位列第一梯队的抖音相比,它的流量池还是太小了。在抖音,即使定向投放极其垂直的人群,也能够实现大规模放量(即完成投流、消耗预算),但在B站,“基本不可能”。
“一个新锐品牌在B站的生命周期大概是1-2年,这段时间内品牌势必疯狂地进行投放和流量洗刷,接下来也就没有可以利用的流量了。”李诺说道。
一些UP主抓住了机会。李诺曾经遇到过一位定制视频落地价格达数百万的UP主。“听起来很夸张,但询单络绎不绝,你排着队上门送钱,人家都不一定要。”不过,这终究是少数。华福证券在研报中指出,由于粉丝数量、内容调性、UP主个体差异等原因,B站UP主在商单收入上形成较大的两极差异,加剧了尾部UP主创作热情的流失。
李诺觉得,一些UP主报价过高,也在一定程度上导致其变现艰难。“例如鬼畜、搞笑UP主,还有肩部、中部UP主;植入视频报价在20万-40万的UP主是最尴尬的,品牌看ROI觉得你换不回来,看关注又觉得你影响力不够,这还怎么投放?”
三、B站商业化再向“钱” 品牌的犹豫,也是B站的纠结。
B站的收入主要由四部分组成:包括直播及大会员业务在内的增值服务、游戏、广告和电商。2022年第四季度,B站增值服务收入为23亿元,同比增长24%;电商及其他业务营收为11亿元,同比增长13%;游戏和广告收入则出现了不同程度的同比下降。
值得一提的是,直播在增值服务收入中占比较大。B站2022年的收入分成成本为91亿元,有长期关注内容行业的人士指出,其中多数分给了主播而不是UP主,“为了推进直播业务,在直播的流水分成比例和返点政策上,B站作为平台方让步很大”。
一切都是基于现状做出的选择。在B站董事长兼CEO陈睿看来,2023年B站的业务会更聚焦,整个公司最重要的事有两件:第一件是增收减亏,第二件则是DAU(日活跃用户数量)的健康增长;从而于2024年实现盈亏平衡的目标。
这里的增收特指毛利增长,用于补位的业务可以是直播,也可以是广告。王之远发现,今年起,几乎所有和商业化存在一定关联的B站业务部门,都承担了商业化收入目标。
但这并不意味着大刀阔斧向前迈进。时至今日,B站始终身处保持社区氛围与放手商业化的博弈之中,一举一动都必须顾及用户与UP主生态。2022年,B站进行组织架构调整,人员变动围绕商业化与内容生态两个维度展开,用意不言而喻。
王之远这样总结B站的商业化困境:一是社区型内容平台的历史遗留问题,二是流量瓶颈与用户付费问题,考虑到市场整体下行、品牌投放缩减与内容平台竞争,B站需要进一步证明自身价值。“但无论是直接转化效果还是软性种草效果,B站在品牌端的心智都算不上扎实,很难被优先选择。”
在向品牌推荐B站时,李诺往往突出创意、构思与活力。他清楚地知道,B站不是必选项,除非对方是一个纯粹的二次元品牌。他对接过一个消费品牌,在抖音、快手大手笔投放,在B站适当补量——这并不是孤例。
而井喷式增长不复存在。“今年第一季度市场预期太高,结果多数品牌踩了一个空,第二季度已经开始降低预期,所以今年的情况到底怎样,要看下半年。”李诺补充。
简而言之,B站需要迎接更为激烈的竞争,优势尚在,对手强劲——只有从抖音、快手、小红书等玩家手中抢夺更多的品牌预算,才能够为嗷嗷待哺的UP主提供更大的粮仓。
江圆始终坚持在B站更新,她喜欢这种和同伴一起赚钱、一起朝着一个方向努力的感觉。视频创作使她收获了认同感,她觉得自己没有理由放弃。“没有广告投放也没有关系,我们谁有钱就出钱,这是一件很开心的事情,而且只要一直做下去,总会有回报的。”
她知道B站的商业化“做得确实不是很好”,却也明白,作为UP主,不可能要求平台永远蒸蒸日上、输送源源不断的激励。“你没有给平台带来多少实质性收益,平台为什么供养你?”
更重要的是,B站从不缺少关注的目光。“平台讨论度那么高,说明这里是被在意的,而不是只有关停、下线才引发讨论。”江圆相信,一些停更的UP主会以其他方式回到这里,而B站也会找到一条适合自身的商业化道路。
(文中受访者均为化名。)
作者:何畅,编辑:高宇雷
原文标题:电厂 | B站UP主停更背后:为爱发电 为钱发愁
来源公众号:电厂(ID:wonder-capsule),探索科技公司的未知,为你充电。
本文由人人都是产品经理合作媒体 @电厂 授权发布,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
{{{path> 收藏 已收藏 {{ postmeta.bookmark }} {{{path> 点赞 已赞 {{ postmeta.postlike }}
-
长短视频“握手言和”背后,拐点已至?
设计动态 2023-04-10抖音攻势凶猛,连腾讯视频也“停火”了。 4月7日,抖音与腾讯视频官宣合作,双方将围绕长、短视频联动推广及短视频二次创作等方面展开探索;其中,腾讯视频将向抖音放开长视频版权授权,并明确了二创方式、发布规则。 此举意味着,抖音集团旗下的抖音、西瓜视频、今日头条等平这几年有关长短视频之争的讨论一直没有停过,而近日,长、短视频似乎又有“握手言和”的打算了,抖音与腾讯视频正式官宣合作,表示双方将围绕长、短视频联动推广及短视频二次创作等方面展开探索。那么此次长短视频选择“牵手”背后,体现了怎样的发展趋势?
抖音攻势凶猛,连腾讯视频也“停火”了。
4月7日,抖音与腾讯视频官宣合作,双方将围绕长、短视频联动推广及短视频二次创作等方面展开探索;其中,腾讯视频将向抖音放开长视频版权授权,并明确了二创方式、发布规则。
此举意味着,抖音集团旗下的抖音、西瓜视频、今日头条等平台创作者以后可以光明正大对腾讯视频影视版权进行二创(将影视作品重新剪辑、配音、改编的创作)。
官宣合作截图
事实上,从“头腾大战”到“猪食论”的互呛,腾讯视频与抖音没少在影视版权上“撕破脸”——天眼查显示,截至 4 月 7 日,北京抖音信息服务有限公司涉及的司法案件中超 600 件与腾讯相关;2022 年,《云南虫谷》侵权案判罚抖音赔偿腾讯 3200 万元更是轰动一时—— 可 如今,怎么连腾讯视频也被抖音拉到了同一战壕?
核心原因在于:近两年抖音、快手攻城拔寨、势如破竹,而优爱腾版权价格高企、在亏损泥潭越陷越深(优爱腾十年内共计烧光 1000 多亿元仍看不到盈利预期),持续承受着资本与市场的苛责;然而 2022 年,浓眉大眼的爱奇艺通过“降本增效”、会员涨价、“攀”上抖音等操作,踉跄从亏损泥潭抽身,连续四个季度实现 Non-GAAP 运营盈利,超预期完成年度目标。
“2022 年,活下去成为长视频平台的共识,爱奇艺在‘优爱腾’里压力最大,因为其单独上市所有数据都会被放大审视。” 一位券商研究员对虎嗅表示,爱奇艺将版权生态与抖音绑定,对其盈利模式和发展态势都是一种正向努力。
面对此情此景,腾讯视频也回过味来了,放低姿态握住了抖音的“手”。
当然,监管也乐见其成——上个月举办的第七届中国网络版权保护与发展大会期间,中国版权协会发布的《 2022 年中国版权十件大事》提到:短视频平台作为数字版权领域的新兴产业,加强与长视频平台的版权合作,获得更多长视频版权授权,对行业版权治理和共赢发展具有积极意义。
如此看来,抖音与腾讯视频“牵手”,是长、短视频平台的又一次握手言和——此前抖音与搜狐视频、抖音与爱奇艺、快手与乐视视频的合作莫不如是,也是长、短视频平台二创竞合趋势的延续。
一、腾讯鏖战字节的核心矛盾 如果将时间齿轮向前拨动五年,虽然 2018 年 5 月 7 日,张一鸣与马化腾的朋友圈 Battle 才将“头腾大战”推至台前,但腾讯与字节的缠斗其实贯穿整个 2018 年——据媒体统计,当年腾讯与字节跳动的司法纠纷高达 487 起。
此后,双方频频“过招”,产品封禁和版权诉讼是绕不开的两大主线—— 尤以 2021 年 6 月,腾讯高管“猪食论”呛声短视频,字节与腾讯的关系越发剑拔弩张。
这背后,短视频浪潮对优爱腾的冲击远比外界看到的要猛烈——据《 2023 中国网络视听发展研究报告》显示:截至 2022 年 12 月,我国网络视听用户规模达 10.4亿,泛网络视听产业市场规模为 7274.4 亿元,较 2021 年增长 4.4% ;其中,短视频领域市场规模为 2928.3 亿,占比 40.3%,是产业增量的主要来源—— 也就是说,抖音、快手为代表的短视频平台一路狂奔,注意力经济正在被解构甚至重新洗牌,长视频遇到了前所未有的挑战。
如今回头看,挑战其实早已埋下“伏笔”——自 2018 年 12 月,抖音、快手单月用户时长在视频领域占比第一次超过优爱腾后,短视频便一路高歌猛进,长视频则颓势尽显。
虎嗅与数位短视频产业从业者沟通发现:行业环境变化的根源,其实在于用户需求的迭代。
一方面,用户对信息获取效率、内容密度的要求越来越高,碎片化、娱乐化、在线社交需求的激增恰恰为短视频野蛮生长提供了土壤——基于此,用户注意力正随着内容形式演化(图文-短视频)而迁徙,用户越沉迷抖音、快手即时反馈的爽感,短视频的渗透率、互动粘性曲线也越发陡峭。
另一方面,当工作、生活竞争越发“内卷”的情况下,时间对用户变得越来越重要,用户的内容喜好及消费习惯正在发生改变—— 他们更愿意牺牲一些体验换取更碎片化、便捷的娱乐方式,而短视频无疑成功完成了新娱乐方式的驯化。
那么,用户需求迭代背后,长短视频战争的本质到底是什么?
博主@湾区林斯基曾一针见血指出,长、短视频混战的本质是资本与劳动者之间的战争: “长视频代表资本模式买版权内容,短视频用密集劳动生产与技术算法迭代做内容,所以资本只能用钱垒高版权门槛,劳动者能够通过产品形成文化门槛。”
至少从用户基本盘看,资本模式做内容的优爱腾溃败给了劳动与技术模式做内容的抖音、快手 ——近两年抖音、快手、B 站在流量优势与内容成本优势下已开始倾斜资源孵化自制剧(低成本、低门槛、高回报)、短剧(抖音、快手相继布局微短剧赛道)、综艺(B 站正持续加码自制综艺),一系列举措会慢慢侵蚀长视频的业务边界,并进一步挤占长视频的商业空间。
顺着这个逻辑,当注意力经济被短视频解构时,流量迁徙的方向代表着巨大的商业潜力,而长期以来, 会员付费和广告收入是视频平台收入的两大支柱。
先说会员付费,这块业务的新营收增长点来源于提高 ARPU 值(单个用户消费金额)和 ARPPU 值(单个付费用户消费金额)——前一个 ARPU 值(单个用户消费金额)其实“优爱腾”玩得挺溜,比如会员“套娃”,充了 VIP 还有 VVIP 等你,看个剧广告时长硬是从 60 秒拉到 90 秒再到 120 秒,甚至剧中还要插播广告;后一个 ARPPU 值(单个付费用户消费金额)最简单的手段就是会员涨价,优爱腾割起用户来也“不遑多让”。
再说广告大盘,近三年疫情对市场冲击严重,那就参照疫情前的 2019 年:国家市场监督管理总局发布的《 2019 中国广告年度数据报告》显示,2019 年广告市场总体规模达 8674.28 亿元,如果去掉户外、央视、电视台等,互联网大约占一半——等于说,无论百度、腾讯、阿里、分众等老牌劲旅,还是字节跳动、快手、B 站这些新贵,亦或是多如牛毛的中小企业,抢来抢去不过是在“内卷”。
尤其,再遇上 2022 年低气压的市场大环境,各家平台对广告份额的抢夺早已贴身肉搏,狼多肉少的情况下肯定有人“饿肚子”。
值得玩味的是,4 月 3 日字节刚刚“秀过肌肉”—— 据知情人士透露称,字节跳动 2022 年营收超 800 亿美元(5514亿元人民币)直逼腾讯,较 2021 年的 600 亿美元涨超 30% 以上, 而腾讯去年营收同比下降 1% 至 5545.5 亿元人民币。 其中,字节大部分收入增长来自核心广告业务,其广告收入较 2021 年翻了 2.5 倍,达到 100 亿美元左右。
对此,一位品牌商向虎嗅表示:“首先,品牌此前投长视频植入要理解和接受不同的核算机制,但短视频与长视频、直播不一样;其次,短视频直播做完以后,每个单独短视频都是高光时刻,并能将流量曝光扩大化,因为用户都喜欢看精彩瞬间,产品的曝光、品牌的曝光次数会远高于原来对于长视频的品牌植入。”
所以,谁也没必要和钱过不去,腾讯视频与抖音鏖战的新番终于在 2023 年抓马成了“你侬我侬”的剧本。
二、“头腾大战”拐点已至 从内容来看,抖音 UGC、PGC 是基本盘,UGC 内容生产门槛低,却陷在“速朽”与版权风险的困境里;腾讯内容供给主要是 OGC(腾讯新闻、腾讯视频),“供给方决定用户看什么”会导致人与内容的匹配效率不稳定。
国信证券传媒板块首席分析师张衡曾对虎嗅 Pro 表示,腾讯 PCG 旗下最具 IP 价值的几种内容,无非都是源头端内容。“像音乐、文学、动漫这类内容的生命周期就很长。像电影网剧这类内容产品其实已经到了变现的最后一环,或者是倒数第二环,沉淀价值不如 IP。”
事实上,论资本能力、用户基数、内容储备,腾讯视频已经是脱颖而出的佼佼者,但市场决定供给——一部剧在某个平台出圈后,其他平台很快也会同步上线或推出该类型剧集——那对用户而言,自然是哪个平台上大 IP、出爆款,热度与注意力便一起被带过去。
结果就是,腾讯视频花大价钱采买版权,却并未提升平台对用户的议价能力——抛开平台时不时赌对的爆款,无论第一梯队的爱奇艺、腾讯视频、优酷,还是追赶者芒果 TV、搜狐视频等,现阶段仍未形成一套成熟的优质剧集生产闭环,无法沉淀差异化的竞争力。
于是,各家为了抢播放数据,扎堆将成本投入在取悦当下市场的剧目身上。例如,古装剧、甜宠剧受众服务早就过载了,但架不住市场买单;反而其他小众剧目、跨年龄层用户的视听诉求被选择性忽视。
另一个现实问题是,优爱腾与抖音在内容上渐渐演化出一种相互依附的局面。
《 2021 中国网络视听发展研究报告》显示,有超六成的观众是先被短视频吸引才去观看同名长视频节目;而巨量算数在 2020 年公布的《抖音用户画像报告》,影视类内容仅次于演绎、生活、美食内容之后,已经成为抖音用户偏好视频类型中的第 4 名—— 等于说,长视频砸版权替短视频二创做了嫁衣。
有鉴于此,即便腾讯视频高管唾弃短视频是“猪食”,但抖快平台的二创往往比原影视作品更容易获得流量及关注。
甚至,二创正成为影视剧集宣发重要阵地——剧方、平台方会主动针对二创传播进行“军备竞赛”,入驻、花絮、剧情更新玩得别提有多溜了;甚至,当用户刷“三分钟看完一部电影”不过瘾,为剧情跳转解锁更多剧集,正成为一种长、短视频双赢的引流模式。
再说回侵权,虽然长、短视频平台因为版权引发的诉讼就没消停过,但面对泛滥的二创内容,维权搭上的时间、人力、物力成本几乎是个天文数字。
顺着这个逻辑,当流量、用户、广告主都向短视频平台迁徙时,版权换流量自然成为优爱腾最后一张“底牌”,也是一桩合则两利的“买卖” ——于优爱腾而言,以抖音、快手为代表的短视频平台正重塑影视宣发的格局,且短视频二创能极大拉动经典剧、老剧的长尾效应;于抖音而言,充沛的剧集、综艺内容授权能拉长用户活跃时长、拓宽变现渠道。
尤其,2021 年法律层面明确“短视频不得未经授权自行剪切、改编电影、电视剧、网络影视剧等各类视听节目及片段”后,抖音必须尽快扫除版权风险、搭建“合作版权库”,进而储备更多 OGV(专业版权视频)“弹药”。
等于说,长、短视频“握手言和”既为长视频版权价格上升的囚徒困境带来增量营收,又为短视频二创以及 UGC 生态最大程度提供了创作自由及合法性—— 这显然是更符合市场规律的内容流动,也是更符合生意逻辑的产业竞合。
兜了一圈,字节与腾讯这对老冤家掐架多年,最后却掏出了“不打不相识”的剧本——既然剧情要这么演,那就只能祝福两家自此之后幸福地生活在一起了。
作者:黄青春;出品:虎嗅商业消费组
原文标题:腾讯字节也打不动了
来源公众号:虎嗅APP(ID:huxiu_com),从思考,到创造
本文由人人都是产品经理合作媒体 @虎嗅 授权发布,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
{{{path> 收藏 已收藏 {{ postmeta.bookmark }} {{{path> 点赞 已赞 {{ postmeta.postlike }}
-
从两个交互细节,学抖音的设计策略
设计动态 2023-04-10抖音已是世界级的短视频流播放平台,不论TIKTOK还是抖音,它所面向的巨量用户及广泛的用户特征,都要求抖音需要保持高频次的更新迭代,以完善灵活的设计策略和机制。 今次简要剖析抖音中近期新增的两个我个人比较喜欢的功能:评论「不喜欢」、点赞推荐,以窥见抖音的交互与产品在面向用户时,要做好功能的更新迭代,以更好地契合用户体验与实际场景下的用户需求。在本篇文章里,作者便针对抖音的评论「不喜欢」、点赞推荐功能进行了交互拆解,并尝试做了重设计方案,一起来看看吧。
抖音已是世界级的短视频流播放平台,不论TIKTOK还是抖音,它所面向的巨量用户及广泛的用户特征,都要求抖音需要保持高频次的更新迭代,以完善灵活的设计策略和机制。
今次简要剖析抖音中近期新增的两个我个人比较喜欢的功能:评论「不喜欢」、点赞推荐,以窥见抖音的交互与业务设计策略。
一、评论「不喜欢」 在聊评论区之前,不可避免地要聊到社区氛围和治理。
社区氛围对任何内容社区类平台来说都属于老大难,评论区的氛围劣质程度往往与DAU呈正比,这一点在抖音、哔哩哔哩、微博等过亿级社区平台表现得更为明显,这和平台的大用户量以及不可避免的用户下沉化息息相关。
1. 社区氛围 针对社区氛围,在C端设计上一般采取的方式为:
新增默认展示的推荐区Tab,展示筛选后的优质评论,在表现层面营造良社区氛围,以引导用户发表合适恰当的内容; 折叠评论提交入口和展示页,增加用户使用评论功能的成本,降低触及; 排序规则改造,默认以热度或推荐排序,可进行人工干预,引导用户进行良性互动。
以上措施多在可用性上表现得较差,毕竟仅是通过黑盒机制或提升使用成本,来减弱用户对不良社区氛围的感知。
在用户层面而言,与用户期望存在一定的偏差,而且一部分用户仍然需要一窥评论区全貌,难免因以上的措施而受到负面影响。
2. 社区治理 采用产品设计技巧可以低成本呈现比较优质的社区氛围,而氛围好坏的根源还是在发布者身上。
以往的社区治理多是针对是否违法违规展开,在普遍追求优质氛围的竞争环境下,大家开始把目光放在了评论内容本身的质量问题上。
这意味着需要平台有基本的治理能力,也需要有识别内容好坏的能力,随着NLP(自然语言处理Natural Language Processing)或OCR(字符识别 Optical Character Recognition)这类能力的发展,治理手段也高超起来:
1)内容发布治理
评论内容触发本地或服务器端关键词库,转为仅自己可见,严重的直接被删除; 评论内容未通过机器算法NLP审核,转为仅自己可见,严重的直接被删除。 2)内容质量识别:
机器算法NLP无法明确判断内容倾向,转入人工审核流程,审核结果未出前保持为仅自己可见,按照审核结果释放展示或自见或删除; 评论内容被机器算法NLP识别为无意义或低质量,被折叠或击沉; 评论内容被「不喜欢」过多,被折叠或击沉。
以上五类方式中,前几种为大多数平台所使用,既可保证发布者最基本的体验,也照顾到平台的安全和观者的清净。
折叠或击沉评论的方法,使用的范围较窄,比较典型的当属知乎,按其本身强调专业性和关心回答价值的角度而言,“折叠”是平台专业态度的体现,用户一定程度上是可以接受的。
3. 评论「不喜欢」
评论区的「不喜欢」功能已几乎成了摆设,一般体现为用户评论在收到一定数量的「不喜欢」后才会被折叠或击沉或转为自见。
这只满足了用户点击「不喜欢」时的投票态度,无法体现用户主动参与氛围治理的姿态,而且这条评论会停留在用户视野内很久,用户不知道它何时被处理、会不会被处理,既不能保证观者的体验,也没有满足“所见即所得”的设计基本法。
在抖音平台而言,尤其是面向大基数的下沉用户时,社区的氛围治理是必须要解决的“硬骨头”。
抖音可能采用了如下的措施(验证与猜测,不代表官方就是这么做的):
混搭排序规则: 以评论点赞数与发布时间轴为基础排序规则,配合NLP质量分,前置部分优质且有一定热度或者新发布的评论,保证用户在评论区前两屏得以查看高热和较新的优质评论;
排序公式模拟: 在「混搭排序」中,猜测是采用净正向点赞+NLP质量分的方式进行的排序,或是采用评论质量分公式影响排序,对公式的简单模拟:
xyz分别代表LIKE、DISLIKE、NLP识别分的权重系数,应当由后端控制,可随时进行调整。
「不喜欢」交互设计: 作为负点赞方式,在用户侧的表现是点击即隐藏该条评论,符合“所见即所得”的交互规则,也满足了用户「杀灭」负面内容的情绪;在排序影响上,应该是抵消了部分的正向点赞,得出评论的实时净点赞分的权重,用以影响排序。
抖音采取这种排序逻辑和设计策略的优势在于:
可以提升高热、高质量的评论的触及和展示效率; 社区治理上,可规避质量较差的评论呈现,抬升评论区氛围; 用户体验上,既保证了社区氛围的舒适感,也在交互层面上做到所见即所得; 体现用户DISLIKE的投票权,点击即对用户隐藏的方式,一定程度上满足了用户对评论区定制的期望,也体现了用户操作是有权威性的这一安慰剂式的设计理念。 二、点赞推荐 「点赞推荐」的功能释义为:用户可以通过打开功能,使自己的朋友或粉丝看到自己所点赞的视频。
我见之熟悉的原因是之前在Soul时设计但未落地的“转播”功能有异曲同工之处。
本义都是为了促进内容在用户侧的自然分发,提升优质内容的传播性。
也就是说,点赞推荐功能,其实是Twitter和微博“转推”功能的翻版,微信的「在看」功能亦属同样的业务逻辑。
在业务价值上,用户侧内容的自然分发,更易于产生社交互动,也有助于用户之间突破推荐机制带来的信息茧房影响。当关闭朋友可见时,推荐则成了一种低权重的流量推荐手段。
在功能设计层面上,它是个比较有趣的功能,既增加了用户之间互相窥探对方喜好的途径,也有助于用户之间社交关系的加固。
但在交互设计上,我更倾向于抖音在实验试错,因为该功能的交互设计方案是失败的,原因有以下几点:
1)它在信息设计上的门槛过高,使用户无法快速的理解这个功能的影响
“点赞作品不会推荐给朋友”&“点赞作品会推荐给朋友”,很难相信,涉及状态开关提醒的文案只有这么弱的差异。如果是有意为之,便有刻意降低用户感知和认知的嫌疑;如果是无意为之,那这个方案真的让人大跌眼镜。
2)推荐给朋友后的呈现方式,需要用户适当关注和付出一定的学习成本
点击推荐后的样式变更,即是告知用户「推荐」是会这样展示给用户;同时在设置拉起的浮层有种动图以演示该效果。表意太弱了。
3)功能开关的说明信息比较复杂,无形中抬升了用户的使用门槛
总的来说,功能是好的,但使用门槛和学习成本过高,对大龄用户或轻中度用户而言,功能触及可能仅仅会停留在“点赞之后有新的东西出来了,看一看”而已。
而且在用户侧会出于私密性的原因,并不会愿意保持恒打开「推荐」。因此推荐开关需要考虑临时开关和总开关两个状态。
好的功能,需要好的设计。好的设计,必定是使用门槛和学习成本比较低的。
可以适当教育用户,但不能自说自话地教育用户。
以下按照VADU的设计理论对这个功能进行Redesign的尝试。
三、方案重设计 在重新设计之前,需要深入了解业务构成。
线上版本的「点赞推荐」中涉及到的开关过多,功能入口表现又稍显含蓄,在文案的信息设计上拔高了使用门槛,重新设计将以重点解决这些问题为目标。
1. 「点赞推荐」线上业务构成 业务的起点,实是增加推荐手段,引导用户推荐内容给其他用户。
在这个基础上“增加”了用户可进一步选择将点赞的内容推荐给朋友。只是这一步增加,将「点赞推荐」的流程复杂化。开关逻辑见下图:
2. 「点赞推荐」拆解与重设计 在了解了基础的业务逻辑后开始着手。
1)功能入口强化(价值强化)
将功能价值点表现在入口上,增加用户决策因子,也使用户能一眼了解功能含义。
2)功能说明浮层信息强化(抵达性强化)
点赞作品和推荐作品实是两件事,需要在表意上明确区分,不要给用户留任何含糊的余地。适当情况下可以增加Icon辅助表意。
3)浮层中的功能开关交互合理化(抵达性、可用性强化)
线上的 保持关闭/开启 & 保持开启/关闭 的按钮互斥状态,完全不合乎交互设计的任何规则。既不明确,也没有体现开关状态。可以适当增加说明,并采用开关形式解决。
4)总开关表意和交互合理化(可用性强化)
原本的浮层说明和开关示意,均存在表意不清的情况。改造原浮层交互为新启页面,在页面内详细释义功能。
5)改造总览
四、综上所述 从上述案例,我们得以窥见抖音在业务细节上的打磨,同时在交互细节上的瑕疵点。但这种细节的把控和尝试,都应当是IT行业万马齐喑的今天应该去做的,这也是最原本IT公司做过的事情。
作为设计师,能跳脱出来审视自己,以理论来作为工作方法论的基底,都是难能可贵的品质。
这也正是我回答面试问题“你觉得你比同样十年经验的设计师的优势在哪里”的答案。
跳出设计者思维,以普通观者的视角反观自己的方法和输出,以学术理论来指导自己,进行适当的反思和纠正,这很重要。
本文由 @无鹿森 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
{{{path> 收藏 已收藏 {{ postmeta.bookmark }} {{{path> 点赞 已赞 {{ postmeta.postlike }}
-
网盘的生意经该怎么念?
设计动态 2023-04-102005年前后,有人利用Gmail的海量存储空间来存储本地文件,网盘的概念由此兴起。 传统网盘的功能还停留在存储数据,只是用户存放文件的位置从本地挪到了服务器。 直到2009年,云存储应用诞生。 包括Dropbox、微软SkyDrive、Google的Goog云存储应用诞生之后,推动网盘市场进入了新的发展解读阶段,个人网盘行业也在跌宕之中迎来了行业洗牌,并掀起了用户争夺大战。那么当前的个人网盘市场进入了什么样的阶段?网盘市场的玩家们如果想抢占更多用户,又该拿出怎样的策略?一起来看看作者的解读。
2005年前后,有人利用Gmail的海量存储空间来存储本地文件,网盘的概念由此兴起。
传统网盘的功能还停留在存储数据,只是用户存放文件的位置从本地挪到了服务器。
直到2009年,云存储应用诞生。
包括Dropbox、微软SkyDrive、Google的Google Drive、苹果的iCloud、金山快盘、腾讯微云、360云盘等大多数个人云存储服务商推动网盘进入新的发展阶段。
个人网盘的出现,意味着用户可以自由地存储、备份、共享文档、图片、音视频等数字资产而尽可能地不受时间、设备限制。
尤其是5G时代来临后,高速率低时延的技术让个人网盘里的文件传输速度更快、视频转码播放更顺畅。
几年前,个人网盘行业在烧钱和监管压力下完成了行业洗牌,目前个人网盘市场的主要玩家有三类,分别是:
推出百度网盘、腾讯微云的互联网厂商们;天翼云盘、中国移动云盘背后的电信运营商;以及华为云空间、iCloud背后的手机厂商。
十几年来,从混沌期的百盘大战到行业规范后头部大厂争锋,个人网盘的故事从来没有落幕,AI技术热潮又起,个人网盘产品再次打响用户争夺战……
一、后百盘大战时间 2016年左右,一大批网盘宣布关停全部或部分服务。
2016年,先是3月4日,115网盘关闭“礼包文件分享”功能、整改我聊功能、下线其中的“文件发送功能”。3月17日,UC网盘宣布将终止网盘的存储服务。
然后是4月份,新浪微盘宣布将关闭免费个人用户的存储服务,并将关闭微盘的搜索、分享等功能。
4月26日,迅雷快盘也宣布将停止个人用户的储存服务,并全面转型个人视频服务。腾讯微云则是关闭了“文件中转站”功能。
上半年360网盘还在强调不会关停,10月份就宣布“360云盘即将转型企业云服务,同时停止个人网盘”。
对网盘企业们来说,“无法解决盗版侵权问题”只是其一,连年亏本、及时止损或许才是他们叫停个人网盘业务本质逻辑。
“免费”是早期网盘企业为争取用户、快速抢占市场的重要手段,他们在“不限速”和“大容量空间”上卷,但高昂的服务器和带宽成本不是闹着玩的。
此前有自媒体以百度阳泉数据中心为例,介绍过网盘公司的成本。
该数据中心可以存储大概614万TB的数据,假设都使用8TBx18规格的存储服务器,硬件成本就得19.6亿,平均每TB 319.5元。
按每6台服务器需要1个2400W的电源集中供电来算,那么数据中心每小时要耗费6.4万度电,按照阳泉市0.45元/度的商业用电标准,每年光电费就烧掉2.5亿。此外,这种规模的数据中心每年光网费就大约4亿元。
也就是说,即使不考虑硬件,阳泉数据中心每存储1TB数据,用在电费和带宽上的钱每年也需要106元。
这还没算到设备的维护成本。
技术成本压力下,要继续求生的网盘,只能靠会员开源,靠限速、靠技术优化成本结构节流。
360、网易等大厂网盘业务的倒下,一定程度上引导了用户的价值回归,许多用户愿意为适当地付出会员费换得更大的存储空间、更快的上传下载速度,毕竟用网盘存东西还是比买硬盘存方便不少。
但是有的企业过分压缩非会员用户网络服务体验感还是会让部分用户反感。
有消费者反应有些网盘企业“吃相难看”:平时下载速度慢如“龟速”,一旦开通会员后,下载速度马上从100KB/s左右提升至数十M/s。
2021年11月,工信部组织8家网盘企业共同签署自律公约。
官方出手都推动了网盘产品针对免费用户提速,在政策监管、技术推动和市场的优胜劣汰下,网盘企业们完成了行业的第一轮洗牌。
二、新用户争夺战 根据艾瑞mUserTracker监测数据,个人网盘市场集中度趋于固定,移动端Top5服务商月独立设备数比例高达99%。
其中,百度网盘独占81%,月独立设备数和月单机使用次数均居榜首。
2022年,在关于个人网盘认知情况的用户调研中,百度网盘也以76.9%的绝对优势领先。
但比起上一年发布的《2020-2021年中国个人网盘专题调研报告》中“百度网盘以81.3%的品牌认知度位列第一”,统治力有所下降。
几年前的潮起潮落不影响这两年的风起云涌,新选手一一登场,攻擂者轮换。
2020年协同办公应用飞速普及,拥有ToB基因的阿里就在此时登场。
2020年9月27日晚间,阿里云智能事业群公布了“云钉一体”战略,几大事业部加入新的大钉钉事业部,融入阿里云智能事业群,其中就包含阿里云Teambition团队。
Teambition团队创始人是90后明星产品人齐俊元,那时他还是阿里云盘负责人,还没有离职阿里加入飞书。
2021年3月12日,Teambition在被收购前就研究内测的网盘产品Teambition网盘与阿里云推出的独立APP“阿里云网盘”实现数据合并。
十天后“阿里云盘”正式公测,一度冲到登上了小米应用商店总榜第一、苹果应用商店总榜第二的位置。
后来者终究根基浅。
除了公测当天,很长一段时间里,阿里云盘都和百度网盘相差数万下载量级。
从云盘的基础功能来讲,阿里云盘当得上“黑马”的称号。
容量上,新用户上来就可获赠100GB容量,通过各种任务,还可以获得几百个G的容量;速度上,阿里云盘是市面上唯一主打“不限速”的产品,经媒体实际测试,阿里网盘的上传速度不受限制,下载速度能够达到17MB/s。
各大网盘间资源不能互通,网盘生态至关重要。
在网友们的资源分享链接里,出现最多的就是百度网盘,迅雷凭借出色的视频播放能力出场次数也不少,这样的资源搜索结果很大程度上会影响用户的产品选择。
不过近几年中,在资源分享链接里还有一个异军突起的网盘产品,就是同样阿里旗下的夸克网盘。
夸克网盘并没有独立APP,只是作为夸克浏览器中的一大功能。
而打开夸克浏览器,很明显能看出他的受众在哪里、想吸引什么样的消费人群。
学生群体成为了各大网盘的用户争夺战新战场。
今年3月份,阿里云盘在公测两周年周年庆活动中发放了学生专属福利,凡是通过学生身份认证的都可以免费领取1T永久流量。
夸克代言人是年轻的偶像少女杨超越,而在2021年,成立9年的百度网盘也宣布吴磊成为首位品牌代言人。
在争夺年轻用户的较量上,谁也不想认输。
三、价值与服务的较量 不久前,据IT之家报道,部分Google Drive网盘用户遇到账户存储文件数量的限制。
账户存储的文件项内容(包括文件、文件夹和快捷方式)最多不超过500万项,否则系统会弹出:
“错误403:此账户已超过 500 万项内容的创建限制。要创建更多项目,请将项目移至回收站并永久删除”。
对此,官方回应是,500万项内容上限是官方设置的一项保障措施,避免影响系统稳定性,提高稳定性,并减少滥用情况。
对于大部分计算机用户来说,可能使用周期内永远不会达到500万项内容。
但数据增量今非昔比,十年前云盘刚发展时主流手机内存不到1GB,信息爆炸下如今在网盘帮助下手握128G的手机可能还不够用。
更大空间、更高效的上传速率一直是个人网盘最核心的付费价值点。
相关调研显示,有59%的受访用户付费的主要原因是提升下载速度,45.1%的用户是因为存储空间扩容。
但除此之外,探索更多元的增值服务也成为了行业洗牌后大部分企业的共同选择。
除基础会员服务收入外,网盘内小说、游戏、学习、广告等增值服务成为新的收入增长点。
至2021年,个人网盘会员付费规模已达20.3亿元,增值服务收入规模达15亿。预估至2024年,年复合增速维持在30.9%。
OCR(文件识别)、CV(计算机视觉)、NLP(自然语言处理)等AI技术让个人网盘功能更丰富也更智能,图文视频的审核分类、检索等都成为了标配。
在AI基因上,有文心大模型、飞桨训练部署框架等百度系AI基础设施的百度网盘再次硬气地站在用户争夺战制高点,完成多年前预判的“云存储会逐渐从一个应用向后台靠拢,成为众多应用的支撑”。
电信运营商的网盘产品在智能家居、家庭娱乐上有先天优势,手机厂商们的云盘和手机关联密切存在感强,互联网玩家们在云盘的斗争上权衡利弊,最后剩下几家大厂争锋。
阿里的两个产品实现了办公娱乐两手抓,百度网盘雄心勃勃要做成一个全包容的系统平台,金山办公拆分金山快盘成立了金山云独立公司,后来金山云想专注IaaS、PaaS,云盘业务又卖给了迅雷。
可另一边,文字、文档资料,从有道笔记到能和微软office争锋的WPS,哪里不能同步;至于照片、图片,手机图库就能智能识别、分类,还能跟着手机系统多端同步;钉钉等协同办公软件的强大一定程度上又代替了网盘的办公功能。
网盘的用户争夺,无法停止……
参考资料:
观察者网:《人民日报》关注网盘限速,“无差别速率”体验如何? 燕麦云:国内个人网盘进化史,网盘的概念是怎样兴起的? 新熵:阿里与百度的网盘中场大战 深响:回顾网盘10年:两次潮起,同一动力 资料来源:天眼查 作者:永遇乐;编辑:杨武
来源公众号:互联网那些事(ID:hlw0823),深挖品牌故事,探寻商业逻辑。
本文由人人都是产品经理合作媒体 @互联网那些事 授权发布,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
{{{path> 收藏 已收藏 {{ postmeta.bookmark }} {{{path> 点赞 已赞 {{ postmeta.postlike }}
-
15个关键点,掌握B端表格设计规范+交互逻辑
设计动态 2023-04-10表格作为B端产品中重要的界面组成部分,承载着内容展示、数据记录等多重任务。每家产品的表格看起来构成差不多,但在交互细节上仍然有很多好的地方值得我们仔细思考。 本次通过整理10条B端表格设计规范+5条B端表格交互逻辑,系统掌握B端产品中的表格设计~ 一、B端表格毫无疑问,表格之于B端产品而言是及其重要的一部分,那么,如何系统掌握B端产品中的表格设计呢?本文作者从表格设计规范与交互逻辑两个角度提出了15点建议,干货满满,希望对你有帮助。
表格作为B端产品中重要的界面组成部分,承载着内容展示、数据记录等多重任务。每家产品的表格看起来构成差不多,但在 交互细节 上仍然有很多好的地方值得我们仔细思考。
本次通过整理 10 条B端表格设计规范+ 5 条B端表格交互逻辑,系统掌握B端产品中的表格设计~
一、B端表格规范整理 1. 对齐,高效的信息获取方式 表格内的信息通过对齐,会更加规范易理解,给用户视觉上的统一感,且视线流动顺畅,能够让人快速捕捉到所要的内容。
文本信息左对齐,因为现代人的阅读方式习惯从左到右,符合正常心智; 数据信息右对齐,方便数字大小的直观对比; 内容宽度固定居中对齐,更好的信息呈现及表格空间的节省; 表头与信息内容对齐方式一致,一致性以达到简化,降低视觉噪音。
2. 表格列数与固定列 默认展示的列数为3-8列,如果需要展示更多列数,则需要优先固定展示重要列,其余的列的内容会以滚动条滑动而展示出来。
有操作时需固定,操作项不固定时无法快速定位会降低操作效率;重要信息固定,有利于快速获取重要的内容。
3. 表格列表的宽度 宽度的尺寸大小自适应,但需要根据文字的重要性显示,重要文字内容优先完整显示。(如果由于屏幕小表格会出现省略,就要考虑多一个浏览器自带的title提示。)
注:当第一列是序号或多选项时,列宽不需要太宽,这样视觉不会显得空洞。
4. 表头每列标题文字字数 字符不要多,如果文字太多,就需要做文字信息精简化。同样,对于专业术语或用户不常见的名词应给予一定的帮助说明。
5. 长文本处理 表格内容较多且有长文本时,长文本缩略展示;表格内容较少时有长文本,长文本换行展示。
6. 空白数据填充「-」,避免留白产生疑虑 表格中经常会出现空数据或无数据的情况,留白处理会给用户造成一定的困惑和误解,是系统没有加载出来吗?明智的做法,使用「-」填充显示。图片为空时使用图片占位符。
7. 操作列的统一 同一项目中的操作列命名应该保持统一,例如:常规增、删、改、查命名为新增、删除、编辑、详情。
操作项超过三个时,将操作低频折叠收起,可以帮助页面突出更加重要的信息,减轻空间压力,减少干扰。
8. 数据升降样式 给数据做升降区分可以快速判断数据的趋势,国内数据升图标默认为红色,降的为绿色。
9. 表格全局操作和批量操作 全局操作为无需选择数据内容即可进行的操作,常见的有新增、导入、筛选。
批量操作就是对表格的多行数据同时操作,常见的有导出、删除。
全局和批量都不属于单个对象因此需要放在表格外,操作具体的位置排放根据操作的重要程度一次从左到右递减。
10. 斑马线 条纹颜色:标题背景色透明度60%左右;(条纹颜色视觉上应该比标题栏弱一点)鼠标hover颜色:主题色透明度10%。
二、B端表格交互整理 1. 固定表头,一目了然 当阅读丰富且繁多的表格时,由于屏幕有限,用户不得不拖动横向或纵向滚动条来阅读信息。
固定表头,能够让用户明白当前单元格内信息的属性而不至于不知道该信息的意思。固定表头也是一种界面友好性的体现。
2. 排序,让信息有序起来 可以让无序信息内容进行有序排列,排序分为升序和降序,一般用在数据、时间、数量上。
3. 调整列宽度,查看完整数据 允许调整列的宽度来查看更加完整的缩略数据。被截断的数据,默认支持鼠标悬停时浏览器自带title显示完整数据。
4. 水平滚动,固定首尾列 呈现大型数据集时,水平滚动是不可避免的,通过横向滚动查看其它数据。将首列进行固定(若包含勾选操作,则一起固定),以便用户将数据与对象进行对应。
5. 分页固定 若表格是分页处理的,分页会放在上部、下部或上下部均有,分页固定省去了用户需要翻到顶部或底部进行操作的麻烦。
作者:谭檀檀
来源:https://mp.weixin.qq.com/s/e7vc5uyPFj65DM3UQ_WEiQ
本文由 @Clippp 授权发布于人人都是产品经理,未经作者许可,禁止转载
题图来自 Pixabay,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
{{{path> 收藏 已收藏 {{ postmeta.bookmark }} {{{path> 点赞 已赞 {{ postmeta.postlike }}
-
情感化设计案例!4个鲜为人知的苹果图标细节和背后的有趣故事
UI交互 2023-04-10今儿聊 4 个 iPhone 图标和它背后有趣的传奇故事。苹果产品中那些鲜为人知的设计,经常玩些小彩蛋来撩动人心。如此精心设计的细节就让我「用心」的去扒一扒藏着深处等待被看见的故事。今儿聊 4 个 iPhone 图标和它背后有趣的传奇故事。
苹果产品中那些鲜为人知的设计,经常玩些小彩蛋来撩动人心。如此精心设计的细节就让我「用心」的去扒一扒藏着深处等待被看见的故事。一起盘盘 4 个故事里,哪个设计一步小心撩到你了?
苹果工作轶事:
在苹果做设计师,我学会了这 10 件事情 编者按:在以设计著称的苹果公司做设计是怎样的体验?
阅读文章 >
一、Face ID 面容 「微笑图标」 在 iPhone X 之后「人脸解锁」的功能对这个图标应该很熟悉啦,也就是面容 ID 解锁,这个 Face ID 笑脸图标其实是几十年前的电脑开机画面!
笑脸图标诞生在一本 2.5 美元的速写本,其作者是 Susankare“人称 icon 之母”(画外音:速写本的每个四方格对应屏幕上的一个像素,所以速写本就算是图标的始祖)
Susan Kare 是个有思想力的艺术家,性格平和谦逊,造就她的设计风格:亲和、自然、流畅、寓意深远。也因此开启一种全新的、用户友好的计算界面构建原型。深入了解她和她的团队对冰冷的电脑界面的改造,人性化、直观,吸引力的设计理念是深入人心,这也使之奠定成 Macintosh 视觉和用户体验的重要基础。
1983—1986 为Apple从事电脑 图标设计 ,在苹果企业的第一份工作是为Mac OS设计字体。仅仅一年时间,她建立了Macintosh的核心视觉语言,包括图标和众多字体,并构成了Apple产品最初的视觉体验。
Susan Kare 为 Mac 电脑设计的原始图标和字体具有革命性的意义,它们给没有生命的电脑带来了温暖和个性,至今的 Mac 仍在使用它们。
我想这也是苹果 Face ID 使用笑脸图标,以此致敬作者本身、也是对她开创的“亲和、自然、流畅”设计语言的一种肯定吧。
「故事叨叨」
我的心动点:把自己作为方法
设计师的个人品质决定了设计产品的最终呈现形态,卓越设计前提努力成为卓越的人;用自己的方式传达的观点,用设计进行交流传递价值。
设计思考点:设计语言的力量
设计语言可以温柔且富有个性,可以赋予冰冷的物品是更具人性化、富有沟通力。
二、Safari 阅读列表:「圆形眼镜」 你留意过 Safaria 浏览器里的图标吗?为什么是眼镜?为什么是圆形眼镜?
其实,浏览器里藏着一副乔布斯的眼镜。Safaria 浏览器 Reading List 的图标从 iOS 7 开始变成了乔老爷子经典的圆形眼镜。
乔布斯先生在发布完 iPhone4 后就离世了,给世界留下的创新+艺术+商业+迎合未来的产品和思想,绝对是笔超级财富。iOS7 的 Add to Reading List(阅读列表)图标发生了变化,从 iOS6 中的那个款型变成了乔布斯眼镜的款型。
「故事叨叨」
我的心动点:你在浏览器里看世界,看世界的人在用眼镜看你
他不是神,他是个普通人,但他所做的一切,都会在历史上留下浓重的一笔。让世界变得更美更好的人,理应值得铭记。
设计思考点:情怀/价值设计,也可以很品牌(苹果)
找到一种能赋予你的品牌以特殊意义,并能够在与用户进行互动的接触点上体现你设计价值的信念。
三、桌面 Safari「指南针图标」 不知道你发现了没有呢。在 iOS 11 Beta 4 的图标设计中,Safari 的指针朝向发生了轻微的偏移。而做出这样微小的改变是因为在现实地球中的地磁北极也在持续的发生变化,在过去的 150 年里向北移动了超过 1000 公里。这比之前 400 年的移动速度有所提高。
地磁北极继续“跑偏”,你还能找到北吗?科学家发现,地磁北极正以一年近 64 公里的速度,向俄罗斯西伯利亚方向移动,2011 年美国佛罗里达州坦帕国际机场因为地磁方位出现改变,要更改跑道编码,方便飞行员用指南针协助飞机起降。按目前速度计算,50 年后地磁北极将从加拿大北部挪到西伯利亚。
地磁北极正加速偏移目前不会影响手机导航,但是影响了桌面 Safari「指南针图标」
「故事叨叨」
我的心动点:想点大事,一种纵观全局的思维方式
我们每个人都生活在一个比自己大得多的世界之中,每个人都需要面对超出自身感受的事件和趋势。用有大的思维格局,在小的行动都是有会更有价值。
设计思考点:大思维里小改变,情绪回应
面对大事除了感叹外,作为一名「设计师」通过图标微小的改变来回应、传递让人产生情感通感,调动人原始的感觉和情绪。
四、Emoji 里的「备忘录」 细心的用户一定知道的 emoji 表情藏匿的 设计细节 ,比如「地球」的表情,会根据你打字是输入位置、习惯匹配不同的大洋洲图形。当你以为和朋友打出是同一个地球其实...实际....可能...它们长的并不一样哦 。不过,这个不是我们今天的主角,大家聊聊「备忘录」极富情怀的设计。
放大后,很容易看到上面有设计的细节,图标里面内嵌了文字;继续放到文字,可以看到这样的一段英文。
我….给大家翻译(百)翻译(度)
Here’s to the crazy ones.
向那些疯狂的家伙们致敬。
The misfits. The rebels. The troublemakers. The round pegs in the square holes
他们特立独行,他们桀惊不逊,他们惹是生非,他们格格不入。
The ones who see things differently.
他们用与众不同的眼光看待事物。
They’re not fond of rules.
他们不喜欢墨守成规
这段文本摘录:苹果经典广告:“ Think Different(非同凡响)”。只有那些疯狂到以为自己能改变世界的人,才能真正的改变世界。
当我第一眼看到这个段话时,内心确实被打动了。除了文案本身写的不错外,更让人动容的是设计师埋进图标的细节(把文字放到备忘录的图标颇有意境)。纵观整个历史,真正的梦想家总是逆潮而上、想法与众不同,每次打出「备忘录」图标时,好像时刻提醒“想点不同吧,在备忘录记下你与世界不同的想法,即使看上去这些想法与世界格格不入。”
「故事叨叨」
我的心动点:致敬疯子,文案撩动并攻击了我那该死的文学情怀;
设计思考点:情感设计不止“表面部分”,关心那些隐藏部分,可以潜入情绪深处,在心灵深处触动。细节已经不再单单是细节,所有一切都同等重要。
最后想说 Face ID 面容 「微笑图标」之 设计语言的力量 Safari 阅读列表「圆形眼镜」之 情怀设计很品牌 桌面 Safari「指南针图标」之大思维里小改变,情绪回应 Emoji 里的「备忘录」情感设计不止“表面部分” 以上4个 iPhone 上的图标,藏在设计背后的故事都是在历史上留下浓重的一笔、让世界变得更美更好的人或事。通过小小设计彩蛋去致敬经典,是设计师这个职业拥有的情感价值。
也许还有很多我们不知道但早就被精心设计的细节等待被发现。在整理上述设计细节时,一位网友评论也引起我的一点小小思考
我的疑惑
这些细节设计真正的价值点是什么在于?(难道大费周章只为了打动你吗?)
设计带来的某种情绪和感受,能对商业有多少的推动力?(人愿意为情绪感受买单)
有一个产品价值的公式:产品价值=功能价值+情绪价值+资产价值,
为了探究情绪价值的设计原则带着这样的困惑,我翻阅看了两本关于苹果设计两本书籍《苹果的品牌设计之道》《苹果的产品设计之道》,和大家浅浅的分享。
观点 1: 设计改变一切 ,美观、创新和魅力造就独一无二的竞争优势
一些公司和品牌(以及个人)天生就独具魅力,这种与生俱来的魅力部分来自 DNA 遗传。但建立并维持那样的魅力需要耗费大量的时间、资源、才智和强大的领导力。若长时间致力于设计的方式将会给自己产品打造超凡的魅力。
观点 2: 以人为本的情感化设计
怀抱着一种以人为本的设计理念,这种方式不仅要求设计师能够理解别人的感受,实际上还要深入细节,在产品的细节上投入巨大,图标形象能有力地传递让人产生通感,调动人原始的感觉和情绪,带来美好的感受。
我的小感悟
刻进产品 DNA 的是人性化原理 —— 情感化设计。
情感魅力是我们每个人的终极追求,相信设计的力量并用设计去创造情感共鸣,也许这个方法让产品、服务脱颖而出吧~
课后小思考
你有多大程度会为产品的情绪情怀买单? 有没有发现生活中的其他的设计小彩蛋呢?
-
情感化设计案例!4个鲜为人知的苹果图标细节和背后的有趣故事
UI交互 2023-04-10今儿聊 4 个 iPhone 图标和它背后有趣的传奇故事。苹果产品中那些鲜为人知的设计,经常玩些小彩蛋来撩动人心。如此精心设计的细节就让我「用心」的去扒一扒藏着深处等待被看见的故事。今儿聊 4 个 iPhone 图标和它背后有趣的传奇故事。
苹果产品中那些鲜为人知的设计,经常玩些小彩蛋来撩动人心。如此精心设计的细节就让我「用心」的去扒一扒藏着深处等待被看见的故事。一起盘盘 4 个故事里,哪个设计一步小心撩到你了?
苹果工作轶事:
在苹果做设计师,我学会了这 10 件事情 编者按:在以设计著称的苹果公司做设计是怎样的体验?
阅读文章 >
一、Face ID 面容 「微笑图标」 在 iPhone X 之后「人脸解锁」的功能对这个图标应该很熟悉啦,也就是面容 ID 解锁,这个 Face ID 笑脸图标其实是几十年前的电脑开机画面!
笑脸图标诞生在一本 2.5 美元的速写本,其作者是 Susankare“人称 icon 之母”(画外音:速写本的每个四方格对应屏幕上的一个像素,所以速写本就算是图标的始祖)
Susan Kare 是个有思想力的艺术家,性格平和谦逊,造就她的设计风格:亲和、自然、流畅、寓意深远。也因此开启一种全新的、用户友好的计算界面构建原型。深入了解她和她的团队对冰冷的电脑界面的改造,人性化、直观,吸引力的设计理念是深入人心,这也使之奠定成 Macintosh 视觉和用户体验的重要基础。
1983—1986 为Apple从事电脑 图标设计 ,在苹果企业的第一份工作是为Mac OS设计字体。仅仅一年时间,她建立了Macintosh的核心视觉语言,包括图标和众多字体,并构成了Apple产品最初的视觉体验。
Susan Kare 为 Mac 电脑设计的原始图标和字体具有革命性的意义,它们给没有生命的电脑带来了温暖和个性,至今的 Mac 仍在使用它们。
我想这也是苹果 Face ID 使用笑脸图标,以此致敬作者本身、也是对她开创的“亲和、自然、流畅”设计语言的一种肯定吧。
「故事叨叨」
我的心动点:把自己作为方法
设计师的个人品质决定了设计产品的最终呈现形态,卓越设计前提努力成为卓越的人;用自己的方式传达的观点,用设计进行交流传递价值。
设计思考点:设计语言的力量
设计语言可以温柔且富有个性,可以赋予冰冷的物品是更具人性化、富有沟通力。
二、Safari 阅读列表:「圆形眼镜」 你留意过 Safaria 浏览器里的图标吗?为什么是眼镜?为什么是圆形眼镜?
其实,浏览器里藏着一副乔布斯的眼镜。Safaria 浏览器 Reading List 的图标从 iOS 7 开始变成了乔老爷子经典的圆形眼镜。
乔布斯先生在发布完 iPhone4 后就离世了,给世界留下的创新+艺术+商业+迎合未来的产品和思想,绝对是笔超级财富。iOS7 的 Add to Reading List(阅读列表)图标发生了变化,从 iOS6 中的那个款型变成了乔布斯眼镜的款型。
「故事叨叨」
我的心动点:你在浏览器里看世界,看世界的人在用眼镜看你
他不是神,他是个普通人,但他所做的一切,都会在历史上留下浓重的一笔。让世界变得更美更好的人,理应值得铭记。
设计思考点:情怀/价值设计,也可以很品牌(苹果)
找到一种能赋予你的品牌以特殊意义,并能够在与用户进行互动的接触点上体现你设计价值的信念。
三、桌面 Safari「指南针图标」 不知道你发现了没有呢。在 iOS 11 Beta 4 的图标设计中,Safari 的指针朝向发生了轻微的偏移。而做出这样微小的改变是因为在现实地球中的地磁北极也在持续的发生变化,在过去的 150 年里向北移动了超过 1000 公里。这比之前 400 年的移动速度有所提高。
地磁北极继续“跑偏”,你还能找到北吗?科学家发现,地磁北极正以一年近 64 公里的速度,向俄罗斯西伯利亚方向移动,2011 年美国佛罗里达州坦帕国际机场因为地磁方位出现改变,要更改跑道编码,方便飞行员用指南针协助飞机起降。按目前速度计算,50 年后地磁北极将从加拿大北部挪到西伯利亚。
地磁北极正加速偏移目前不会影响手机导航,但是影响了桌面 Safari「指南针图标」
「故事叨叨」
我的心动点:想点大事,一种纵观全局的思维方式
我们每个人都生活在一个比自己大得多的世界之中,每个人都需要面对超出自身感受的事件和趋势。用有大的思维格局,在小的行动都是有会更有价值。
设计思考点:大思维里小改变,情绪回应
面对大事除了感叹外,作为一名「设计师」通过图标微小的改变来回应、传递让人产生情感通感,调动人原始的感觉和情绪。
四、Emoji 里的「备忘录」 细心的用户一定知道的 emoji 表情藏匿的 设计细节 ,比如「地球」的表情,会根据你打字是输入位置、习惯匹配不同的大洋洲图形。当你以为和朋友打出是同一个地球其实...实际....可能...它们长的并不一样哦 。不过,这个不是我们今天的主角,大家聊聊「备忘录」极富情怀的设计。
放大后,很容易看到上面有设计的细节,图标里面内嵌了文字;继续放到文字,可以看到这样的一段英文。
我….给大家翻译(百)翻译(度)
Here’s to the crazy ones.
向那些疯狂的家伙们致敬。
The misfits. The rebels. The troublemakers. The round pegs in the square holes
他们特立独行,他们桀惊不逊,他们惹是生非,他们格格不入。
The ones who see things differently.
他们用与众不同的眼光看待事物。
They’re not fond of rules.
他们不喜欢墨守成规
这段文本摘录:苹果经典广告:“ Think Different(非同凡响)”。只有那些疯狂到以为自己能改变世界的人,才能真正的改变世界。
当我第一眼看到这个段话时,内心确实被打动了。除了文案本身写的不错外,更让人动容的是设计师埋进图标的细节(把文字放到备忘录的图标颇有意境)。纵观整个历史,真正的梦想家总是逆潮而上、想法与众不同,每次打出「备忘录」图标时,好像时刻提醒“想点不同吧,在备忘录记下你与世界不同的想法,即使看上去这些想法与世界格格不入。”
「故事叨叨」
我的心动点:致敬疯子,文案撩动并攻击了我那该死的文学情怀;
设计思考点:情感设计不止“表面部分”,关心那些隐藏部分,可以潜入情绪深处,在心灵深处触动。细节已经不再单单是细节,所有一切都同等重要。
最后想说 Face ID 面容 「微笑图标」之 设计语言的力量 Safari 阅读列表「圆形眼镜」之 情怀设计很品牌 桌面 Safari「指南针图标」之大思维里小改变,情绪回应 Emoji 里的「备忘录」情感设计不止“表面部分” 以上4个 iPhone 上的图标,藏在设计背后的故事都是在历史上留下浓重的一笔、让世界变得更美更好的人或事。通过小小设计彩蛋去致敬经典,是设计师这个职业拥有的情感价值。
也许还有很多我们不知道但早就被精心设计的细节等待被发现。在整理上述设计细节时,一位网友评论也引起我的一点小小思考
我的疑惑
这些细节设计真正的价值点是什么在于?(难道大费周章只为了打动你吗?)
设计带来的某种情绪和感受,能对商业有多少的推动力?(人愿意为情绪感受买单)
有一个产品价值的公式:产品价值=功能价值+情绪价值+资产价值,
为了探究情绪价值的设计原则带着这样的困惑,我翻阅看了两本关于苹果设计两本书籍《苹果的品牌设计之道》《苹果的产品设计之道》,和大家浅浅的分享。
观点 1: 设计改变一切 ,美观、创新和魅力造就独一无二的竞争优势
一些公司和品牌(以及个人)天生就独具魅力,这种与生俱来的魅力部分来自 DNA 遗传。但建立并维持那样的魅力需要耗费大量的时间、资源、才智和强大的领导力。若长时间致力于设计的方式将会给自己产品打造超凡的魅力。
观点 2: 以人为本的情感化设计
怀抱着一种以人为本的设计理念,这种方式不仅要求设计师能够理解别人的感受,实际上还要深入细节,在产品的细节上投入巨大,图标形象能有力地传递让人产生通感,调动人原始的感觉和情绪,带来美好的感受。
我的小感悟
刻进产品 DNA 的是人性化原理 —— 情感化设计。
情感魅力是我们每个人的终极追求,相信设计的力量并用设计去创造情感共鸣,也许这个方法让产品、服务脱颖而出吧~
课后小思考
你有多大程度会为产品的情绪情怀买单? 有没有发现生活中的其他的设计小彩蛋呢?
-
超详细!AI 绘画神器 Stable Diffusion 基础使用手册
UI交互 2023-04-10一、AI 绘画工具的选择与运用1. 工作场景下 AI 绘画工具的选择目前文生图的主流 AI 绘画平台主要有三种:Midjourney、Stable Diffusion、DALL·E。如果要在实际工作场景中应用,我更推荐 Stable Diffusion。另一个热门平台的基础教程:超详细!一、AI 绘画工具的选择与运用 1. 工作场景下 AI 绘画工具的选择
目前文生图的主流 AI 绘画平台主要有三种:Midjourney、Stable Diffusion、DALL·E。如果要在实际工作场景中应用,我更推荐 Stable Diffusion 。
另一个热门平台的基础教程:
超详细!AI 绘画神器 Midjourney 基础使用手册 一、前提条件 需要魔法: 新用户可免费创作 25 张图片,超过需要办会员 版权问题:会员生成的图片版权归创作者所有 Midjourney相关资讯: 二、注册/链接 服务器 温馨提示:下方多图预警 1. 注册、创建服务器 ① 打开Midjourney官网,右下角选择"J
阅读文章 >
通过对比,Stable Diffusion 在数据安全性(可本地部署)、可扩展性(成熟插件多)、风格丰富度(众多模型可供下载,也可以训练自有风格模型)、费用版权(开源免费、可商用)等方面更适合我们的工作场景。
那么如何在实际工作中应用 Stable Diffusion 进行 AI 绘画?
要在实际工作中应用 AI 绘画,需要解决两个关键问题,分别是:图像的精准控制和图像的风格控制。
2. 图像精准控制
图像精准控制推荐使用 Stable Diffusion 的 ControlNet 插件。在 ControlNet 出现之前,AI 绘画更像开盲盒,在图像生成前,你永远都不知道它会是一张怎样的图。ControlNet 的出现,真正意义上让 AI 绘画上升到生产力级别。简单来说 ControlNet 它可以精准控制 AI 图像的生成。
ControlNet 主要有 8 个应用模型:OpenPose、Canny、HED、Scribble、Mlsd、Seg、Normal Map、Depth。以下做简要介绍:
OpenPose 姿势识别
通过姿势识别,达到精准控制人体动作。除了生成单人的姿势,它还可以生成多人的姿势,此外还有手部骨骼模型,解决手部绘图不精准问题。以下图为例:左侧为参考图像,经 OpenPose 精准识别后,得出中间的骨骼姿势,再用文生图功能,描述主体内容、场景细节和画风后,就能得到一张同样姿势,但风格完全不同的图。
Canny 边缘检测
Canny 模型可以根据边缘检测,从原始图片中提取线稿,再根据提示词,来生成同样构图的画面,也可以用来给线稿上色。
HED 边缘检测
跟 Canny 类似,但自由发挥程度更高。HED 边界保留了输入图像中的细节,绘制的人物明暗对比明显,轮廓感更强,适合在保持原来构图的基础上对画面风格进行改变时使用。
Scribble 黑白稿提取
涂鸦成图,比 HED 和 Canny 的自由发挥程度更高,也可以用于对手绘线稿进行着色处理。
Mlsd 直线检测
通过分析图片的线条结构和几何形状来构建出建筑外框,适合建筑设计的使用。
Seg 区块标注
通过对原图内容进行语义分割,可以区分画面色块,适用于大场景的画风更改。
Normal Map 法线贴图
适用于三维立体图,通过提取用户输入图片中的 3D 物体的法线向量,以法线为参考绘制出一副新图,此图与原图的光影效果完全相同。
Depth 深度检测
通过提取原始图片中的深度信息,可以生成具有同样深度结构的图。还可以通过 3D 建模软件直接搭建出一个简单的场景,再用 Depth 模型渲染出图。
ControlNet 还有项关键技术是可以开启多个 ControlNet 的组合使用,对图像进行多条件控制。例如:你想对一张图像的背景和人物姿态分别进行控制,那我们可以配置 2 个 ControlNet,第 1 个 ControlNet 使用 Depth 模型对背景进行结构提取并重新风格化,第 2 个 ControlNet 使用 OpenPose 模型对人物进行姿态控制。此外在保持 Seed 种子数相同的情况下,固定出画面结构和风格,然后定义人物不同姿态,渲染后进行多帧图像拼接,就能生成一段动画。
以上通过 ControlNet 的 8 个主要模型,我们解决了图像结构的控制问题。接下来就是对图像风格进行控制。
3. 图像风格控制
Stable Diffusion 实现图像风格化的途径主要有以下几种:Artist 艺术家风格、Checkpoint 预训练大模型、LoRA 微调模型、Textual Inversion 文本反转模型。
Artist 艺术家风格
主要通过画作种类 Tag(如:oil painting、ink painting、comic、illustration),画家/画风 Tag(如:Hayao Miyazaki、Cyberpunk)等控制图像风格。网上也有比较多的这类风格介绍,如:
https://promptomania.com https://www.urania.ai/top-sd-artists 但需要注意的是,使用艺术家未经允许的风格进行商用,会存在侵权问题。
Checkpoint 预训练大模型
Checkpoint 是根据特定风格训练的大模型,模型风格强大,但体积也较大,一般 5-7GB。模型训练难度大,需要极高的显卡算力。目前网上已经有非常多的不同风格的成熟大模型可供下载使用。如: https://huggingface.co/models?pipeline_tag=text-to-image
LoRA 微调模型
LoRA 模型是通过截取大模型的某一特定部分生成的小模型,虽然不如大模型的能力完整,但短小精悍。因为训练方向明确,所以在生成特定内容的情况下,效果会更好。LoRA 模型也常用于训练自有风格模型,具有训练速度快,模型大小适中,配置要求低(8G 显存)的特点,能用少量图片训练出风格效果。常用 LoRA 模型下载地址:
https://stableres.info https//civitai.com (友情提醒:不要在办公场所打开,不然会很尴尬)
Textual Inversion 文本反转模型
Textual Inversion 文本反转模型也是微调模型的一种,它是针对一个风格或一个主题训练的风格模型,一般用于提高人物还原度或优化画风,用这种方式生成的模型非常小,一般几十 KB,在生成画作时使用对应 Tag 在 prompt 中进行调用。
自有风格模型训练
Stable Diffusion 的强大之处还在于能够自定义训练风格模型,如果现有风格无法满足要求,我们还可以自己训练特定风格模型。Stable Diffusion 支持训练大模型和微调模型。我比较推荐的是用 LoRA 模型训练方法,该方法训练速度快,模型大小适中(100MB 左右),配置要求低(8G 显存),能用极少量图片训练出风格效果。例如:下图中我用了 10 张工作中的素材图,大概花了 20 分钟时间训练出该风格的 LoRA 模型,然后使用该模型就可以生成风格类似的图片。如果将训练样本量增大,那么训练出来的风格样式会更加精确。
了解了 Stable Diffusion 能干什么后,再来介绍下如何部署安装使用它。
二、AI 绘画工具的部署安装 以下主要介绍三种部署安装方式:云端部署、本地部署、本机安装,各有优缺点。当本机硬件条件支持的情况下,推荐本地部署,其它情况推荐云端方式。
1. 云端部署 Stable Diffusion
通过 Google Colab 进行云端部署,推荐将成熟的 Stable Diffusion Colab 项目复制到自己的 Google 云端硬盘运行,省去配置环境麻烦。这种部署方式的优点是:不吃本机硬件,在有限时间段内,可以免费使用 Google Colab 强大的硬件资源,通常能给到 15G 的 GPU 算力,出图速度非常快。缺点是:免费 GPU 使用时长不固定,通常情况下一天有几个小时的使用时长,如果需要更长时间使用,可以订阅 Colab 服务。
推荐两个目前比较好用的 Stable Diffusion Colab,选择相应模型版本运行即可:
Stable Diffusion Colab: github.com/camenduru/stable-diffusion-webui-colab (不带 ControlNet) ControlNet Colab: github.com/camenduru/controlnet-colab (带 ControlNet)
Colab 运行界面如下,点击连接虚拟机,连接成功后点击左侧运行代码,等待环境自动配置完成后,点击 WebUI URL 即可运行 Stable Diffusion。
Stable Diffusion WebUI 运行界面如下,在后面的操作方法里我会介绍下 Stable Diffusion 的基础操作。
2. 本地部署 Stable Diffusion
相较于 Google Colab 云端部署,本地部署 Stable Diffusion 的可扩展性更强,可自定义安装需要的模型和插件,隐私性和安全性更高,自由度也更高,而且完全免费。当然缺点是对本机硬件要求高,Windows 需要 NVIDIA 显卡,8G 以上显存,16G 以上内存。Mac 需要 M1/M2 芯片才可运行。
本地部署方式主要分四步,以 Mac M1 为例:
第 1 步:安装 Homebrew 和 Python3.10 环境
Homebrew 是一个包管理工具,具体安装方法可参考: https://brew.idayer.com/
Python3.10 安装:brew install cmake protobuf rust python@3.10 git wget
第 2 步:克隆 Stable Diffusion WebUI 项目仓库
推荐下载 AUTOMATIC1111 的 Stable Diffusion WebUI,能很好的支持 ControlNet 扩展。
克隆项目仓库:git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
第 3 步:下载并存放 Stable Diffusion 模型
Stable Diffusion 模型可以下载官方提供的 1.5 或 2.0 版本的 ckpt 文件,其它风格模型则根据自己需要下载。下载地址: huggingface.co/models?pipeline_tag=text-to-image
下载完后找到 stable-diffusion-webui 文件夹,把下载的 ckpt 大模型文件存放到 stable-diffusion-webui/models/Stable-diffusion 目录下。
如果下载了 LoRA 模型的 safetensors 文件,则存放到 stable-diffusion-webui/models/Lora 目录中。
Textual Inversion 文本反转模型的 pt 文件,存放到 stable-diffusion-webui/embeddings 目录中。
第 4 步:运行 Stable Diffusion WebUI
模型文件存放完成后,运行 Stable Diffusion WebUI:
先输入 cd stable-diffusion-webui 再输入 ./webui.sh,程序会自动完成下载安装。
运行完毕后显示:Running on local URL: http://127.0.0.1:7860 To create a public link, set `share=True` in `launch()`
在浏览器中打开 http://127.0.0.1:7860 ,即可运行 Stable Diffusion WebUI
需要用到的资源:
Homebrew 包管理工具: brew.idayer.com/guide/ Python 安装: www.python.org/downloads/ Stable Diffusion 项目仓库: github.com/AUTOMATIC1111/stable-diffusion-webui Stable Diffusion 模型: huggingface.co/models?pipeline_tag=text-to-image ControlNet 的安装
安装完 Stable Diffusion WebUI 后,我们再安装 ControlNet 扩展,以便进行图像的精准控制。
安装方法:
第 1 步:安装 ControlNet 插件
点击扩展,选择从 URL 安装,输入插件地址 https://github.com/Mikubill/sd-webui-controlnet ,点击 Install 后重启 WebUI。
第 2 步:安装 ControlNet 模型
打开模型下载页面 https://huggingface.co/lllyasviel/ControlNet/tree/main
将 annotator 目录中的人体检测预处理模型 body_pose_model.pth 和 hand_pose_model.pth 下载至本地 stable-diffusion-webui/extensions/sd-webui-controlnet/annotator/openpose 目录。 将深度图模型 dpt_hybrid-midas-501f0c75.pt 下载至本地 stable-diffusion-webui/extensions/sd-webui-controlnet/annotator/midas 目录 将 models 目录中的文件下载至本地 stable-diffusion-webui/extensions/sd-webui-controlnet/models 目录 重启 WebUI 即可使用 ControlNet
解决 ControlNet 在 Mac M1 上无法运行问题
对于 Mac M1 芯片的电脑来说,直接运行 ControlNet 会报错,导致无法使用 ControlNet。原因是 CUDA 是适用于 NVIDIA GPU 的计算框架,当前 Mac OS 无法使用此框架,因此脚本会尝试使用 CPU,但 M1 不支持半精度数字。因此我们需要跳过 CUDA 并使用 no-half。
解决方法:
找到 webui-macos-env.sh 文件 添加 export COMMANDLINE_ARGS="--precision full --no-half --skip-torch-cuda-test"
3. 本机安装 DiffusionBee
如果觉得云端部署和本地部署比较繁琐,或对使用要求没有那么高,那就试下最简单的一键安装方式。下载 Diffusionbee 应用: diffusionbee.com/download 。优点是方便快捷,缺点是扩展能力差(可以安装大模型,无法进行插件扩展,如 ControlNet)。
三、AI 绘画工具的操作技巧 1. Stable Diffusion 基础操作
文生图
如图所示 Stable Diffusion WebUI 的操作界面主要分为:模型区域、功能区域、参数区域、出图区域。
txt2img 为文生图功能,重点参数介绍: 正向提示词:描述图片中希望出现的内容 反向提示词:描述图片中不希望出现的内容 Sampling method:采样方法,推荐选择 Euler a 或 DPM++ 系列,采样速度快 Sampling steps:迭代步数,数值越大图像质量越好,生成时间也越长,一般控制在 30-50 就能出效果 Restore faces:可以优化脸部生成 Width/Height:生成图片的宽高,越大越消耗显存,生成时间也越长,一般方图 512x512,竖图 512x768,需要更大尺寸,可以到 Extras 功能里进行等比高清放大 CFG:提示词相关性,数值越大越相关,数值越小越不相关,一般建议 7-12 区间 Batch count/Batch size:生成批次和每批数量,如果需要多图,可以调整下每批数量 Seed:种子数,-1 表示随机,相同的种子数可以保持图像的一致性,如果觉得一张图的结构不错,但对风格不满意,可以将种子数固定,再调整 prompt 生成
图生图
img2img 功能可以生成与原图相似构图色彩的画像,或者指定一部分内容进行变换。可以重点使用 Inpaint 图像修补这个功能:
Resize mode:缩放模式,Just resize 只调整图片大小,如果输入与输出长宽比例不同,图片会被拉伸。Crop and resize 裁剪与调整大小,如果输入与输出长宽比例不同,会以图片中心向四周,将比例外的部分进行裁剪。Resize and fill 调整大小与填充,如果输入与输出分辨率不同,会以图片中心向四周,将比例内多余的部分进行填充 Mask blur:蒙版模糊度,值越大与原图边缘的过度越平滑,越小则边缘越锐利 Mask mode:蒙版模式,Inpaint masked 只重绘涂色部分,Inpaint not masked 重绘除了涂色的部分 Masked Content:蒙版内容,fill 用其他内容填充,original 在原来的基础上重绘 Inpaint area:重绘区域,Whole picture 整个图像区域,Only masked 只在蒙版区域 Denoising strength:重绘幅度,值越大越自由发挥,越小越和原图接近
ControlNet
安装完 ControlNet 后,在 txt2img 和 img2img 参数面板中均可以调用 ControlNet。操作说明:
Enable:启用 ControlNet Low VRAM:低显存模式优化,建议 8G 显存以下开启 Guess mode:猜测模式,可以不设置提示词,自动生成图片 Preprocessor:选择预处理器,主要有 OpenPose、Canny、HED、Scribble、Mlsd、Seg、Normal Map、Depth Model:ControlNet 模型,模型选择要与预处理器对应 Weight:权重影响,使用 ControlNet 生成图片的权重占比影响 Guidance strength(T):引导强度,值为 1 时,代表每迭代 1 步就会被 ControlNet 引导 1 次 Annotator resolution:数值越高,预处理图像越精细 Canny low/high threshold:控制最低和最高采样深度 Resize mode:图像大小模式,默认选择缩放至合适 Canvas width/height:画布宽高 Create blank canvas:创建空白画布 Preview annotator result:预览注释器结果,得到一张 ControlNet 模型提取的特征图片 Hide annotator result:隐藏预览图像窗口
LoRA 模型训练说明
前面提到 LoRA 模型具有训练速度快,模型大小适中(100MB 左右),配置要求低(8G 显存),能用少量图片训练出风格效果的优势。
以下简要介绍该模型的训练方法:
第 1 步:数据预处理
在 Stable Diffusion WebUI 功能面板中,选择 Train 训练功能,点选 Preprocess images 预处理图像功能。在 Source directory 栏填入你要训练的图片存放目录,在 Destination directory 栏填入预处理文件输出目录。width 和 height 为预处理图片的宽高,默认为 512x512,建议把要训练的图片大小统一改成这个尺寸,提升处理速度。勾选 Auto focal point crop 自动焦点裁剪,勾选 Use deepbooru for caption 自动识别图中的元素并打上标签。点击 Preprocess 进行图片预处理。
第 2 步:配置模型训练参数
在这里可以将模型训练放到 Google Colab 上进行,调用 Colab 的免费 15G GPU 将大大提升模型训练速度。LoRA 微调模型训练工具我推荐使用 Kohya,运行 Kohya Colab: https://colab.research.google.com/github/Linaqruf/kohya-trainer/blob/main/fast-kohya-trainer.ipynb
配置训练参数:
先在 content 目录建立 training_dir/training_data 目录,将步骤 1 中的预处理文件上传至该数据训练目录。然后配置微调模型命名和数据训练目录,在 Download Pretrained Model 栏配置需要参考的预训练模型文件。其余的参数可以根据需要调整设置。
第 3 步:训练模型
参数配置完成后,运行程序即可进行模型训练。训练完的模型将被放到 training_dir/output 目录,我们下载 safetensors 文件格式的模型,存放到 stable-diffusion-webui/models/Lora 目录中即可调用该模型。由于直接从 Colab 下载速度较慢,另外断开 Colab 连接后也将清空模型文件,这里建议在 Extras 中配置 huggingface 的 Write Token,将模型文件上传到 huggingface 中,再从 huggingface File 中下载,下载速度大大提升,文件也可进行备份。
2. Prompt 语法技巧
文生图模型的精髓在于 Prompt 提示词,如何写好 Prompt 将直接影响图像的生成质量。
提示词结构化
Prompt 提示词可以分为 4 段式结构:画质画风 + 画面主体 + 画面细节 + 风格参考
画面画风:主要是大模型或 LoRA 模型的 Tag、正向画质词、画作类型等 画面主体:画面核心内容、主体人/事/物/景、主体特征/动作等 画面细节:场景细节、人物细节、环境灯光、画面构图等 风格参考:艺术风格、渲染器、Embedding Tag 等
提示词语法
提示词排序:越前面的词汇越受 AI 重视,重要事物的提示词放前面 增强/减弱:(提示词:权重数值),默认 1,大于 1 加强,低于 1 减弱。如 (doctor:1.3) 混合:提示词 | 提示词,实现多个要素混合,如 [red|blue] hair 红蓝色头发混合 + 和 AND:用于连接短提示词,AND 两端要加空格 分步渲染:[提示词 A:提示词 B:数值],先按提示词 A 生成,在设定的数值后朝提示词 B 变化。如[dog:cat:30] 前 30 步画狗后面的画猫,[dog:cat:0.9] 前面 90%画狗后面 10%画猫 正向提示词:masterpiece, best quality 等画质词,用于提升画面质量 反向提示词:nsfw, bad hands, missing fingers……, 用于不想在画面中出现的内容 Emoji:支持 emoji,如 ? 形容表情,? 修饰手
常用提示词举例:
3. ChatGPT 辅助生成提示词
我们也可以借助 ChatGPT 帮我们生成提示词参考。
给 ChatGPT 一段示例参考: https://dreamlike.art/guides/using-openai-chat-gpt-to-write-stable-diffusion-prompts 根据参考生成 Prompts,再添加细节润色
4. Stable Diffusion 全中文环境配置
在实际使用中,我们还可以把 Stable Diffusion 配置成全中文环境,这将大大增加操作友好度。全中文环境包括了 Stable Diffusion WebUI 的汉化和 Prompt 支持中文输入。
Stable Diffusion WebUI 汉化
安装中文扩展插件:点击 Extensions 选择 Install from URL,输入 https://github.com/VinsonLaro/stable-diffusion-webui-chinese ,点击 Install,并重启 WebUI 切换到中文模式:在 Settings 面板中,将 User interface 中的 Localization 设置成 Chinese 中文模式,重启 WebUI 即可切换到中文界面
Prompt 中文输入
下载提示词中文扩展插件: https://github.com/butaixianran/Stable-Diffusion-Webui-Prompt-Translator ,将项目作为 zip 文件下载,解压后放到 stable-diffusion-webui/extensions 目录中,重启 WebUI 调用百度翻译 API:去 api.fanyi.baidu.com 申请一个免费 API Key,并将翻译服务开通。在管理控制台的开发者信息页中确认 APP ID 和 密钥 在 Stable Diffusion WebUI 的 Prompt Translator 面板中,选择百度翻译引擎,并将申请的 APP ID 和 密钥填写进去,点击保存 使用:在 Stable Diffusion WebUI 页面顶部会出现一个翻译工具栏,我们在提示词输入框中输入中文,点击工具栏中的翻译就能自动把提示词替换成英文
结语 本文简要介绍了 AI 绘画工具 Stable Diffusion 的安装使用,以及如何通过 ControlNet 实现图像的精准控制,如何通过模型加载和自有风格模型训练来控制图像画风。可以说这些技术的出现使得 AI 绘画具备了实际的生产能力, 设计师 们可以充分利用好这些强大的生产工具来提升设计效率。