IA lab_第34页_深圳铁匠设计

实战案例解析！如何用4个步骤引导用户操作提高转化率？

UI交互 2023-04-14

前段时间负责一个运营活动的改版工作，该活动的设定是通过设置目标奖励，提升用户的购买力。但是通过该模块的数据反馈发现，活动的用户参与度与购买转化率都不是很理想。结合数据与相关的用户调研发现，导致这个结果的原因主要概括为两点：活动曝光弱，用户不清楚活动内容，很少主动点击大部分用户购买力远远低于设置的目标，导致“心有余...

前段时间负责一个运营活动的改版工作，该活动的设定是通过设置目标奖励，提升用户的购买力。但是通过该模块的数据反馈发现，活动的用户参与度与购买转化率都不是很理想。结合数据与相关的用户调研发现，导致这个结果的原因主要概括为两点：
活动曝光弱，用户不清楚活动内容，很少主动点击大部分用户购买力远远低于设置的目标，导致“心有余而力不足” 更多引导设计干货：

新用户引导流程设计，需要做好这12个细节！编者按：这篇文章出自资深 B 端 UI/UX 设计师 Taras Bakusevych ，他对于产品、视觉、体验设计上，都有深入的钻研，而这些钻研是实实在在的项目喂出来的实战经验。
阅读文章 >

以下是当前活动示意：

针对当前定位的问题，我们制定了本次活动改版的方向与目的，即
增加用户对活动的感知，引导用户参与活动调整运营策略，促进用户完成阶段目标，提升购买力对于第一点，我们比较容易解决，但是第二点中，如何调整当前的运营策略，我们跟运营人员进行了脑暴，最终基于成本与当前用户习惯为考量，我们制定的新的策略是“在第一个阶段目标之前，新增几个小目标，通过拆解目标的形式，提升用户对于阶段目标的完成度”，如图：

但是过多的阶段目标，容易让活动页面变得“枯燥”，为了提升用户在该页面的活跃度，我们需要将新增的“小目标”用其他交互形式承载，在经过了与业务部门的沟通脑暴后，最终我们选择了“抽奖”。
将“小目标”以任务的形式呈现，用户完成任务即获得抽奖机会。为了促进用户不断的完成任务，在设置抽奖规则的时候，我们做了一些设计。
第一，将抽奖概率设置成 100%，增加活动的吸引力；第二，设置阶梯抽奖，即用户完成的阶段越高，抽到的奖励就会越好，增加阶段的完成度。我们将这两点运用到了最终的抽奖页面中来。

确定了新的改版方向后，接下来就需要考虑用户在整个活动的操作路径了。理想情况下，我们希望用户的操作路径为：进入活动-购买商品-参与抽奖… 所以如何提高用户在理想的情况下进行交互，我们就需要对用户做一些操作上的引导，主要包括引导用户进入活动以及引导用户抽奖。如何引导？主要概括为四部分，即激励引导、场景引导、布局引导、操作引导。
接下来我们逐个进行拆解分析。
一、激励引导通过走查，发现当前的活动入口是放在了首页 banner 的位置，虽然该区域整体曝光度比较高，但还是存在一些问题，主要包括以下两点：
由于 banner 自动轮播，导致活动不易被发现，且 banner 内容参差不齐，用户对于活动的感知较差；目前活动入口仅仅展示活动标题，无法达到刺激用户点击的目的针对当前问题，确定了交互优化的策略，即提升活动的曝光以及增加用户点击的欲望。通过与业务沟通得知，该活动属于长期存在的，需要建立活动在用户中的心智，所以最终选择用一个固定入口来承载，根据当前的首页布局，最终选择了异形胶囊图，通过视觉手法，在首页突出整个活动入口，同时在标题上加上活动利益点，从而达到刺激用户点击进入活动的目的。

二、场景引导基于前面对于活动玩法的升级，我们加入了抽奖的玩法。除了用户主动进入活动页参与抽奖外，还需要考虑还有哪些场景可以引导用户进行抽奖？我们可以从抽奖的“源头”开始分析，用户获得抽奖机会的条件是完成一个阶段目标，而目标的设定是基于用户的“购买力”，对于电商产品而言，用户完成购买的节点在付款后的订单结果反馈。
所以基于这个场景来看，如果需要引导用户进行抽奖，我们可以在用户完成支付后进行。
当用户完成支付后，我们需要判断用户当前的累计购买金额是否达到抽奖节点，当满足条件时，我们就可以提示用户前去抽奖。这样做的好处在于，一方面我们可以提升用户对于活动的参与度，另一方面通过引导用户参与抽奖并获得奖励，激励用户向更高等级的奖励发起冲击，从而达到提升用户购买力的目的。

三、布局引导当前用户参与抽奖，仅仅是通过用户下单后，如果完成对应抽奖设定的额度时，引导用户前去抽奖，但是这也存在一些问题：
当用户进入活动页时，如何感知抽奖，如何唤起抽奖页？当弹窗引导用户抽奖时，如果用户关闭弹窗，用户如何再次前去抽奖？所以针对当前的问题，我们需要在活动页增加抽奖入口的露出，一方面引导用户进入抽奖页，通过奖品的“诱惑”让用户完成任务抽奖；另一方面当用户有抽奖机会时，可以通过该入口进入抽奖页。那该如何在当前页面进行活动入口的布局呢？
起初打算用“狗皮膏药”的形式，该方式的好处在于不随页面滑动而变化，且通过一些文案与微动效的设计，使该入口在页面变得格外的显眼，但是经过分析发现，这种形式还是存在了一些问题。

该方式仅仅是展示了抽奖的入口，但是却没有体现用户有没有抽奖机会，以及怎样才能获得抽奖机会。所以该活动入口的布局既要引导用户抽奖，又要体现当前用户是否可抽奖，所以我们进行了调整，如图：

调整后的抽奖入口放在了活动页上方，根据用户“从上而下”的视觉动线，我们希望用户先关注与抽奖相关的“小目标”，当用户完成相关小目标后，发现离最终阶段奖励已经接近，促使用户完成“临门一脚；同时在抽奖入口的内容设计上，我们不仅告知用户当前是否可抽奖，同时告知用户获得抽奖机会的进度，希望通过这种方式来传达抽奖的活动规则。
四、操作引导基于前面的分析，当前我们在活动页面增加了“抽奖”的入口与流程，但是不管是抽奖还是获得阶段奖励，用户都需要去提升购买额度，这也是该页面的主要操作，如何进一步的引导用户点击并转化，我们可以结合当前的奖励机制来分析。
当前我们将奖励拆解为两种，即抽奖奖励与阶段奖励。但是他们有一定的共性，即用户需要完成一定的下单量。如果把这个活动比作“马拉松”，那么各奖励的下单量就是沿途设定的距离路标。用户主要关注的是距离下一目标的路程，因为下一目标对于用户来说更好到达。所以基于此，我们可以在“操作按钮”上给与一定的操作引导，告知用户距离下次阶段奖励的“额度”，促使用户点击转化。

总结以上，就是笔者根据工作中案例，分享的一篇关于如何引导用户操作的文章，经验有限，欢迎大家批评指正与交流。
AI会抢走修图软件的饭碗吗？

设计动态 2023-04-14

AI也能瘦脸、祛痘、加滤镜之后，“美图秀秀们”的饭碗要被抢了？近期，有传言称某头部修图APP“因为AI（的冲击）正处于生死存亡之际”。虽未指名道姓，但行业内给出的反应大多是：AI在“无差别攻击”各个行业的时候，修图APP也难逃一劫，因为目前AIGC以图像生成
在AI对各行各业带来影响、甚至造成“无差别攻击”时，修图类APP好像也要遭到冲击了，毕竟AI在接受训练之后，也许就可以替代修图软件使用时前期复杂的参数设置步骤，甚至把修图这个工作做得更好。那么，修图软件们的饭碗，真的要被抢了吗？

AI也能瘦脸、祛痘、加滤镜之后，“美图秀秀们”的饭碗要被抢了？
近期，有传言称某头部修图APP“因为AI（的冲击）正处于生死存亡之际”。虽未指名道姓，但行业内给出的反应大多是：AI在“无差别攻击”各个行业的时候，修图APP也难逃一劫，因为目前AIGC以图像生成方面的应用相对最为广泛。
从C端使用来看，目前国内手机美颜修图类APP以美图秀秀、醒图、轻颜相机等为主流，抖音、快手等社交工具也有类似功能。无论受众是谁，功能方向大体一致，即美颜、滤镜、特效三种。业内人士表示，AI技术早在2015年之后就迎来了第一次爆发，当时就对这类图像处理软件形成了革命性的颠覆，因为AI能做出以前做不了的事，比如换脸、加面部“返老还童”特效，增加发量、改变发色等等。
如今，生成式AI成为焦点，再一次给修图类APP带来了机会和冲击。技术开源，壁垒消失，新玩家任何时刻都可能入局抢饭碗。同时，内部如何应用技术，如何成功落地，又是新的课题。“美图秀秀们”多年以来积累的用户基数，在美颜修图上建立起的用户心智，也许会给其筑起护城河，但在今天，技术祛魅，流量的走向谁都难以预估。真正的较量，不在于技术，而在于运用技术，在于审美的独特性，在于更懂用户。
一、AI早就在帮我瘦脸了市面上，主要面向C端用户的图像处理软件，大致分为几类。
一种是以美图秀秀为代表的，专门拍摄美颜照片，或处理用户照片的软件，包含瘦脸、祛痘、磨皮、美白等基础功能。另一种是社交软件中的拍摄功能，抖音、快手、小红书、微博等都可以直接拍照、处理并发布，也能完成基础的美颜，还能加滤镜，加猫耳朵、搞怪脸等特效。此外，还有专门做面向影楼等专业摄影师的软件，包括小型创业公司，以及美图也有toB的产品。更专业化的，还有图像处理行业鼻祖Photoshop、Blender等。
本文将着重讨论美图秀秀这类C端用户比较熟知的软件。这类公司的梯队划分很清晰。行业第一是创立于2008年的美图秀秀，最开始做PC端，2011年做APP，2016年上市。第二梯队里，2015年前后，腾讯推出天天P图，今日头条脸萌团队先后推出Faceu激萌、轻颜相机，那一波也有不少小而美的创业公司推出的产品出现，如B612咔叽、黄油相机等。2020年之后，字节跳动推出醒图，快手推出原片。该行业的特点就是向头部集中，要么是美图这样赢在入局早的公司，要么就是背靠互联网大厂。
美图是一家完成了图像处理产品闭环，并以相关业务获得收入的公司。以它的财报为参考，美图主要靠VIP用户收入、广告、toB业务等赚钱，近五年的总营收在10亿元左右，其中去年获得了20.85亿元的总营收，付费会员数560万。
美图自称是一家以人工智能为驱动的科技公司，在国内某大厂从事美颜技术工作的高广也告诉深燃，业内大多数公司早已能成熟地将AI应用到自己的业务中。AI进入到图像处理软件中，主要带来两方面的改变。
一是传统修图功能的“AI化”。美颜和滤镜是图像处理软件最传统的两项功能，高广解释，在AI出现之前，在图片上加滤镜的技术原理是，做一个滤波，把图片整体修改成“黄昏”、“阳光”、“油画”等效果，“人还是人，植物还是植物，只有整张照片的调性发生了改变。”滤波的作用就是把信号中的噪声和杂波进行过滤，留下有用的信号，这也是长久以来，美颜类软件的底层技术逻辑。而磨皮就是把分辨率降低，用高斯模糊把细节抹掉。
让AI来做同样的事情，逻辑就变了。“用AI来做美颜，原理是训练各种各样的模型，把各种数据拿进去处理，然后调参数，调到一个比较合理的数值。”高广说，用以前的技术，则要建立一个映射，设置好一套颜色的转换关系，“比如亚洲人皮肤本来是偏黄色的，要美白，那就要设置好，是把黄色映射到偏暗还是偏亮。” 在传统的技术下，针对不同人种的需求，就要设置多个映射。对比之下，让AI技术来处理照片，好处在于，不同用户的需求，只要用一个模型就可以了。
二是纯粹基于AI技术的新功能。早年间，用户瘦脸的操作方式是自行在人脸上定点向内推。原理也很简单，图片中的人脸有基本的像素位置，构成一个坐标，用户拉动原有的像素位置，坐标由此发生变形，也就完成了脸部的放大和缩小。
2017年之后，“面部重塑”问世，这也就是在AI技术下的新功能。修图时系统先识别脸部信息，点击放大双眼、眼睑下至、缩小鼻头等指令，就可以完成自然的修图。
高广说，类似面部重塑、增加发量等功能，一般都是用AI完成的。面部重塑功能，就需要首先训练AI什么是人脸部，包括什么是眼睛、鼻子、嘴巴，位置分布在何处，他表示，这些功能在AI出现之前很难实现。“ 因为要训练AI，一是头发的定义，二是头发的准确性，让发丝顺着自然的纹理向下走，然后在上面着色。传统方法是做不到的，最多能拿个照片过来做一个滤波，但还是达不到AI的效果。 ”
从传统的美颜技术，过渡到AI主导下的产品时代，核心的改变在于识别和内容理解。AI出现之前，颜色转换、脸部位置的移动、磨皮祛痘，都需要经过前期复杂的设置，而AI只需要接受训练，就能“一劳永逸”。可以说， AI把传统的修图重做了一遍，而且做得更好。
二、AI修图，还能怎么进化？最新一波的AI热潮涌来，行业玩家也在急着找新的机会。
基于指令生成、基于图片处理，是AI应用在这一行业的主要技术方向。3月末，Adobe发布了AI模型Firefly，可以用文字生成图像，微软、Meta、Google等国际巨头也都有AI图像生成业务的布局。
回到C端用户使用的APP，美图、醒图、天天P图等APP不敢掉以轻心。“我们现在基本是按周甚至天为单位在进化。”美图公司方面向深燃表示，最近他们密集推出了基于AI技术的图片和视频方向的功能。
深燃在各大修图软件上看到，生成式AI的运用早已细分为几个功能挂上了首页供使用。用户可以上传一张照片，AI将其转换为卡通、CG、复古形象，或者完成增加笑容、头部放大、路人消除等功能。也可以上传几张自己的照片，AI可以依照这几张照片，抓取用户不同角度的面貌特征，生成不同风格的画像。甚至还有Midjourney暂时都无法完成的工作，即导入一张简笔草图，生成多张完善的图片。
高广表示，2015年前后，手机APP的创业热潮涌来，也是那时，AI也开始大规模地应用到修图行业。能给人脸加上各种丰富的特效、能近乎无痕地完成美颜的修图APP，在当年收割了一波年轻用户。
当下最新的AI技术，也给行业带来了新的增量，两个趋势出现了。
一是个性化的训练。现在AI修脸一般是经过大量的模型训练之后，得出最折中的经验值，给用户一个相对普适的修图方案。C端用户也可以感觉到，例如在进行面部重塑的时候，可以选择向内收下颌线，问题在于，圆脸型和方脸型的下颌走向不同，都由统一的AI识别和面部处理，效果大相径庭，因此也有很多用户觉得AI修的脸很怪异。
“做得好一点的话，就是给每个用户建立数据库，下发固定的参数模型，针对性地解决每个用户的需求。”高广说，用户也只需要导入一些照片训练APP，APP就能收集数值，进行分析。美图方面对深燃表示，从技术上讲，让AI记住用户特征并不难，原理和美颜参数的设定差不多。
要完成足够精准的个性化训练，同时也让APP在理解大众需求时更加精准，需要技术和训练集的加持。在这一点上，用户规模庞大的头部修图类公司，具备一定优势。
二是理解指令。此前，GAN模型（生成对抗网络）已经得到了广泛应用，精准识别面部，以及图片中包含的要素。下一步，从业者要做的是，如何基于新一代的扩散模型，充分理解自然语义，给出具体的修图执行。高广表示，扩散模型应用的原理差不多，“用户给出prompt（提示词），我们可以根据NLP理解指令，之后把它们分化成一个个参数下发并执行。”
长期关注AI领域的从业者Elsa也认可这一趋势。“AI修图可能改变的是人机交互模式，现在还停留在自己手动拉一拉点一点的阶段，等到AI对自然语义的理解更进一步后，修图时只要说一句‘我要瘦脸’就可以了。”Elsa说，“ AI现在依赖的是低语境，它需要用户表达得更精准，而中文是一种高语境的表达，习惯模糊、习惯意会。以后的趋势是指令的可量化，想象一个人在帮你修图，你要怎么精确简洁地让它理解你所说的是哪一种瘦脸。 ”
也就是说，AI用于图像生成和图像处理，都要建立在对文字和图片的理解上。AI已经可以帮助修图软件更好地瘦脸、祛痘、加滤镜、换背景，也可以生成多种风格的图片。而未来的趋势，在于如何在普适完美的基础上，做到个性化的精准匹配，以及减少用户自主操作的步骤，听懂指令，准确执行。
从业者认为，这会带来未来修图行业的用户分化。理解直白指令，修图过程完全让AI代劳，这往往是小白用户的需求，这部分用户潜力是巨大的，美图这类公司会获得新的用户增量。而对修图的自主性要求较高的用户，如B端用户等，则会慢慢向更专业的软件涌去，即便Photoshop等软件也有AI技术的加码，但这类用户需要的是“你得懂我，但不能完全帮我做事”。
另一个新的机遇在于，AI还能帮助修图软件自身提高生产效率。高广说，“特效这种功能是需要设计师自己画图的，生成式AI可以在这一部分高效地给出解决方案。”他表示，现在AI也可以完善草图，给一个随手画的素描上色、加五官和风格，成稿直接可以用。
三、AI来了，“美图秀秀们”为什么颤抖？传言中的“生死存亡之际”或许有些夸张，但这一波AIGC对修图软件行业的冲击是事实。技术的发展，让创业的门槛降低，想要入局“抢饭碗”的人不少。
Tori以前在北美做前端工程师，她刚刚回国，正寻找生成式AI在应用层面的机会。“前段时间有个很火的产品叫Lensa，最高峰时期，一天之内的流水接近100万美元。它的原理现在看非常简单，就是设置了几组固定的prompt，把用户照片导进去，生成一个图片。当时收费2-10美元不等，它其实并没有用到高级的图像处理技术，只是用了一个API call，在外面绑了一个应用的UI。”Tori的感知是，亘古不变的信息差面前，能踩到风口，就能赚到钱。
AI领域资深从业者赵洋告诉深燃，“中国市场永远会有这类APP的存在。”赵洋表示，技术是开源的，且可能长时间固化，靠同一种技术吃饭的人会越来越多，而正在吃饭的人，手里的饭碗随时会被砸。
高广也认为，“市面上的公司，技术和产品也都大差不差。” 技术壁垒不在了，理论上讲，谁都有可能造出下一个“美图秀秀” 。说白了，所有修图软件，用户几乎都是同一拨人，用户能为一个软件的滤镜付费，就也能为另一个软件更具特点的滤镜付费。
目前，美图的第一大收入来源是VIP订阅。2018年-2021年，美图公司连续亏损，2022年才扭亏为盈。最新的动态中看，美图公司极其重视AIGC给其带来的增长，尤其是在订阅用户上的增长。深燃注意到，美图秀秀APP中涉及AI作图的几项功能，大多需要单独付费，是其拉高收入的重要“武器”。未来在竞争压力之下，美图秀秀们在AI上的投入只能多不能少。
当然，对于头部企业来说，最大的护城河是用户规模。
有从业者分析，美图自身坐拥上亿用户，醒图、天天P图背靠大厂，有抖音和腾讯的导流，短期内受到的影响或许不太明显，但怎样拥抱AI，留住手里的用户，是企业需要面对的问题。
AI的到来，对修图行业的设计师提出了更高的要求。高广认为，图像处理这一行归根结底还是视觉和创意行业，未来的竞争点在于审美和品位。“AI可以帮忙解决掉最耗时的那一个步骤。以前可能要做两周，现在几天就完成了。”所以，企业端可能也更要考量，什么样的设计师更吃市场，什么样的设计师更具审美上的优势。
另一个是技术落地的难度。“AI的上限比较高，下限比较低。”高广表示，在修图中，如果使用传统的CV算法，会比较稳定，“但AI是通过拓展大量的数据标注进行模型训练的，会导致它在一些情况下应用得比较差。”他举例，比如瘦脸，“可能会识别错人脸，或在人脸重叠时只识别部分。”
所以，AI技术很难完全应用于一个包含多项功能的修图软件。一方面模型训练需要时间，另一方面即使完全训练好，它也会对手机性能产生极大的耗损。高广表示，“一些低端机型可能会出现卡顿等问题，如果很长时间加载不出来，也会影响APP打开率。”回到企业层面，这对团队应用AI技术的能力、训练集的质量都提出了高要求。
在技术迭代的过程中，新老玩家之间的基础差距在逐渐消失。像美图秀秀这样坐拥强大用户基数的公司，短期内也许不会受到颠覆性的影响，能做的只有在变化中保持清醒，接受变化，甚至主动带来变化。
*应受访者要求，高广、Elsa、Tori、赵洋为化名。
作者：邹帅；编辑：唐亚华
原文标题：AI会杀死“美图秀秀们”吗？
来源公众号：深燃（ID：shenrancaijing），聚焦创新经济，专注深度内容。
本文由人人都是产品经理合作媒体 @深燃授权发布，未经许可，禁止转载。
题图来自 Unsplash，基于 CC0 协议。
该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

{{{path> 收藏已收藏 {{ postmeta.bookmark }} {{{path> 点赞已赞 {{ postmeta.postlike }}
B站也开始打短视频广告了

设计动态 2023-04-14

无论是互联网还是线下，广告都成为了无缝不入的存在。打开手机App，迎面而来的是占满屏幕的开屏广告，进入到App界面，也能看拿到广告位盘踞在中间。哪怕是不打开第三方App，仅在手机各个角落游荡，也没法躲避来自广告的“死亡凝视”。图源：微博当然，广告从来就
在互联网世界里，用户似乎时刻都可以见到广告，其中短视频广告也是一种常见的形式，作为一种简单粗暴的广告形式，短视频广告有时可以带来比图文广告更高的转化。而最近有网友发现，B站也开始打短视频广告了。具体效果如何？不如来看看作者的分析。

无论是互联网还是线下，广告都成为了无缝不入的存在。
打开手机App，迎面而来的是占满屏幕的开屏广告，进入到App界面，也能看拿到广告位盘踞在中间。
哪怕是不打开第三方App，仅在手机各个角落游荡，也没法躲避来自广告的“死亡凝视”。

图源：微博
当然，广告从来就不是洪水猛兽，对于投放方来说，广告能有效拉新引流，把更多流量带到自家平台。
如果广告内容做得好，说不定用户这边也不会排斥。
但问题正是出在这里，如何把广告内容做好？或者换个更通俗的说法，怎么能把广告做得让大家看了都不反感呢？
这大概是个无解题，因为“彼之蜜糖汝之砒霜”的情况，永远都存在。
但对于投广告的平台来说，它们可以选择的，是观看广告的受众。
最近我就看到，大伙都很熟悉的B站，悄咪咪整了个船新的广告宣传版本。
不开玩笑，真的很…很刺激，成功让不少B友治愈多年的尴尬症原地复发。

图源：微博@stage1st宅社区
一、B站的广告变土了当时有位博主发了个几十秒的短视频。
视频内容和去年很流行的土味广告没啥区别，通过简单上头的剧情，带给观众冲昏头脑极致享受。

图源：微博@stage1st宅社区
这年头，互联网乐子人们最喜欢拿这类广告来解构和吐槽，所以视频能火并不意外。
但你很难想象，这个土味短视频广告是为B站而打的。
为了实现更好的引流效果，制作方甚至把App Store的B站下载界面拼接进去。
有网友看完视频后，尴尬得用脚趾扣出三室一厅。

图源：微博
这倒是不难理解，以往的B站宣传视频，基本都和高大上沾边，比如《后浪》和《我不想做这样的人》。

图源：B站
而这次，土味冲击力着实顶满，和低成本游戏的外包短视频广告，有异曲同工之妙。
视频开头，是一对闹分手的情侣在街上纠缠。
男生苦苦哀求，希望用真诚来打动女生，挽回这段支离破碎的感情。
哦豁，难不成B站这次是搞情感广告？

图源：微博@stage1st宅社区
为了展示诚意，男生甚至摆出舔狗之势，表示“你说的那些我不懂的，我都可以去学”。

图源：微博@stage1st宅社区
然而，破碎的爱情无法挽留，女主离开的心十分决绝。
也是从这时开始，视频迎来重大转折点。
“你懂我，你怎么懂我？你知道《鬼灭之刃》吗？你看过《间谍过家家吗》？”
“你知道前方高能是什么意思吗？”
“你连哔哩哔哩都没有下载，还好意思说爱我？”

图源：微博@stage1st宅社区
男生不懂，为什么对方可以因为自己没下一个App，没看过她说的那些动漫，就毅然分手。
于是便直接质问女生：“B站有啥好的，就因为这软件你跟我分手？”
确实，这种事儿要是放在现实中，多少是有点魔幻的…
但短视频广告的本质是啥？是用最短的时间冲昏观众们的脑子，让他们快速吸收广告表达的内容。
So，接下来这位女生说什么，大伙估计也猜得到。
她有理有据反驳着，说B站是二次元文化聚集地，里面都是人才，说话又好听，有很多跟她一样懂动漫的人。

图源：微博@stage1st宅社区
接下来就是B站的界面露出专场。
视频仅用10秒钟，便把B站那几个核心特色讲得明明白白。
独特的弹幕文化、互动式评论、创作力拉满的UP主和无广告看片属性，让她流连忘返。

图源：微博@stage1st宅社区
支持她在灰暗中砥砺前行的，带给她快乐的，不是与她亲密无间的男朋友，而是手机里的B站。
这一顿嘴炮耍出来，成功震碎了很多网友的三观。
一个App干翻对象，这种事哪怕放在影视剧里，都是尬出宇宙的存在啊…
广告的结尾倒是没有反转，女生因男生不用B站而气氛离开，画面秒变灰暗，留下男主独自神伤。

图源：微博@stage1st宅社区
其实这广告没啥深度内容，是乐子人路过刷到都会忍不住笑的水平。
但对于短视频广告来说，这都不重要，这类广告注重的是爆点和宣传效果。
视频在几十秒时间内呈现的剧情反转和戏剧化表演，就足以让观众留下深刻印象。
这和抖音快手的某些视频，不能说是毫不相关，只能说是完全一致。

图源：微博
还有网友调侃，如果B站推出个极速版，里面的广告大概就是这番模样。

图源：微博
二、现在才玩短视频广告，图啥？可是小雷很好奇啊，短视频广告并不是今年才流行的，为啥B站最近才开始跟进呢？在两年前，就有很多游戏公司和金融公司，用充满低俗和反转的短视频广告来吸引用户点击，提高App下载量和获取新用户。
而抖音作为国内短视频巨头，直到也没放弃用短视频广告引流，多年来孜孜不倦，专攻下沉市场。

图源：抖音广告
不过，从目前的市场情况来看，短视频广告效果确实不复当年了。
一方面是官方加大监管力度，对虚假低俗短视频广告重拳出击，红利期还在，巅峰期已过。
另一方面是普罗大众对广告的真假辨别能力有所提高。
盲目反转、无脑低俗的短视频广告，反而会引起网友反感。
像B战这次的广告虽然有出圈的趋势，但有老用户对此并不待见。

图源：B站
那B站做这种广告，又是图啥捏？是不是真的吃力不讨好？
也不是，比如它直接突出B站特色，设置了一定的剧情来吸引注意。
它可能不是个有逼格的广告，但也不是一个失败的广告，至少让人记住B站。
毕竟，B站去年第四季度的财报说明了一个事实：虽然平台用户很活跃，年轻人很多，但也是真的不赚钱。
净亏损75亿元，还还分了91亿元创作激励给UP主，雪上加霜了属于是。

图源：Bing
所以大伙也不难理解，B站为啥开始折腾起短视频广告了。
具体目的，还是为了吸引更多新用户关注，彻底“下沉”，让三四五线的年轻人都来用B站。
短视频广告最大的优势，无疑是短小精悍又上头，毕竟大伙都是图个乐子来看的…
如果做得足够魔幻，说不定还能被当成梗来玩。
最典型的例子，莫过于前阵子B站上很火的“矮人科技”卖压缩毛巾广告…

图源：B站
看过的小伙伴都知道，那广告是相当抽象和降智。
无论前面在讲什么剧情，他都能把话题接入到压缩毛巾广告，完全不给观众思考时间。
这就好像，你前一秒还在看海绵宝宝动画，后一秒视频就变成《山村老尸》。
虽然毫不相关，但绝对能让你对《山村老尸》有更深刻的印象。

图源：B站
更对味的是，压缩毛巾这广告是从B站火起来的。
这其实能看出，B站的用户并不排斥土味内容和文化，把土味短视频解构重塑，反而是用户一直以来都乐于做的事儿。
专注于生产低俗短视频的虎哥，能在B站“秽土转生”，成为王家卫式土味的代表。
土味短视频广告，自然也能借此机会，造成大范围传播和玩梗。

图源：B站
小雷瞅见，那条土味广告火了以后，现在B站已经有很多用户在玩梗了。
各种复刻版和多国语言版台词不断蹦出，节目效果拉满。

图源：B站
老用户会主动对此玩梗，贡献出自来水流量。
那在新用户的拉新，和App下载量的提升上，短视频广告又能带来多少帮助咧？
首先啊，短视频的受众用户，就有很大一部分是三四线城市的用户，也就是所谓的“下沉”市场用户。
这类用户对互联网套路了解不深，但也有很强的知识摄入与娱乐需求。
而那些土味短视频广告，又是专门为下沉用户而做的，既有反转又有爆点，让人忍不住点击下载。

图源：抖音广告
要是还不够吸引人？没关系。
那短视频广告还有一招杀手锏—— 免费送福利。
这个很好理解啊，下沉用户对价格都比较敏感，哪怕每天能从App中薅几毛钱，他们都乐意每日签到+看广告。

图源：快手极速版
B站自然也懂这个道理，所以在其他短视频广告中，它会宣传一些“福利”卖点。
比如，XX视频真的可以“看到爽”。
又比如，把“免费看海量”综艺和电影，作为一大宣传卖点。
对于下沉市场那些未使用过B站的用户来说，这绝对是一个大诱惑。

图源：B站
每多一个新用户点击左下角的下载链接，B站就有可能多赚一个新用户。
可能这就是B站想要破局的一个方法吧。
不过在我看来，短视频广告还是得真实点，像B站宣传免费看电影的卖点，多少有以偏概全的成分。
因为有很多电影，即使是大会员也需要花5个B币来购买观影。
另外，因为App而抛弃感情这种无脑剧情，同样是槽点满满。

图源：某借条广告截图
最后做个小总结叭，在如今短视频成为娱乐主流的时代，短视频广告确实是一个很优秀的广告形式。
它简单粗暴上头，转化率比普通的图文广告高。
而作为一个用了B站好几年的用户，我还是希望B站能越来越好，如果能通过短视频广告吸引更多新用户使用，绝对是件好事儿。
毕竟这年头，连视频开头广告的视频平台，真就一个手都数得过来。
不过说实在的，短视频广告还挺容易踩雷，毕竟为了设置反转和爆点，剧情往往会前后不通。
如果B站能在短视频内容剧情上多多琢磨，不仅提高广告转化率，还能让大众更容易接受这种广告形式。
作者：chokst
原文标题：浓眉大眼的B站，怎么推出了这种土味广告？
来源公众号：小雷哔哔（ID：xiaoleibbb），每天哔哔科技圈那些事儿。
本文由人人都是产品经理合作媒体 @小雷哔哔授权发布，未经许可，禁止转载。
题图来自 Unsplash，基于 CC0 协议
该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

{{{path> 收藏已收藏 {{ postmeta.bookmark }} {{{path> 点赞已赞 {{ postmeta.postlike }}
实战案例解析！如何用4个步骤引导用户操作提高转化率？

UI交互 2023-04-14

前段时间负责一个运营活动的改版工作，该活动的设定是通过设置目标奖励，提升用户的购买力。但是通过该模块的数据反馈发现，活动的用户参与度与购买转化率都不是很理想。结合数据与相关的用户调研发现，导致这个结果的原因主要概括为两点：活动曝光弱，用户不清楚活动内容，很少主动点击大部分用户购买力远远低于设置的目标，导致“心有余...

前段时间负责一个运营活动的改版工作，该活动的设定是通过设置目标奖励，提升用户的购买力。但是通过该模块的数据反馈发现，活动的用户参与度与购买转化率都不是很理想。结合数据与相关的用户调研发现，导致这个结果的原因主要概括为两点：
活动曝光弱，用户不清楚活动内容，很少主动点击大部分用户购买力远远低于设置的目标，导致“心有余而力不足” 更多引导设计干货：

新用户引导流程设计，需要做好这12个细节！编者按：这篇文章出自资深 B 端 UI/UX 设计师 Taras Bakusevych ，他对于产品、视觉、体验设计上，都有深入的钻研，而这些钻研是实实在在的项目喂出来的实战经验。
阅读文章 >

以下是当前活动示意：

针对当前定位的问题，我们制定了本次活动改版的方向与目的，即
增加用户对活动的感知，引导用户参与活动调整运营策略，促进用户完成阶段目标，提升购买力对于第一点，我们比较容易解决，但是第二点中，如何调整当前的运营策略，我们跟运营人员进行了脑暴，最终基于成本与当前用户习惯为考量，我们制定的新的策略是“在第一个阶段目标之前，新增几个小目标，通过拆解目标的形式，提升用户对于阶段目标的完成度”，如图：

但是过多的阶段目标，容易让活动页面变得“枯燥”，为了提升用户在该页面的活跃度，我们需要将新增的“小目标”用其他交互形式承载，在经过了与业务部门的沟通脑暴后，最终我们选择了“抽奖”。
将“小目标”以任务的形式呈现，用户完成任务即获得抽奖机会。为了促进用户不断的完成任务，在设置抽奖规则的时候，我们做了一些设计。
第一，将抽奖概率设置成 100%，增加活动的吸引力；第二，设置阶梯抽奖，即用户完成的阶段越高，抽到的奖励就会越好，增加阶段的完成度。我们将这两点运用到了最终的抽奖页面中来。

确定了新的改版方向后，接下来就需要考虑用户在整个活动的操作路径了。理想情况下，我们希望用户的操作路径为：进入活动-购买商品-参与抽奖… 所以如何提高用户在理想的情况下进行交互，我们就需要对用户做一些操作上的引导，主要包括引导用户进入活动以及引导用户抽奖。如何引导？主要概括为四部分，即激励引导、场景引导、布局引导、操作引导。
接下来我们逐个进行拆解分析。
一、激励引导通过走查，发现当前的活动入口是放在了首页 banner 的位置，虽然该区域整体曝光度比较高，但还是存在一些问题，主要包括以下两点：
由于 banner 自动轮播，导致活动不易被发现，且 banner 内容参差不齐，用户对于活动的感知较差；目前活动入口仅仅展示活动标题，无法达到刺激用户点击的目的针对当前问题，确定了交互优化的策略，即提升活动的曝光以及增加用户点击的欲望。通过与业务沟通得知，该活动属于长期存在的，需要建立活动在用户中的心智，所以最终选择用一个固定入口来承载，根据当前的首页布局，最终选择了异形胶囊图，通过视觉手法，在首页突出整个活动入口，同时在标题上加上活动利益点，从而达到刺激用户点击进入活动的目的。

二、场景引导基于前面对于活动玩法的升级，我们加入了抽奖的玩法。除了用户主动进入活动页参与抽奖外，还需要考虑还有哪些场景可以引导用户进行抽奖？我们可以从抽奖的“源头”开始分析，用户获得抽奖机会的条件是完成一个阶段目标，而目标的设定是基于用户的“购买力”，对于电商产品而言，用户完成购买的节点在付款后的订单结果反馈。
所以基于这个场景来看，如果需要引导用户进行抽奖，我们可以在用户完成支付后进行。
当用户完成支付后，我们需要判断用户当前的累计购买金额是否达到抽奖节点，当满足条件时，我们就可以提示用户前去抽奖。这样做的好处在于，一方面我们可以提升用户对于活动的参与度，另一方面通过引导用户参与抽奖并获得奖励，激励用户向更高等级的奖励发起冲击，从而达到提升用户购买力的目的。

三、布局引导当前用户参与抽奖，仅仅是通过用户下单后，如果完成对应抽奖设定的额度时，引导用户前去抽奖，但是这也存在一些问题：
当用户进入活动页时，如何感知抽奖，如何唤起抽奖页？当弹窗引导用户抽奖时，如果用户关闭弹窗，用户如何再次前去抽奖？所以针对当前的问题，我们需要在活动页增加抽奖入口的露出，一方面引导用户进入抽奖页，通过奖品的“诱惑”让用户完成任务抽奖；另一方面当用户有抽奖机会时，可以通过该入口进入抽奖页。那该如何在当前页面进行活动入口的布局呢？
起初打算用“狗皮膏药”的形式，该方式的好处在于不随页面滑动而变化，且通过一些文案与微动效的设计，使该入口在页面变得格外的显眼，但是经过分析发现，这种形式还是存在了一些问题。

该方式仅仅是展示了抽奖的入口，但是却没有体现用户有没有抽奖机会，以及怎样才能获得抽奖机会。所以该活动入口的布局既要引导用户抽奖，又要体现当前用户是否可抽奖，所以我们进行了调整，如图：

调整后的抽奖入口放在了活动页上方，根据用户“从上而下”的视觉动线，我们希望用户先关注与抽奖相关的“小目标”，当用户完成相关小目标后，发现离最终阶段奖励已经接近，促使用户完成“临门一脚；同时在抽奖入口的内容设计上，我们不仅告知用户当前是否可抽奖，同时告知用户获得抽奖机会的进度，希望通过这种方式来传达抽奖的活动规则。
四、操作引导基于前面的分析，当前我们在活动页面增加了“抽奖”的入口与流程，但是不管是抽奖还是获得阶段奖励，用户都需要去提升购买额度，这也是该页面的主要操作，如何进一步的引导用户点击并转化，我们可以结合当前的奖励机制来分析。
当前我们将奖励拆解为两种，即抽奖奖励与阶段奖励。但是他们有一定的共性，即用户需要完成一定的下单量。如果把这个活动比作“马拉松”，那么各奖励的下单量就是沿途设定的距离路标。用户主要关注的是距离下一目标的路程，因为下一目标对于用户来说更好到达。所以基于此，我们可以在“操作按钮”上给与一定的操作引导，告知用户距离下次阶段奖励的“额度”，促使用户点击转化。

总结以上，就是笔者根据工作中案例，分享的一篇关于如何引导用户操作的文章，经验有限，欢迎大家批评指正与交流。
如何做好外卖平台的搜索功能？我总结了四大原则

UI交互 2023-04-14

前沿：当代年轻人的生活节奏越来越快，面对海量的美食资讯和推送，难免会不知所措，每到饭点都不知道吃什么。本文将深度剖析外卖平台的搜索功能，从中发现设计师为用户的吃饭选择困难症花费了多少心血，为广大设计师总结出极致的搜索体验的设计原则，进一步留住用户的心。更多搜索干货：从3个阶段，解析B端搜索功能设计引言搜索作为...

前沿：
当代年轻人的生活节奏越来越快，面对海量的美食资讯和推送，难免会不知所措，每到饭点都不知道吃什么。本文将深度剖析外卖平台的搜索功能，从中发现设计师为用户的吃饭选择困难症花费了多少心血，为广大设计师总结出极致的搜索体验的设计原则，进一步留住用户的心。
更多搜索干货：

从3个阶段，解析B端搜索功能设计引言搜索作为最常用的功能，在产品设计中使用率高、应用面广。
阅读文章 >

一、搜索的意义吃饭的时间是宝贵的，在有限的时间内快速找到自己的美食才能留住用户的心。虽然美食千千万万，但总有某一些特别想吃的。当用户有明确的搜索目标通过直接检索就可以找到自己想要的内容，所以一个好的搜索能减少用户大量时间，提升点餐效率。
面对没有目标的吃货，贴心的美食推荐能打开他们的新世界，利用好搜索功能的热词引导，不仅能满足消费需求，还能引导消费和创造消费。以标签形式展示外卖商家的权益信息会促进用户查看、下单，如此互惠互利的方式何乐而不为。

二、搜索的类型搜索的类型主要包括搜索的样式和搜索的形式。首先，常见的搜索样式有图标卡片、搜索框、隐藏触发三大类。其次，移动端的搜索形式可归纳为全量搜索和定向搜索两类别。全量搜索就是根据关键词进行模糊搜索，而定向搜索就是在限定范围内搜索内容。
本次分析对象主要是美团、饿了么和大众点评，从搜索类型剖析发现它们存在某些共性和差异。第一，他们都采用了搜索框而非图标卡片入口。由此可见，他们觉得搜索功能十分重要，应该给予更大的面积来增加曝光，吸引用户操作。第二，美团和饿了么都采用全量搜索，对关键词进行模糊搜索，而大众点评则采用定向搜索，在限定城市范围内搜索结果。第三，饿了么和大众点评提供「扫一扫」的功能，方便用户通过商品二维码和条形码快速找到自己的菜品。第四，美团和饿了么都采用大色块搜索按钮引导用户操作。除此以外，美团还采用标签刺激用户搜索，激起用户兴趣，引导用户下单消费。综上，美食平台的搜索功能入口可以采用搜索框，并结合需要加入「扫一扫」、「引导标签」和「大色块搜索按钮」。

三、极致搜索的设计原则一个体验良好的搜索功能需要考虑各种细节。从搜索前的引导、搜索中的文案输入、辅助搜索模块和搜索结果的分类等等。细细体验了三款产品的搜索流程并认真分析每个模块的特点，总结出以下 4 个设计原则。
1. 场景预热
在搜索前给用户提供人性化的推荐，帮助用户从毫无思绪的混沌中提供决策的方向。三大平台在用户引导都有自己的思考。首先，他们都充分利用搜索框进行热词引导，可以增加运营活动、商家权益和热门菜品的曝光，轮播闪烁来吸引用户的注意力。其次，饿了么还尝试利用人物 IP 进行对话交流，动态的对话信息比静态信息更能吸引用户，趣味性更强。

2. 贴心引导
我们身处信息时代，不怕获取不了信息，只怕需要花费大量时间在海量信息中寻找。因此，为提升搜索效率，三大平台都设置了多样的辅助搜索模块，如「历史搜索」、「搜索发现」、「搜索热榜」等。一方面，这能帮助用户通过关键词缩小搜索范围。另一方面，用户可以通过榜单来了解周边人的想法，还能意外获取到商家的消费权益。所以，关注细节的产品才能留住用户的心，细心的美食平台才能留住用户的胃。

3. 预期管理
为帮助用户提前获悉结果，避免无效搜索，三大平台都拥有「搜索联想」功能。首先，用户可以输入关键词就能获取商品、商家和推荐榜单等信息，能极大地减少不必要的操作和等待。其次，为刺激用户消费，还可以增加权益和优惠信息的曝光促进用户下单。此外，信息列表还进行了分类，能极大地缩小搜索范围，迫近用户预期。

4. 细致分类
平台会根据搜索关键词提供很多结果，为有效呈现多样结果，三大平台都进行了分类。这将助力用户更快确定要下单的商品。此外，用户还可以获取消费的榜单和笔记，这能帮助用户提前避雷。这么细腻的分类才能让用户吃得省心呀。

总结一款优质的产品需要不断地打磨，这好比一道美食需要多道制作工序。因此，要想拥有舒心的搜索体验就需要从交互细节着手，从其他优质的产品中学习并融入其中。以上都是本人的一些拙见，欢迎大家留言交流～
6000字干货！超全面的AI绘画基础知识扫盲

UI交互 2023-04-14

最近大火的 AI 绘画，并不是一个全新的事物，早在 2015 年就已经出现了基于 GAN (生成对抗网络) 生成图像的 AI 应用实例，但因为技术的不成熟，并没有得到广泛的推广。这两年因为显卡算力的增长和扩散模型的出现，AI 绘画迎来了一波热潮，大有要把设计师干失业的凶猛势头，无论是网上的社区还是微信社群，都弥漫...

最近大火的 AI 绘画，并不是一个全新的事物，早在 2015 年就已经出现了基于 GAN (生成对抗网络) 生成图像的 AI 应用实例，但因为技术的不成熟，并没有得到广泛的推广。
这两年因为显卡算力的增长和扩散模型的出现，AI 绘画迎来了一波热潮，大有要把设计师干失业的凶猛势头，无论是网上的社区还是微信社群，都弥漫着一股恐慌的气氛。
对于 UI 设计师来说，这种恐慌是无谓的、盲目的、幼稚的，但我光这么说是没用的，因为恐惧来源未知。就像之前一篇分享的评论中，很多夸大 AI 作用的设计师 “既不懂项目，也不懂 AI 是什么”……
所以，项目的分享前面已经做了很多，这篇分享主要用白话就和大家做一次基础的扫盲：
AI 绘画到底是什么目前有哪些 AI 绘画工具它们的生成方式和过程相关的限制和阻力可以应用的具体场景一、什么是AI绘画 AI 绘画是一种利用人工智能技术（其实就是机器学习算法）创作视觉作品的方法。
AI 绘画的应用，是部分科学家和工程师，先搭建了可以学习图像来自我完善和强化的技术，接着提供给它成百上千万的图像，让它通这些养分快速成长，理解不同的具体事物、光影、风格是什么。然后，当我们输入相关的文本信息指令时，它就会通过这些文本内容去匹配自己已经理解和记录的图形要素，并将它们绘制出来。
说是 AI，但它的本质依然是一种算法，一种对规律的记忆和复现，是一种数学化的总结和组合，并不是抽象的艺术思考和创作，距离多数人想象中真正的人工智能其实还差了很远。
目前市面上涌现出了一大批 AI 绘画工具，这里我介绍其中最有代表性的几个：Stable diffusion、Midjourney、Adobe Firefly。
1. Stable Diffusion
Stable Diffusion (简称 SD) 是一个可以本地部署的 AI 程序，因为其开源的属性，让大多数不想花钱且动手能力强的用户可以快速搭建并生成任意数量的结果。也能依据自己的需求和画风进行针对性的大模型训练，还可以扩展相关的插件和模型，包括对 VAE、Lora、Control net 等，包含了极多的设置选项和上限。

超详细！AI 绘画神器 Stable Diffusion 基础使用手册一、AI 绘画工具的选择与运用 1. 工作场景下 AI 绘画工具的选择目前文生图的主流 AI 绘画平台主要有三种：Midjourney、Stable Diffusion、DALL·E。
阅读文章 >

2. Midjourney
Midjourney (简称 MJ) 是市面上商业化最成功的在线 AI 绘画服务商，是一款运行在 Discord 上的程序（类似小程序），只需要进行几步简单的注册和操作就能登录使用。是目前影响力最大，使用人数最多的 AI 绘画工具。

超详细！AI 绘画神器 Midjourney 基础使用手册一、前提条件需要魔法：新用户可免费创作 25 张图片，超过需要办会员版权问题：会员生成的图片版权归创作者所有 Midjourney相关资讯：二、注册/链接服务器温馨提示：下方多图预警 1. 注册、创建服务器 ① 打开Midjourney官网，右下角选择"J
阅读文章 >

2022 年有人拿着 MJ 生成的画参加科罗拉多州立博物馆举办的「Fine Art Exhibition」美术展，并获得了一等奖，就是下面这张：

虽然不知道这个奖项有多大的炒作成份，但是实打实的让 MJ 迎来了热度的大爆发，用户量在一个月之间增长了 4 倍。也由此可见 MJ 在对艺术绘画风格的生成上有着不俗的能力。当然 MJ 也有偏向二次元的 Niji 模型偏向真实摄影的 testp、V5 模型。
3. Adobe Firefly
Adobe Firefly 是 Adobe 自己开发的 AI 工具，是这几个 AI 生成工具中最年轻的，前不久刚刚推出 beta 测试。作为一家以软件工具作为核心业务的企业，Firefly 自带很深的生产力属性，除了在生成过程中提供表单式的选项外，还支持对生成内容进行图层分层，并导入到自家软件。

AIGC新神器！Adobe Firefly内测版全方位评测（附内测申请流程）哈喽大家好，我是包大！
阅读文章 >

虽然 Firefly 目前才刚刚起步，但以 AI 绘画这种需要大量资源投喂的方向来说，Adobe 有得天独厚的优势，未来直接接入 PS、AI、AE 等工具是必然的，也是可以最贴合平面类设计工作的工具。
除了它们三个以外，还有别的很多绘图工具，不管是正在快速迭代的，还是开发中的，如 Dalle、NovelAI、NightCafe Creator、Tiamat、Imagen、Parti 等。

AI绘画哪家强？Midjourney、文心一格等 6 大工具出图效果大比拼大家好，这里是和你们一起探索 AI 绘画的花生~ 3 月份以来 AI 绘画领域又有了不小的变化，Midjourney 更新了 V5 版本、Stable Diffusion 推出了 Clipdrop Reimagine；微软 Bing 也推出了 Image Create （图像生成）功能
阅读文章 >

作为 AI 绘画的起步阶段，目前我们不能完全断言哪个工具最后会成为效果最好，最适合我们的。但可以肯定的是，整个行业都在快速成长，现状不能代表未来的格局。具体会发展到什么地步，就要拭目以待了。
二、AI绘画的基本逻辑就像把大象装进冰箱只需要三步，所有 AI 绘画基本上都分为这几个步骤：

1. 模型的预训练
步骤中这个潜在空间的映射过程，就是模型预训练的结果，也就是说你训练模型时是如何做文本到图片的对应的，那么生成时候就会大概率做同样的对应。
并且这种对应，是在模型训练完成就难以再修改的。因为模型训练的数据量和计算力需求极为庞大，所以除非大公司有庞大的资源进行模型训练，否则如果是使用现有的 AI 大模型，个人想要进行微调几乎是难以实现的。
举个例子来说，现有的 MJ 因为缺少字母数字字形的训练，所以生成的所有图形几乎都与具体的字形无关，哪怕你给它指定了图片中需要数字「0」，它也做不到，因为它脑瓜里没有这样的东西。
就像我让你画一个王鹫，你连这动物见都没见过，怎么可能画得出来。模型的作用就像你对世界的认识，没有输入和学习，就没有认识。

2. 图片生成器
市面上有好几个不同的方案来实现图片的最终生成，例如 MJ、Firefly 主要采用的 GAN（生成对抗网络），以及 SD 使用的扩散算法，还有 VAE (变分自动解码器)等等。
不过不管它们具体使用的方法是什么，其过程大致抽象如下：生成器首先生成一个低分辨率的图片，每一层神经网络会在此基础上添加不同层级的特征和细节，就好像 AI 慢慢地把一副模糊的，低细节的画，画得更清晰、细节更丰富。

在这个过程中，我们不能够进行人为干预，你想要更改其中的某些细节，就需要重新修改 Prompt (描述词)，让 AI 重新生成，并且还无法保证你的此次修改能否起效。因为我们无法理解 AI 是如何拆解你的 Prompt 并对应到图片上去的，对使用者来说，这就是一个「黑箱」。
3. 具体的图像生成
每个 AI 绘画工具都会有一个关键字输入框，通过对应语法输入相关的指令和描述，来生成图像。而每个工具对文本的理解和模型不同，即使用一样的描述生成的东西也不一样。根据前面预训练的说明，不同模型擅长的和画不了的东西也不一样。
所以，下面我们就用一组基本一样的关键词，在不同的工具中生成对应的结果：

这里要强调，想要获得越理想的结果，描述就要越准确，而且画面结果越复杂，需要描述的字数也就越多。需要氛围感越强，情绪的描写也就需要越生动。想象下那些描写生动的文学作品，能让我们脑子里有画面，语言的描述方式就越细致、越特别。
比如搭配 GPT-4 生成的 MJ 描述文本：

当 AI 帮助我们完成一幅画的时候，有很多元素它可以进行自定的补全，比如画个人，你可以不指定他有牙齿，但只要你打入 open smile 的话 AI 自然会根据正常情况去画出牙齿。
但我们进入到非常规的情况，比如 UI 设计，每一个 UI 界面都有它自己的独特性 —— 字段不同。也就是出现在这个画布中的所有内容信息不一致，这个是绝对不可能依托脑补实现的。
那么，即使有团队开发了非常强大的文生图 AI 绘图工具，也一样需要把画面中出现的字段全部输入一遍，即使再简单的字段，你也需要描述它在画面中出现的特征、权重、交互和属性。
你们可以想象下如果用文本方式去指定下面这些页面应该怎么完成：

三、AI绘画的局限性 AI 绘画再强大，能生成再多让你惊叹的画面，它也有自身的局限性。就像前面说的，它不是真正的 AI，仅仅只是 “一种对规律的记忆和复现，是一种数学化的总结和组合”。
1. 依赖模型
之前说过，AI 生成的图像是什么风格，极大程度依赖于它是如何接受训练的，市面上有很多专门针对特定风格的模型，都是这一特性之下出现的产物。

但这也并不能保证市面上有的模型就能百分之一百满足你的工作需要，有些工作方向符合条件的团队，可以自己训练模型，想要模型的效果好，就需要投入很多的人力去进行手工的筛选和打标，且最终的模型效果很难保证。
而 UI 这个领域目前没有这样模型，AI 也并没有建立对 UI 中不同元素的认识和理解，也就是让它生成 UI 界面是随机抄下这些元素进行组合来但根本不清楚自己在做什么。
2. 随机生成
生成器在生成低细节图片时，基本上就确定了构图，但这种确定是随机的确定，也就是说你通常很难指定图片中的某样东西，在图片中的哪个具体的位置。这种随机性会消耗设计师大量的精力来进行 rerolling，直到 AI 恰好随到了一个比较符合你预期的构图。
但这样一来，就太依赖 AI 的即兴发挥了，而在 UI 设计中，一个界面从上到下应该包含哪些模块，每个模块里包含哪些字段是指定的非常具体的，和它的随机性是完全背离的。

3. 指向性差
之前所举的 MJ 无法生成具体的数字/字母，就是一个指向性差的例子。
MJ 虽然非常擅长画人物，画山水，画建筑，但它非常不擅长画抽象的人造物。除了字形之外，它还不能在已有的 IP 形象基础上进行姿势、风格、3D 化变体；对图标、logo 的描绘也比较差 (几乎不可用)；对元素进行秩序排列也比较难做好。它太喜欢细节了，这些对人类来说更简单的东西反而画不明白。
尤其是在 UI 的领域中，我们往往对元素的制定有精确到像素的需要，已这种方式去要求 AI 显然是本末倒置的，只能增加更多的工作量。

4. 难以微调
AI 绘画的每一副图片都要重新生成一次，比如在 MJ 中，你随机无数次生成出接近自己想要的东西，但是要你要微调里面的内容时，却会发现做不到，每次调整就是生成一张新的图。
而在 SD 中，虽然可以使用图片局部编辑，但是那个编辑仅仅是根据周边环境对这个区域重新生成，能不能获得你要的结果还是得碰运气。这在 UI 界面输出的流程中是不可接受的，因为我们会在确定的设计稿中替换元素位置，或者用指定元素替代现有元素。
手动操作特别容易，但是 AI 的生成模式和我们日常的手动设计过程是完完全全不同的，所以它没办法支持，最后还是得靠我们自己去动手完成。

四、AI绘画的使用场景 AI 插画确实可以在一些设计的领域起到革命性的作用，但目前多数是加快这些工作的效率和质量，而不是直接替代，下面罗列一些具体的应用场景。
1. 插画
首先肯定是插画的领域，这个是目前 AI 做的最好也最成熟的方向。不管是游戏 CG 还是概念插画、运营插画，它都可以很好的完成。
当然，基于前面说到的那些缺点，商用环境下是不会直接使用生成的结果上线的，而是要在这个基础上使用 PS 进行修改，或直接以此作为灵感重绘。

所以，要求稍高的商业插画即使引入 AI 依旧需要专业的插画师来操作，只是对他们的要求多了一项使用 AI 的技能。而最底层的插画工人确实失业风险已经近在眼前。
2. 游戏 UI
游戏 UI 也是插画的一部分，只是绘制的范围更小。过去游戏 UI 绘制界面中的图标是非常痛苦吃力的，一个简单的宝箱可能就要画很多版本，绞尽脑汁。而 AI 绘画就可以快速生成大量的版本，这些图直接拿来修改或临摹一遍，大大缩短了出图时间。

这也是 AI 插画目前影响最大的地方，因为游戏项目组是非常严格控制成本的，而 AI 带来的效率提升，让个人生成力飞跃，那么自然不再需要那么多的游戏 UI。只要团队跑通对应的流程，就可以立马开始裁员，精简团队的名额，这在各个头部大厂已经实际发生了。
3. 平面包装
平面包装方向也是一个重点依赖抽象图形的领域，对精确度的要求并不高，所以往往有一个模糊的方向和概念，设计师是乐于接受随机生成结果和样式的。
根据目前的实际产出案例质量，包装设计除了外部轮廓，可以大量依赖 AI 来生成需要喷刷的视觉图案。但要记住图案仅仅是包装设计的一小部分，它的结果依旧需要专业的设计师来审视、筛选和修改（需要铺开和添加指定文字），所以会成为一个非常好的工具而不是直接取代包装设计师。

4. 服装设计/摄影
在服装领域，设计和摄影都不同程度受到 AI 影响。服装设计很多时候仰赖一些抽象的灵感和思路，而 AI 的随机性可以很好的提供给设计师灵感，但不管生成的图质量有多高，都需要专业的设计师根据成本、流行、材料、季节的关系对它进行调整，重新绘制和打版。

而在成衣环节，很多时候要拍摄模特图片是要花费很大成本和时间的，而将设计好的服装在模特身上“试穿”已经成为可以实现的功能。虽然目前还有很多缺陷，但可以遇见的是未来肯定会有专用的产品上线，对低端商拍和模特行业产生直接的影响。

5. 建筑/室内
还有就是因为 Controlnet 的应用，AI 插画可以生成更细腻、丰富的室内建筑、室内效果图了，往往产出的质量还不错，远超低端设计师的工作效果。

但是，光靠这种效果图能完成最终建筑或室内设计吗？想想也知道不可能，因为实际场景包含的各种限制、参数、需求是没办法有效反馈给 AI 让它解决的。所以这些效果图依旧只是飞机稿，为设计师提供灵感的工具。
但可以相见的是，如果 AI 生成效果图那么好，未来如果能结合 3D 模型（如 Sketchup）直接生成，而略过使用 3D 软件渲染的步骤，那么一方面出图的时间大大缩短，另一方面设计师和客户的沟通将变得无比高效。

之所以最后提那么多应用的场景，就是为了让大家明白一件事，AI 目前的能做的事情，仅仅是 —— 生成位图。
除了需求比较基础和低级的低端插画市场，商业项目直接使用 AI 生成结果上线，只会引发灾难性的后果。即使 Adobe 走的更快一点，提供了图层的区分，但也仅仅是不同层的位图而已，还是要设计师打开 PS/AI 做调整。
因为视觉图像仅仅是不同设计领域中的一个部分而已，是需要结合进工作流和考虑各种外部影响的，这些判断是需要专业设计师来完成的。
随着 AI 的发展，不同的设计领域都会引入 AI 绘图结合进设计流程，但说到底它只是一个工具，不可能包办整个项目都出发到落地的所有细节，因为这些关键的信息是在三次元中产生的，而项目又不是工业生产线，可以完全标准化运作。
搞清楚这些内容的想法，你就不会轻易被恐慌情绪牵着鼻子走，做一个无知且惶恐的局外人了。
结尾如果后面有时间，我们也会在这个基础上进一步更新成系列新的教学，指导大家如何安装和使用 SD、MJ、Firefly，并输出对应的内容。
想要看到这些的话，就记得多分享、点赞、留言～
我们下篇再贱…
欢迎关注作者的微信公众号：「超人的电话亭」
大模型的跃进众生相

设计动态 2023-04-14

01 王慧文创办的光年之外公司已经在搜狐大厦开张了。包括真格基金、顺为资本、王兴在内的投资方已经基本就位。根据王慧文本人的说法，甚至连下一轮2.3亿美元的融资都已经承诺了出资。互联网圈大佬级人物的全情投入，并且承诺“肉身不占股份”，还要把高达75%的股份预留给
最近一段时间，在互联网科技圈，掀起了一阵大模型发布潮，许多大企业加码其中，甚至不少互联网大佬级人物也在其中全情投入，开启了人工智能创业浪潮。那么在这阵阵浪潮中，我们可以观察到什么样的“众生相”？

01 王慧文创办的光年之外公司已经在搜狐大厦开张了。包括真格基金、顺为资本、王兴在内的投资方已经基本就位。根据王慧文本人的说法，甚至连下一轮2.3亿美元的融资都已经承诺了出资。互联网圈大佬级人物的全情投入，并且承诺“肉身不占股份”，还要把高达75%的股份预留给技术人才，都让这次人工智能创业备受瞩目。
02 王小川则是人工智能创业领域另一个重要人物。根据此前36氪的消息，其承认自己在快速筹备创业做AI大模型，《量子位》则进一步获悉王小川已经召集了一批搜狗旧部。较新的消息是王小川的五季智能公司已经成立，老同事茹立云参加占股20%，并且 “水下估值已经逼近独角兽水平。”
除了王小川，包括李开复、阿里VP贾扬清、亚马逊首席科学家李沐、前京东AI负责人周伯文等人都已经宣布将在AI领域开展创业。
03 在中国互联网科技圈，此前很久都已经没有类似的创业团队成立的盛况。其中原因并不难以理解，过去较长一段时间里，能做的、新的业务机会不多，并且大厂们大量把持用户和行业资源，创新创业成功率极低。其实包括本次大模型发布潮，百度、阿里、腾讯、三六零甚至是科大讯飞、商汤、创维等企业，也都在削尖了脑袋往里钻。大企业急于利用自身优势抓住新的机会，与创业企业形成了直接的竞争关系。
04 反而是更加深入思考的学术领域的专家们，对本轮人工智能创业的浪潮保持了相当的警惕。计算机科学家、自然语言模型专家吴军直言，“ChatGPT从历史上看其实不算是一次技术革命，它影响到的都是那个比较懒的人”，并且如果要问这里面有什么机会的话，“坦率来讲，你没机会，因为太耗资源了，你耗不起。” 这可能是中文互联网里对于ChatGPT最低的评价了，而且这个评价是来自于对自然语言模型最熟悉和了解的华人之一。
与吴军观点类似的还有Meta首席人工智能科学家杨立昆，他认为就底层技术而言，ChatGPT不是特别创新，“它没有任何革新的内容，但公众却认为这是一款革新的产品。”
05 另外，首位菲尔兹奖华人得主丘成桐在上周公开表示，“至少未来十年我看不到人工智能对人类社会产生的实质性的改变，也就是改变整个社会的结构。”这和如今舆论场上盛行的、各种ChatGPT将改变人类社会、淘汰大量工种和工作岗位的讨论，形成了鲜明的对比。
06 商人与学者之间对于“大模型”的态度形成了鲜明的对比。除了ChatGPT和Midjourney们所表现出来的在智能化方面的突破，以及产生营收的能力之外，美国业界大咖的热情看好，也是中国互联网科技圈兴奋的很重要的原因。
其中最热情的当属比尔·盖茨，他的很多话都给人工智能行情的火热有巨大的推动作用：“ChatGPT是其一生中见到的两项最具革命性的技术之一”，“创新是人类最大的希望”，“ChatGPT将改变世界，我们将不得不减少工作”，“ChatGPT像互联网发明一样重要，将会改变世界”，并且面对马斯克等人要求OpenAI暂缓进一步的研发时强调，“我不认为要求一个特定的群体暂停 AI可以解决挑战”。
07 另外，另一位科技大佬、NVIDIA创始人黄仁勋也是ChatGPT最坚定的支持者。他认为“ChatGPT仅是起点，我们正处于AI的 I phone时刻”，“这就是奇迹”，“是运算产业有史以来最伟大的事情之一，所以我对此感到非常兴奋”，另外，他还积极投入，与OpenAI联合创始人Ilya Sutskever进行深度对话，强调“看似理所当然的创新背后有许多‘激动人心的时刻’”，“AI像人脑一样不断生长”。
08 两位大佬的言论在中国互联网和科技圈广为流传，也促使很多人投身到这个领域的创业之中。大佬过往的成功和敏锐的商业嗅觉自不必说，但值得注意的是，盖茨和黄仁勋都是ChatGPT和人工智能产业发展过程中的核心受益者。
其中微软是OpenAI的最大股东之一，为其投入了大量的真金白银，并且早在2019年两方就已经建立了战略合作伙伴的关系。例如，微软投资OpenAI之后很快就取代了亚马逊成为其独家云计算供应商，并且在Bing搜索引擎、Office软件上都探索了人工智能功能的植入。
比尔·盖茨虽然在微软的持股已经不多，但为其一手创办的公司站台的意味仍然非常明显。而黄仁勋则有更加充分的理由为人工智能产业的发展摇旗呐喊、推波助澜，因为几乎所有的人工智能企业，不论是OpenAI还是光年之外们，都需要大量采购GPU。而众所周知英伟达是这个市场上说一不二的核心供应商。2022年底以来，英伟达的股价已经翻倍反弹。
09 现阶段的“大模型跃进”，有非常清晰的资本躁动的迹象，以王慧文、李开复、顺为资本、真格基金为代表的资本方们，正积极投身AI，而他们的热情也进而带动了一批技术专家参与创业。
整体上看仍是兵马未动粮草先行的意味。人工智能的光明前景毋庸置疑，新的产业发展也是政府、产业、投资人、企业各方都急需的宝贵空间。但与此同时，我们也应该在比尔·盖茨、黄仁勋和吴军、杨立昆、丘成桐们明显对比的表态中感受到警惕的意味。更何况，以马斯克、贝佐斯、扎克伯格为代表的、和ChatGPT没有那么多直接关系的商人们对“大模型”所表现出来的冷淡态度，也是颇耐人寻味的。
作者：杨旭然
来源公众号：巨潮商业评论（ID：tide-biz），观点与事实同样重要。
本文由人人都是产品经理合作媒体 @巨潮WAVE 授权发布，未经许可，禁止转载。
题图来自 Unsplash，基于 CC0 协议
该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

{{{path> 收藏已收藏 {{ postmeta.bookmark }} {{{path> 点赞已赞 {{ postmeta.postlike }}
产品周报246期 | 抖音宣布与腾讯视频达成合作，科大讯飞将于5月6日发布“1+

设计动态 2023-04-14

早上好呀，又到周五了！来看看这周发生了什么吧~ 近日，腾讯视频与抖音宣布达成合作，双方将围绕长短视频联动推广、短视频二次创作等方面展开探索。这次合作被外界视为“世纪大和解”。 4 月 7 日下午，在人工智能大模型发展论坛上，科大讯飞副总裁、研究院执行院长刘聪表
早上好呀，又到周五了！来看看这周发生了什么吧~
近日，腾讯视频与抖音宣布达成合作，双方将围绕长短视频联动推广、短视频二次创作等方面展开探索。这次合作被外界视为“世纪大和解”。
4 月 7 日下午，在人工智能大模型发展论坛上，科大讯飞副总裁、研究院执行院长刘聪表示：科大讯飞「1+N 认知智能大模型」将于 5 月 6 日发布。

一、值得关注抖音宣布与腾讯视频达成合作，将围绕长短视频联动推广、短视频二次创作等方面展开探索
近日，腾讯视频与抖音宣布达成合作，双方将围绕长短视频联动推广、短视频二次创作等方面展开探索。这次合作被外界视为“世纪大和解”。值得关注的是，这又是一次长短视频的合作。在过去一年里，快手与乐视、抖音与搜狐视频等相继实现合作。
腾讯定性此前微信QQ故障为一级事故，总办成员遭处罚
3月29日凌晨，腾讯旗下的微信和QQ等业务曾出现崩溃状况，包括微信语音对话、朋友圈、微信支付，以及QQ文件传输、QQ空间和QQ邮箱在内的多个功能无法使用。虽然该故障在当天稍晚时候就被修复，且微信此前也出现过几次大小故障，但腾讯仍然对本次事故开出了堪称严厉的处罚单。据界面新闻了解，本次事故由广州电信机房冷却系统故障导致，腾讯将它定义为公司一级事故。腾讯管理层认为，这次事故暴露出容灾设计方案和应急预案不完善的隐患，有关业务部门的风险防范意识不到位，所以对大量相关领导做出了处罚。其中包含公司高级执行副总裁、TEG（技术工程事业群）总裁卢山（LS）和WXG（微信事业群）副总裁周颢（harveyzhou）在内的管理者承担领导责任，被予以通报批评。值得注意的是，卢山目前为腾讯总办（腾讯总经理办公室，为公司最高决策机构）成员。此外，TEG华南数据中心的两位总经理和总监被处以降级和免职处罚，WXG技术架构部的两位总监和组长当期绩效考核给予Underperform等评级（二星级别，最高为五星）。
搜狗创始人王小川入局大模型创业，已获5000万美元支持
搜狗创始人王小川正式宣布入局中国大模型创业，和前搜狗COO茹立云联合创立人工智能公司，旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。王小川在公开信中表示，新公司名为“百川智能”，目前已初步组建了50人的团队，获5000万美元启动资金，争取年内发布国内最好的大模型和颠覆性的产品。
字节跳动据称已成中国最赚钱互联网公司，首度超越腾讯、阿里
据两位获得公司报告的投资人透露，字节跳动的息、税、折旧、摊销前利润（EBITDA）在2022年达到近250亿美元，较前年的140亿美元暴增近八成。这也意味着字节跳动的这项财务数据在2022年已经超过老牌科技龙头腾讯和阿里。根据统计，这两家公司2022年的EBITDA分别为239亿美元和225亿美元。字节跳动营收也维持近30%的同比涨幅，达到850亿美元，展现出广告主们继续在短视频平台抖音、TikTok上加码投入。在利润节节攀升以及同行经历大幅调整的背景下，字节跳动的估值也已经压过阿里，但距离近半年股价翻了1倍的腾讯仍有距离。
OpenAI或将再次在意大利开放，但需满足意大利当局提出的要求
当地时间周三（4月12日），意大利数据保护局（Garante）提出了一系列聊天机器人ChatGPT在该国恢复使用的要求。在周三的声明中，Garante对OpenAI提出了一系列需要在本月底前满足的具体要求，并表示，在解决监管机构的担忧后，意大利当局将暂停对OpenAI处理该国用户数据的临时限制令，OpenAI也将再次在意大利开放。大约两周前，Garante以涉嫌违反数据收集规则为由，对ChatGPT的开放公司OpenAI展开调查，并宣布禁止使用ChatGPT，且暂时限制OpenAI处理意大利用户数据。
二、产品动态科大讯飞：将于5月6日发布“1+N认知智能大模型”及应用产品
4 月 7 日下午，在人工智能大模型发展论坛上，科大讯飞副总裁、研究院执行院长刘聪表示：科大讯飞「1+N 认知智能大模型」将于 5 月 6 日发布。据刘聪介绍，1+N 其中「1」是通用认知智能大模型算法研发，及高效训练底座平台。「N」则是应用于教育、医疗、人机交互、办公、翻译、汽车、工业等多个行业领域的专用大模型版本。同时也代表着「N」个场景的示范性应用产品。例如，通过学习海量医学教材、论文和病例，实现专业的医疗领域对话式 AI 系统，打造「每个医生的 AI 诊疗助理，每个人的 AI 健康助手」。
360 宣布: 基于 360GPT 大模型开发的人工智能产品矩阵“360 智脑”率先落地搜索场景，将面向企业用户开放内测
三六零宣布，基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景，将面向企业用户开放内测。据了解，企业用户在PC端360搜索首页申请并获得测试资格后，可通过企业安全云体验使用。未来，360智脑将与浏览器、数字助理、苏打办公、智能营销等场景应用深度结合，提升用户生产力和创造力。
昆仑万维宣布即将推出“天工”大模型，将于4月17日启动邀请测试
昆仑万维宣布，由昆仑万维和奇点智源合作自研的国产大语言模型——“天工”3.5即将发布，并于4月17日启动邀请测试。昆仑万维表示，“天工”大模型已经非常接近OpenAI ChatGPT的智能水平。未来，“天工”4和“天工”5也将陆续诞生。
蚂蚁保上线“省心配”智能配置工具
12日，互联网保险代理平台蚂蚁保发布了智能保险配置工具“省心配”。据介绍，它能根据用户的需求进行分析，通过智能模型为用户定制合适的保险配置方案，供用户参考决策。这是行业里首个AI保险规划师，用户可免费使用。
抖音将关闭医疗健康认证账号私信、粉丝群互动功能
4月12日，抖音安全中心发布公告称，2023年4月30日前，抖音平台将分批完成全部医疗健康类认证账号（含机构）私信与粉丝群互动功能的调整，包括但不限于关闭私信与粉丝群场景下的互发消息、视频通话、语音通话、创建新群等功能。
三、运营动态华为首届开源鸿蒙 OpenHarmony 开发者大会 2023 定档 4 月 19 日
据 OpenAtom OpenHarmony 官方宣布， OpenHarmony 开发者大会 2023 将于 4 月19 日在北京召开 … 本次大会将有行业咖分享操作系统和开源的最新前沿研究成果，开发者可结识同行了解最佳实践，与社区技术专家互动交流，抢先获得开源鸿蒙OpenHarmony 系统、技术和工具的最新动态
商汤回应自研大模型图片生成质疑：秒画SenseMirage包含自研AIGC大模型
在商汤技术交流日上，商汤所演示的精选模型中出现AI模型站civitai的图片，引发了网络质疑。对此，商汤方面表示：“秒画SenseMirage包含商汤自研AIGC大模型，也提供第三方社区开源模型，支持导入多个平台的开源模型或上传用户本地模型。用户可免除本地化部署流程，并基于开源模型自训练模型，高效地生成更多样的内容。”在现场演示中，该模型底部有显示civitai的文字注释。
蓝色光标回应AI取代文案外包：属实
昨日，有截图显示知名广告及公关服务商蓝色光标华东区总部运营采购部下发邮件，称将无限期停止文案相关外包支出。有蓝色光标证券部工作人员表示，该邮件的内容属实，但对于AIGC（生成式AI技术）工具的应用细节无法立即回应。据悉，在邮件中，蓝色光标方面称，为了遏制核心能力空心化的势头，也为了给全面拥抱AIGC打下基础，管理层决定无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包支出。
孩子王：公司将与百度文心一言内测相关产品
孩子王在互动平台表示，公司将与百度文心一言内测相关产品，具体接入时间尚未确定。根据此前官宣文件，公司已成为百度“文心一言”首批生态合作伙伴，未来双方将联合打造科技化育儿的人工智能解决方案及服务，全面提升育儿领域的智能化产品与服务体验，打造智能化服务体系。
马斯克：推特正启动创作者订阅
推特CEO马斯克周四发推称，该平台正在启动创作者订阅。他写道：“我们正在掀起创作者订阅大潮！适用于长篇文本，图片或视频。”当被问及该平台是否也在为创作者分享广告收入时，马斯克官回答说：“我们正在努力。Twitter拥有令人惊讶的复杂代码库，所以进展比我们希望的要慢。”
四、好文推荐《别不信，看了三遍“咩咩肚爱佛油 ” ，我也停不下来了》作者@运营派
编辑推荐：前段时间，“咩咩肚爱佛油”一系列二创动画在抖音爆红，吸引了众广大网友关注。本文客观剖析了这类meme动画和视频的具体内容与走红原因，总结了短视频内容创作的一些细节，希望对你有所帮助。
>>>点击此处立即跳转阅读
《长短视频“握手言和”背后，拐点已至？》作者@虎嗅
编辑推荐：这几年有关长短视频之争的讨论一直没有停过，而近日，长、短视频似乎又有“握手言和”的打算了，抖音与腾讯视频正式官宣合作，表示双方将围绕长、短视频联动推广及短视频二次创作等方面展开探索。那么此次长短视频选择“牵手”背后，体现了怎样的发展趋势？
>>>点击此处立即跳转阅读
《为什么你的App下载量不够？原因竟出在这些细节上！》作者@收手的阿祖
编辑推荐：下载应用程序的时候需要考虑很多因素，即使有价值的产品也可能因为APP的设计而淹没在应用市场中。本文从为什么你的App下载量不够出发，总结了一些APP设计中的一些细节，希望对你有所帮助。
>>>点击此处立即跳转阅读
五、精彩问答 Q：饭搭子、摸鱼搭子，你怎么理解这种工作中的“XX搭子”？
现在有个新兴的名词叫搭子文化，说的是打工人需要“搭子”这种新型社交，比如口味差不多的饭搭子、热衷于钻空摸鱼的摸鱼搭子，还有抽烟搭子、旅游搭子。我的感知是比同事更亲密，比朋友更易抽离。你如何理解这种搭子社交？在你眼里，它的含义是什么？
欢迎来围观：点击此处，前往回答

本文值得关注、产品动态、运营动态内容，综合选取自泡面小镇微信公众号、腾讯网、新浪财经
问题来自人人都是产品经理旗下问答平台 —— 天天问，欢迎各位小伙伴前往交流、切磋~
{{{path> 收藏已收藏 {{ postmeta.bookmark }} {{{path> 点赞已赞 {{ postmeta.postlike }}
为什么全人类都呼吁把通用人工智能“管起来”？

设计动态 2023-04-13

3月底，马斯克在内的许多社会名流共同签署了一份公开信，希望包括OpenAI在内的机构至少把更高能力的AGI研发暂停6个月，从而让人类社会达成某种基于AGI（通用人工智能）威胁的协议。这封信虽然文本不长，但是涵盖了非常广泛的内容，内含的问题很丰富。比如，人类
随着AI模型的不断发展，大家开始担忧AI安全问题。本文通过提出为什么要管人工智能这一问题，思考和讨论关于管什么，为什么管，怎么管等话题，一起来看看吧。

3月底，马斯克在内的许多社会名流共同签署了一份公开信，希望包括OpenAI在内的机构至少把更高能力的AGI研发暂停6个月，从而让人类社会达成某种基于AGI（通用人工智能）威胁的协议。
这封信虽然文本不长，但是涵盖了非常广泛的内容，内含的问题很丰富。
比如，人类该如何算这笔账——AGI让信息渠道充斥宣传甚至谎言；如果是人类本来就喜欢和满意的工作，是否应该被AI取代？而这些效率提升，是否值得我们冒着“失去对文明控制”的风险？而人类针对AGI的监管体系又应该如何搭设？
这封信最终的结果是引发了硅谷规模空前的观点撕裂的大讨论。毕竟如果以GPT3.5进入人类社会视野为起点，对于AGI的发展，人类还有太多的盲点没有解决、有太多争议没有达成共识。但当人类还在争吵时，AGI已经开始在全球各地制造麻烦了，虚假信息和信息泄露都像是一个让人不安的庞大黑箱。
因此，最近一段时间以来，包括欧美日韩在内的各个信息发达国家都开始了对大模型监管的讨论。而在4月11日，国家互联网信息办公室也发布了《生成式人工智能服务管理办法（征求意见稿）》（以下简称《办法》）。这份《办法》的重要意义在于，它可以算是人类社会面对AGI监管中最早的官方文件之一。
而监管视角往往是人们理解AGI中很独特的一个角度：不同于科学家视角有很多参数上的复杂解释体系、有诸多复杂的模型框架流派。监管者是社会利益的代言人，也往往是站在社会整体的角度去思考。因此监管者的思路也往往更接近大部分人朴素的直觉。但它同时又代表了核心专家群体的思考，所以它也能部分回应新事物的很多讨论。
所以这份《办法》其实可以成为很多人普通人去理解AGI的一个窗口，他可以帮助我们更好地理解和参与AGI讨论。因为AGI既不是天使，也不是魔鬼。而祛魅后的AGI也将成为我们公共生活中的重要部分。
一、“我是谁”：生成式人工智能如果站在硅谷的角度，AGI约等于大模型。它是通过优化的模型、结构语料库和庞大的算力组合而成，带有一点智慧体思想特征的计算机程序。《文件》对这个“新物种”的划入到了“生成式人工智能”行业，即“基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。”显然这是从AI与社会关系的角度出发。
毕竟AGI未来的技术特征会改变，模型大小会浮动，但它最终要追求与社会之间互动的内核不会变。而无论一个模型封闭开发多久，其最终目的都是要面向社会做内容输出。这其实是过去辅助决策、检索、安全、支付等垂直AI与AGI很核心的不同。
而从技术远景来看，任何有广泛用户基础的“生成式AI”，其大概率都会是有AGI底层能力的产品。而对于普通人来说，AGI（通用人工智能）这个名词确实也有点太“魅惑”。许多人将AGI与人类智慧相类比，仿佛让人看到了一张“赛博灵魂”，全然忘了AGI只是有一点智慧的苗头，未来的发展其实还有巨大的不确定性。
所以与其说我们未来是《西部世界》似的“AGI社会”，不如说我们将迎来一个“生成式人工智能”的世界，这可能更贴近我们这一代人的技术现实。
二、“我属于谁”：服务提供者在AGI伦理讨论中存在一个经典问题：大模型生成的内容，版权到底是属于大模型公司、还是属于辛苦写prompt（提示词）的用户？
《办法》虽然没有明确规定版权的归属，但在监管上划出了责任义务，可以供更多人参考。根据《办法》：“利用生成式人工智能产品提供聊天和文本、图像、声音生成等服务的组织和个人（以下称‘提供者’），包括通过提供可编程接口等方式支持他人自行生成文本、图像、声音等，承担该产品生成内容生产者的责任”。
如果沿用这个思路，负责人其实既不属于大模型的研发人员、也不属于用户，而是属于连接大模型与用户之间的服务提供者。当然，在大部分情况下AGI的开发者和API提供者应该是同一个主体。但随着技术生态的演进，不同层次的主体可能会变得多元化。
明确中间的服务提供者承担责任，其实也符合“生成式人工智能”的官方定义。同时，这样的权责划分其实也倒逼未来上游产业链必须达成足够好的内容互信。
三、AGI的“内容权”：需要标识与版权问题类似的争论是：AGI内容是否可以与人类享受的内容“同权”？
《办法》明确对AGI内容做出了限制，出现在了两个地方：·“按照《互联网信息服务深度合成管理规定》对生成的图片、视频等内容进行标识”。“提供者应当根据国家网信部门和有关主管部门的要求，提供可以影响用户信任、选择的必要信息，包括预训练和优化训练数据的来源、规模、类型、质量等描述，人工标注规则，人工标注数据的规模和类型，基础算法和技术体系等”。
关于AGI内容一直存在争议。尤其在GPT内测的时候，系统有时候表现得像是一个村口玩手机的大爷。它有时会直接给用户一些包含价值判断的观点，却没有足够说服力的信息佐证。如果《办法》落地，AGI就会彻底告别“口说无凭”的跑火车式的内容输出，转而衍生出一些搜索似的工具属性。而像过去拿着AI合成作品去美术比赛拿奖的事情，也将彻底变成一段“黑历史”。
这其实与法律的精神相匹配，AI在内容生成上是绝对的强者，他自然也需要承担更多的举证义务。而多模态的内容形态可能存在巨大的内容风险，自然也需要相应的制约机制。相反，如果让AGI内容与人类内容完全同权，可能会对人类自己的内容生态产生难以评估的影响。
四、“监管生态”：阿西罗马原则在开头针对OpenAI的公开信里有一个小细节，它提出应该有一个审计的生态（ecosystem），而非体系（system）。而公开信也提到了阿西罗马AI原则（Asilomar AI Principles），即先进AI对人类的影响会是一个文明级的，因此对它的规划和管理所需要耗费的资源，应该是与其本身耗费的资源相匹配的。
换言之，如果生成式AI会是一个庞大的体系，那么就不能仅仅靠某个环节、某个主体完全实现监管。除了继续强调既有法律的监管地位外，《办法》中也强调了对生成式AI的全流程监管。
比如语料库（“预训练数据”）必须合法合规、数据标记必须培训“清晰、具体、可操作的标注规则”、使用场景必须符合规范并承担相应责任、内容本身需要被标注、用户使用过程中要有明确的举报反馈通道等等。
既然AGI会成为庞大的生态底座，那么监管者其实也需要用更多元化的方式去执行监管任务。因此尽管大模型有一定的黑箱属性，但通过一整套组合拳，也足以倒推技术黑箱后的合规能力，从而达到“开箱”的目的。
而为了进一步明确开发者责任，《办法》中还加入了这么一条：“对于运行中发现、用户举报的不符合本办法要求的生成内容，除采取内容过滤等措施外，应在3个月内通过模型优化训练等方式防止再次生成。”换言之，如果监管方只是想用“内容过滤”的手段逃避进一步的模型优化责任，在《办法》中是违规的——AGI需要一个合规的灵魂而不只是合规的API。
五、“驯火” 有很多人将AGI的发明比作“火”，人类学会了生火、享受火的文明成果，但同时也要花更漫长的时间去“驯火”。
在前面提到的公开信里，提出一个好的AGI应该满足至少几个标准，准确、安全、可解释、透明、鲁棒、对齐一致、值得信赖和忠诚的（accurate, safe, interpretable, transparent, robust, aligned, trustworthy, and loyal）。
换言之，AGI绝不能像现在这样，成为一个玄学般炼丹炉式的黑箱。它应该对人类有更高确定性的利好。所以公开信提出了更多远景的技术监管设想，比如建立一个庞大算力规模的、专业垂直的监管体系，达成某种底层的代码公约等等。这些提议是否值得落地，还需要更多的行业讨论。
但一个相对具有确定性的事情是：就像人类在“驯火”的过程中才更加了解“火”一样，人类社会只有不断与AGI互动、博弈的过程中，或许才可以更加了解AGI。
作者：郭海惟
来源公众号：硅星人（ID：guixingren123），从科技到文化，从深度到段子，硅星人为你讲述关于硅谷的一切。
本文由人人都是产品经理合作媒体 @品玩授权发布于人人都是产品经理，未经许可，禁止转载。
题图来自 Unsplash，基于 CC0 协议。
该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。

{{{path> 收藏已收藏 {{ postmeta.bookmark }} {{{path> 点赞已赞 {{ postmeta.postlike }}