• 如何组织一场线上敏捷共创工作坊?来看大厂的总结(筹备篇)

    UI交互 2023-03-29
    线上敏捷共创类似于戏剧影视化的创新,即实现了观看戏剧从线下剧场到线上屏幕的创新,看似是共创载体/场域的改变,但其转变背后所需的筹划组织和注意事项是非常复杂的,否则可能会导致线上敏捷共创只是“走形式”。具体来说,线上敏捷共创有筹备/执行/离场三个阶段。筹备阶段,组织者作为编剧,构思包含主题/人物/背景的故事概要,主...

    线上敏捷共创类似于戏剧影视化的创新,即实现了观看戏剧从线下剧场到线上屏幕的创新,看似是共创载体/场域的改变,但其转变背后所需的筹划组织和注意事项是非常复杂的,否则可能会导致线上敏捷共创只是“走形式”。具体来说,线上敏捷共创有筹备/执行/离场三个阶段。

    筹备阶段,组织者作为编剧,构思包含主题/人物/背景的故事概要,主要任务是线上敏捷共创的前期准备与组织; 执行阶段,组织者作为导演,在舞台上交代戏剧情节,主要任务是线上敏捷共创流程的设置与执行,产出共创成果; 离场阶段,组织者作为后期,剪辑与上映戏剧,主要任务是作为协同者/赋能者通力合作,推进已经达成共识的共创成果。

    相比于线下,线上敏捷共创最需要调整和注意的是筹备阶段,尤其是线上场域的设置、成员构成与组织,因此本文将介绍如何进行线上敏捷共创的前期准备。

    更多 工作坊 教程:

    比设计冲刺还敏捷!如何高效组织一场共创工作坊 众所周知,设计冲刺(Design Sprint)是一项需要集合多角色、经历五天的共创工作坊,目的在于帮助产品团队快速了解用户痛点需求,快速找到切入点及相应产品方案。

    阅读文章 >

    一、目标共识,确定主题:上下同欲者胜,同舟共济者赢 线上敏捷共创工作坊通常由需求方找用研解决问题开始,敏捷共创只是用研帮助业务解决问题的一种手段,只有在同时满足下列情况下用研组织的敏捷共创工作坊才能尽其所长。

    用研组织线上敏捷共创的适用场景

    任务是备受关注的,敏捷共创投入的时间和人员成本高,对需求方很有意义才值得发起; 答案是悬而未决的,解决办法是未知的,需要集思广益/共同创造,如创新的方案; 挑战是力所不及的,面临的困难多,需要群策群力,甚至需要多个角色/部门联动解决; 共识是必不可少的,需要对解决方案达成高品质的共识与承诺,后续才能真正的落实; 用研能有所输入的,进行过用户调研,有能在共创现场启发参与者共创的报告/调研发现。 线上敏捷共创目标的制定与共识

    作为共创组织者不能臆想或揣测发起人目标,敏捷共创目标只有能够反应团队的原则和愿望,才能灯塔一样指引所有人朝着同一方向,因此在开始设计流程之前要充分把脉发起人的需求,让投入的时间为我们的团队和用户带来价值。将业务所需解决的问题转换成共创的主题,达成敏捷共创工作坊目标需要注意:

    收集共创需求时多方沟通,同业务/产品/设计等相关角色进行沟通,全面了解当下业务所面临的困惑与期望,特别需要注意的是要向上沟通,才能让共创更好的服务与应用于业务战略方向和战略规化。 提炼出明确的共创主题,提炼出的主题越明确、越具体、越单一越好,另外,由于线上参与者注意力更难专注,在数量上 1-2 个主题为宜,尽量将时间控制在 2-3 小时左右,集中精力解决最重要的问题。 正式确认与共识共创主题,用研将提炼的共创主题和方案,进一步同需求方进行沟通,以确保能够解决相应的业务问题。 二、参与者:人物是故事情节的核心,让对的人来到“共创现场” 在确定线上敏捷共创目标后,用研和需求方共同确定能为共创主题贡献智慧的团队和成员,进入“共创现场”的参与者对工作坊成功与否起着至关重要的作用。相比于线下,线上敏捷共创是参与者在屏幕上互动交流,参与度和专注度更难保障,更需要慎重选择让对的人进入“共创现场”。从参与者意愿和相关性(目标达成与自己的利益越紧密相关性越高)两个角度挑选,将相关成员划分为参与者和旁听嘉宾两类,如图所示。

    参与者的选择

    高意愿高相关:有意愿参与目标的达成,而且目标达成与自己的利益是紧密相关的成员优先入选; 覆盖多元角色:共创不仅意味多元的视角,也要考虑共创落实的可能性及所需资源,因此参与者需要覆盖各相关职能和角色; 乐于分享想法:优先选择比较活跃的/有想法/愿意表达的成员,如果用研不确定/不熟悉可以由相应团队推荐与建议。 参与者的分组

    控制在 4 组及以下,组数越多共创需要投入的时间/人力也越多 每组 5-6 人,如果每组人数过多,易出现责任分散,导致部分成员不参与讨论 每组包括不同岗位职能(产品/设计/业务)的角色,以保证每组角色的多元化 为了营造更“平等”的共创氛围,避免“一言堂”,如有“高位”人员参与可单独分组 对具有参与意愿低/相关性较低/无法全程参与/高职级老板等特征的相关成员,将其划分进旁听嘉宾组,并建立独立的线上会议,具体原因及操作方法详见本文“线上场域”部分。

    三、组织者:各司其职,解锁“场务小助手”新角色 线上敏捷共创工作坊的组织者通常由用研团队的小伙伴分工与配合,一方面是能更好的从用户视角向参与者输入相关信息,另一方面,用研小伙伴经过培训与实践对共创工具和流程比较熟悉,彼此之间的配合也更加默契和顺畅。

    相比于线下,线上敏捷共创组织者之间通过线上语音交流与协作,不如线下共创现场顺畅、便利,组织者不仅要负责各自任务,同时还要操作线上共创的工具,面临的任务多且难度大,如果分工不清可能会导致某个环节没人负责或者同时开麦等导致现场混乱的情况。基于过往的经历发现,在组织线上敏捷共创工作坊时,每个组织者在一场共创工作坊中尽量仅承担一个角色,职责分工要非常清晰,做到各司其职。

    相比于线下,线上敏捷共创的组织者角色,不仅是各个角色的核心任务发生了变化,还解锁了新的组织者角色“场务小助手”。

    串场主持人:主持线上共创的全流程,面向所有的参与者,负责共创目标的达成、现场秩序进程、现场的氛围。 小组引导员:共创通常分组讨论,每组需要 1 名小组引导员,负责小组内共创目标的达成、时间把控、维持现场执行和氛围等 调研输入者:线上敏捷共创时长较短,需要高效输入用户调研的核心发现,而非详实的用户故事,如果参与者听过相关的用研报告甚至可以省略该部分。 场务小助手:线上敏捷共创新增的、重要的组织者角色,线上共创通过操作电脑和软件来完成的,特别需要一名对工具熟练的场务小助手“幕后操作”和“现场答疑”,以配合主持人节奏,解答参与者遇到的操作问题。 四、线上场域:线上敏捷共创的关键道具 线上敏捷共创场域是整个团队创造的空间,所需物料和布置本质上同线下工作坊一样,即打造每个成员都可以进行“听说写看”的共享空间。

    1. 线上会议

    由于线上敏捷共创在不同环节需要分组讨论,因此在选择线上会议时,尤其要关注是否具有分组功能。另外需要考虑录制功能,避免作为后续分析与学习的材料;屏幕共享功能,分享用户调研时能呈现给参与者;权限设置功能,如串场主持人/场务小助手要有对成员分组的权限。能够同时满足以上功能的线上会议通常需要付费,如瞩目/腾讯会议/飞书等。

    由于旁听嘉宾存在不愿意参与讨论/需要中途离场等情况,为了避免共创氛围被破坏,建议单独建立线上会议,如使用内部工具 Joymeeting 会议。由场务小助手通过两台电脑设备同时进入线上共创会议(瞩目/腾讯会议室)和 Joymeeting 会议室,结合桌面共享给旁听嘉宾进行实时直播,在共创过程中鼓励旁听嘉宾发言或者文字,但需提醒他们要根据主持人的指示。

    2. 线上画布

    目前线上画布/白板基本都能满足线上敏捷共创的条件,选择时要考虑到学习成本/功能完整性/互动性三个方面,可选择 boardmix/teamind 等免费线上画布。

    认证/操作成本低:由于所有参与者和组织者都要认证/操作,尽量选择容易操作学习成本低的线上画布。 功能完整性:能满足同时使用的人数,确保所有成员能同时进行线上协作与创作;能够导入材料(如 PPT/图片等物料)和导出成果等;能适配不同系统,如 win/Mac 等。 有互动的素材:具有表情/贴纸/闹钟等小工具,可以帮助营造线上敏捷共创的氛围 以上是对线上敏捷共创工作坊前期筹备的简要梳理,如有疑问可在下方留言交流。后续将结合具体案例分享线上敏捷共创的流程设计与实施,欢迎持续关注。

    欢迎关注「京东设计中心JDC」的微信公众号:

  • 用超多清晰图例,帮你掌握12条UI/UX设计准则

    UI交互 2023-03-29
    Halo,这里是设计夹,今天为大家分享的是「设计准则」。感知力是大脑将不同的信息连接和组织成一个连贯整体的机制。例如我们将相似的对象分组并连接起来,能够轻松地区分出不属于该组的对象。

    Halo,这里是设计夹,今天为大家分享的是「设计准则」。

    感知力是大脑将不同的信息连接和组织成一个连贯整体的机制。例如我们将相似的对象分组并连接起来,能够轻松地区分出不属于该组的对象。

    大脑在处理和组织看到的信息时会使用一套快捷方法,了解这些方法是设计成功的关键要素。

    在 UI 设计时,我们应该有意识地运用感知力,用足够的事实来验证设计,有依有据地解释为什么这个图形元素要这样设计?背后的原因是什么?

    提升感知力有助于清晰地解释设计方案,避免常见的设计错误,引导我们将设计做得更好、更容易理解!

    更多 设计原则 :

    UI界面优化实例!16条设计黄金原则帮你学会改版 近段时间讲了不少 AI 方面的知识,不过我实际用 AI 绘画做 UI 时,目前还只能用来做参考,很多细节还是得手动调整。

    阅读文章 >

    一、邻近原则 彼此靠近的元素会被自动理解为一组。把它们的位置放得更远,会给人一种这些元素是完全独立的个体的印象。

    在 UI 设计中,可以利用邻近原则将相似的界面元素组合在一起,把控总体布局。

    邻近规则适用于主导航、卡片、按钮、内容和图标等。我们还可以使用适当的留白将不同的元素进一步分开,创建一个层级更清晰的界面结构,以此来帮助用户浏览和理解不同类型的信息。

    邻近原则是直接影响界面可用性的基本规则之一。如果随意控制元素的位置和间距,有可能会让整个产品变得混乱和难以理解。

    二、相似原则 视觉上相似的元素会被视为同一组,视觉上不同的元素,大脑会下意识将其视为单独的元素。

    利用相似性可以来定义界面的特征,例如颜色、形状、尺寸、纹理或空间位置等。最容易区分的是颜色相似,其次是尺寸和形状相似。

    如果一个元素和界面中其他的元素都不同,无法融入到其他元素组中,那么这个元素就会变得非常显眼。

    我们可以利用这种差异化的效果来突出一些具有引导性或者功能性的元素,例如登录按钮或者加入购物车按钮等。

    三、闭合原则 一组不相连的元素组合在一起,我们会下意识地自动补充这些元素之间的空白,得到一个完整的、可识别的形状。

    闭合原则有多种不同的用法。例如一个虚线箭头,我们会填补空白并把这些点连接在一起,得到一条完整的线段。

    闭合原则还有助于识别抽象的图标形状并赋予更多的含义。在图标设计中,为了避免信息过载,大多数图标的设计都很简洁,更方便用户理解。

    运用闭合原则的经典案例包括用不同虚线构成的 IBM 标志、利用正负形空间组合而成的 WWF 熊猫标志。

    四、对称原则 UI 界面中的元素一旦有对称性,就会产生秩序感,我们很快就能看到并理解这种形式。

    我们天生喜欢对称的物体。对称排列的元素在视觉上更令人舒服,也更美观。

    可能有人觉得对称设计过于呆板,这种想法在平面广告或视觉设计中可能正确,但在 UI 设计中对称布局是相当重要且实用的界面排版形式。

    对称布局让设计更容易理解,也更友好,缺乏对称会导致界面混乱,不知道该关注哪个元素。当然,如果想让某个模块突出展示,也可以尝试打破对称性,这样不对称的元素就能在界面中脱颖而出。

    五、连续性原则 界面中沿着同一条线对齐的元素会被认为属于同一组。

    在浏览界面时,视线会第一时间寻找最顺畅的视觉动线。这也解释了为什么在使用连续性原则时,需要确保直线(或曲线)是均匀和可预测的。

    线条越均匀,生成的形状越容易被用户正确识别。

    连续性有助于界面保持上下垂直滚动时的节奏,相似的内容应始终保持对齐。如果某个元素打破了这种连续性,我们的浏览节奏会被打乱,浏览速度也会变慢。

    当下的 UI 设计中,流行带有圆角的卡片和按钮效果。其中的一个原因是我们对于直角的处理速度稍慢,视线需要停顿并旋转 90 度,而更圆滑的导角效果能帮助我们的视线更快地转换。

    六、共同命运原则 按相同方向、以相同速度运动的元素被认为是一组。

    在设计轮播、下拉列表、过渡动画等场景时,共同命运原则会很有帮助。例如我们的视线既跟随轮播图水平移动,还跟随下拉列表向下展开。

    七、希克定律/米勒定律 希克定律:可供选择的选项越多越复杂,就越难做出选择。

    米勒定律:我们的大脑在同一时间只能处理大约 7±2 个对象。

    根据希克定律,可供的选择数量应该有限制。有太多东西可供选择可能会导致用户迷失方向,做出判断的时间加长,甚至会感到压力。

    米勒定律提到,大脑处理信息的能力与认知负荷有直接的关系。我们大脑一次能处理的信息量大约是 7 个对象。对象数量越多,处理它们所需的时间就越长。

    在设计时,尽量不要超过七个选项,为了获得最好的体验,应尽量将选项保持在 4-5 个。这意味着需要控制主导航数量、按钮数量、下拉选项和轮播图数量等。

    当需要用户做选择时,最好能突出显示最受欢迎或最推荐的选项,帮助用户更快做出决策。

    八、前景/背景 我们能够本能地区分界面中的图形元素和背景。

    界面由不同类型和样式的图层组成,每个图层都有不同的层次结构。

    为了避免层次结构混淆,我们需要清楚地定义界面的所有元素。背景不需要设计设计的太花哨,有可能会抢夺用户对主要内容的注意力。

    辅助内容和功能不需要太明显,并且需要与主要内容在设计上做出区分。

    可以使用对比关系、位置关系和阴影等方法帮助用户区分内容和背景。

    九、审美可用性效应 用户通常认为具有视觉吸引力(美观)的产品更实用。

    根据这个原则,流行、对称、美观的界面会对用户产生更积极的影响。如果视觉效果给人足够好的第一印象,用户可能会忽略一些可用性问题。

    审美可用性的基础在于具有一定的可用性,之后才会起作用。如果产品本身的功能就很糟糕,那么再美观的界面也无济于事。

    高质量、美观的界面有助于建立用户信任。相反一个看起来混乱的设计会让用户感到不靠谱。即使用户不能确切说出界面视觉的问题,但他们也会觉得这个产品有风险或者不正规。

    高质量的 UI 设计对于银行类、金融类和医疗类产品来说尤为重要,尤其是在需要用户提供个人信息或涉及交易的使用场景中。

    十、串行位置效应 我们最容易记住一组当中的第一个和最后一个元素。

    将最重要的内容或元素放在每组的第一个或最后一个,吸引用户注意力,方便高频操作。而次要的内容操作频率相对较低,则放到中间位置。

    例如在构建导航、下拉列表等场景中,将重要的操作放到首位。

    十二、隔离效应 在一组看起来相似的元素中,我们总是会记住与其余元素不匹配的那个元素。

    在 UI 设计中,隔离效应意味着将界面中重要的内容或关键的操作在视觉上与众不同。

    最典型案例是界面中的 CTA(号召性用语)按钮。通过改变 CTA 按钮的颜色、尺寸等,与界面中的其他按钮区分开来,第一时间引起用户的注意。

    最后 以上是 11 条在 UI/UX 设计中都经常用到的「设计准则」,希望利用这些图解能够帮你一次性搞懂这些晦涩难懂的设计理论,助力设计成长!

    欢迎关注作者微信公众号:「Clip设计夹」

  • Stable Diffusion自学必看!6款适合小白的零基础免费入门教程

    UI交互 2023-03-29
    大家好,这里是和你们一起探索 AI 绘画的花生~最近优设为大家推荐了不少有关 Midjourney 的教程和资源,不知道大家有没有用起来?除了 Midjourney 之外,另一款大家经常听说的 AI 绘画工具应该就是 Stable Diffusion 了,那你了解它们之间的差别吗?今天我就结合自己的自学经验,为大...

    大家好,这里是和你们一起探索 AI 绘画的花生~

    最近优设为大家推荐了不少有关 Midjourney 的教程和资源,不知道大家有没有用起来?除了 Midjourney 之外,另一款大家经常听说的 AI 绘画工具应该就是 Stable Diffusion 了,那你了解它们之间的差别吗?今天我就结合自己的自学经验,为大家比较一下两款 AI 绘画工具软件的优缺点,并推荐 6 款适合零基础小伙伴的 Stable Diffusion 免费自学入门教程,帮助大家更好的理解和使用不同的 AI 绘画工具。

    Midjourney 入门及进阶教程:

    超详细!AI 绘画神器 Midjourney 基础使用手册 一、前提条件 需要魔法: 新用户可免费创作 25 张图片,超过需要办会员 版权问题:会员生成的图片版权归创作者所有 Midjourney相关资讯: 二、注册/链接 服务器 温馨提示:下方多图预警 1. 注册、创建服务器 ① 打开Midjourney官网,右下角选择"J

    阅读文章 >

    AI绘画进阶必看!9种 Midjourney 常用后缀参数 大家好,这里是和你们聊设计的花生~ 最近 AI 绘画真的越来越火了啦,开始有越来越多的设计师将 Midjourney 用到自己的设计工作流中,让它们生成各种设计灵感或素材。

    阅读文章 >

    一、Stable Diffusion 的特点 与 Midjourney 相比,Stable Diffusion(以下简称 SD)的优点有:

    ① 免费开源

    Midjourney 需要开魔法使用,免费额度用完之后付费才能继续,最低 10 美元/月。而 SD 在 B 站上有大神整理好的整合安装包,不用魔法,免费下载一键安装。 安装到本地的 SD 随开随用,生成的图片只有自己能看到,保密性更强。

    ② 拥有强大的外接模型

    由于开源属性,SD 有很多免费高质量的外接预训练模型(fine-tune)和插件,比如可以提取物体轮廓、人体姿势骨架、画面深度信息、进行语义分割的插件 Controlnet,使用它可以让我们在绘画过程中精准控制人物的动作姿势、手势和画面构图等细节;插件 Mov2Mov 可以将真人视频进行风格化转换;SD 还拥有 Inpainting 和 Outpainting 功能,可以对图像进行智能局部修改和外延,这些都是目前 Midjourney 无法做到的。

    推特网友@Toyxyz3 通过分别渲染手部网格深度和开放姿势骨骼的方式,在 SD 内实现对人物手指和姿势的精准控制。图片来源: https://twitter.com/toyxyz3/status/1629620938894643200/photo/1

    推特网友 @Claude 利用带有 controlnet 和 mov2mov 功能的 SD webUI,将真人视频转换为动画风格。图片来源: https://twitter.com/Claude2021/status/1634952496606236672

    ③ 训练自己的模型

    我们可以用 SD LORA 或者 Dreambooth 将自己喜欢的人物形象或者画风训练生成模型,打造自己的专属 AI 绘画工具,也有画师和 设计师 用自己的原创作品训练模型,之后有灵感了就之后用文字描述出来,让 SD 帮自己快速出各种概念草图。

    利用吴仓石 、郑板桥、八大山人、任颐等大师作品+现代人物训练而成的水墨风 SD LORA 模型—— 墨心 Moxin,图片来源: 墨心 MoXin | Stable Diffusion LORA | Civitai

    与 Midjourney 相比,Stable Diffusion 的缺点有:

    对电脑配置有要求

    在本地用 SD 生成图像和训练模型都需要显卡做支撑,所以 SD 对电脑显卡有要求。最好是 Nvidia 的显卡(N 卡),显存至少 4G,不然图像的生成速度非常非常非常慢(不是夸张),也容易出现报错或系统崩溃。如果你想自己训练模型,最好用高配置的台式机,显卡选 40 系列及以上,显存最低 12G,CPU 选 Intel i7 或者以上,内存越大越好。

    检查电脑显存的方法(windows):

    鼠标放在工具栏,单击右键打开“任务管理器”,选择顶部的“性能”,进入后下拉查看 GPU 的部分,找到“专用 GPU 内存”,下面对应的数字就是电脑的显存。下图显示的电脑显存是 2G,生成一张最低配置的 512*512px 的图像需要 8 分钟,而 32G 显存的生成速度只需几秒,所以显存低的电脑不适合运行 Stable Diffusion。

    需要较大的硬盘空间

    因为 SD 所有文件都是安装在本地电脑上,而且生成不同的风格图像需要下载不同的模型,一个大模型至少 2G,假设你想要尝试 10 种风格,那 10 个大模型可能就要 30G 的空间。一般要求装 SD 的那个盘要有 100G 的剩余空间,最低不小于 40G,且最好不要安装在 C 盘。

    想要生成好看的小姐姐图像,就需要下载文件接近 4 个 G 的 Chilloutmix 大模型,图片来源: ChilloutMix | Stable Diffusion Checkpoint | Civitai

    入门学习难度更高

    SD WebUI 的各种参数比 Midjourney 要复杂,而且很多功能都需要通过额外安装插件和模型来实现,因此我们需要了解各种参数的含义,不同的模型插件的使用方法,可能还需要了解背后的原理知识,因此入门学习的难度比 Midjourney 高。

    一个功能配置较完整的 SD webUI 汉化操作界面。

    高质量风格有局限性,不够灵活

    SD 目前的高质量的图像生成模型多集中在真人、游戏和二次元插画方面, 而且换一个风格就需要下载一种模型;而 Midjourney V5 可以仅通过文本提示词就快速生成各种类型和风格的高质量图像。

    看完上面的内容,想必大家对 Stable Diffusion 适合的使用场景、自己的电脑能否撑起 Stable Diffusion 已经有基本了解。下面为大家推荐 6 个 B 站上的高质量免费 Stable Diffusion 入门教程,包括如何下载 SD 整合安装包,了解 SD 的操作界面和各种参数,不同模型插件的安装和使用以及训练自己的 lora 模型等,教程内容全面、讲解细致,即使是零基础的小伙伴也能无障碍入门 ~

    二、整合安装包,解压即用 秋葉一键安装包: 「AI 绘画」Stable Diffusion 最终版 无需额外下载安装!

    SD 启动器: 「AI 绘画」启动器正式发布!一键启动/修复/更新/模型下载管理全支持!

    秋葉 aaaki-B 站主页: https://space.bilibili.com/12566101?spm_id_from=333.337.0.0

    首先向大家推荐自然是在 AI 绘画届拥有“赛博佛祖”aaaki 称号的秋葉大佬,他发布的 SD 整合安装包解决了之前需要进行环境配置的问题,真正做到“一键安装”。我目前用的就是这个整合包,安装过程顺利到自己都有点不敢相信。安装包下载链接在视频的简介里有说明,跟着 Up 的视频进行操作就与可以了。

    B 站另一位大佬@独立研究员-星空也推出了整合包,同样是解压即用,特点在于他会根据 SD 微调模型的发展状况进行安装包更新,目前发布的最新版本已经整合了 Controlnet 和像素化插件,下载后无需再自己再去一个个安装,更加便捷。大家可以先下载安装包,然后看一下合集里的更新介绍,就能明白安装包的用法了。

    星空一键安装包: AI 绘画 「Stable Diffusion」整合包使用 1 基本功能使用

    星空-B 站主页: https://space.bilibili.com

    大佬们分享的整合安装包帮我们解决了 Stable Diffusion 的安装问题,接下来要解决的就是如何使用的问题了。

    三、零基础手把手教程 链接直达: 喂饭级的 stable diffusion 教程!让每个人都能轻松学会 AI 绘画!

    如果你不理解如何安装和使用秋葉大佬的安装包,那么推荐你看 B 站的 UP 主 @靠谱的轩轩,他的《Stable Diffusion 喂饭级教程》目前已经更新了 11 集,从 SD 怎么安装、需要什么配置、操作界面上的各个按钮是概念解释到各种模型插件使用方法都有详细介绍,适合对 AI 绘画完全没有了解的小伙伴。

    四、绘画过程教学 链接直达: AI 绘画基础-01Stable Diffusion 零基础入门

    推荐零基础小伙伴看的另一个教程是 UP 主 @my3d 的《AI 绘画基础 》,他会分享 AI 绘画的详细过程,并借此讲解提示词、参数、模型插件等知识。UP 主本身是一位大学老师,讲得很详细但是节奏比较慢,质量还是非常不错,适合喜欢慢慢理解学习的小伙伴。

    五、快速入门教学 如果你觉得上面的教程进度太慢,想要快速学会怎么用 SD 生成好看的图像及训练自己的模型,可以看 YouTube 大神 @Kas Kuo Lab 的 SD LORA 模型训练教程,和 B 站大神 @StarPorridge 小粥 的 SD 入门和进阶教程。这两门教程信息密度很高,可以快速学会界面操作、用 Controlnet 控制人物姿势、安装使用模型以及自己训练 LORA 模型。

    Kas Kuo Lab 教程 YouTube 链接: Kas Kuo Lab (需要魔法)

    Kas Kuo Lab 教程 B 站搬运链接: Stable Diffusion 功能與介面

    小粥的 SD 基础入门教程: AI 手把手教学

    小粥的 SD 进阶教程: 你真的会用 AI 么?关于 AI 的 prompt,一定要学会!

    以上就是本期为大家推荐的 Stable Diffusion 零基础免费自学教程,希望对想学 AI 绘画的小伙伴帮助。喜欢本期推荐的话还请多多点赞收藏,之后会继续为大家推荐更多实用的 Midjourney、Stable Diffusion 等 AI 绘画相关资源。

    推荐阅读:

    AIGC神器 Midjourney V5 强势更新!逼真到令人发指! 大家好,这里是和你们一起探索 AI 绘画的花生~ 备受期待的 Midjourney V5 在上周四终于上线了,而且一发布就引起了不小的轰动,因此这次 V5 模型的图像生成效果“太惊人了”,无限逼近真实照片,让人难辨真假。

    阅读文章 >

    比 AI 帮个忙更好用!这 5 款神器让你效率暴涨200% 大家好,这里是继续为你们推荐 AI 效率神器的花生~ 自 ChatGPT 公布后,各种基于其 API 开发的应用就像雨后春笋般迅速出现,之前「优设 9 图」为大家介绍的“AI 帮个忙”就是其中之一。

    阅读文章 >

    提高3倍效率!能落地的AI绘画&设计系统课来了! 如何快速入门AI绘画和AI设计?

    阅读文章 >

  • ChatGPT对于金融行业的机会与革新

    设计动态 2023-03-29
    2023年至今,ChatGPT和GPT-4始终霸占在热搜榜上,一方面外行人都在惊叹于AI怎么突然如此强大,会不会革了「打工人」的命;另一方面,人工智能和大数据等创新技术在金融领域的应用更加深入,技术与业务的融合趋势越来越显著,财富资管这类金融行业正在被重塑。

    ChatGPT的出现,不仅对于科技界产生了震动,连金融界也不例外。我们需要注意技术的快速发展,提高自己的专业能力和客户影响力,但同时也可以学习利用ChatGPT,让它为自己所用。本文作者对此展开了分析,希望对你有帮助。

    2023年至今,ChatGPT和GPT-4始终霸占在热搜榜上,一方面外行人都在惊叹于AI怎么突然如此强大,会不会革了「打工人」的命;另一方面,人工智能和大数据等创新技术在金融领域的应用更加深入,技术与业务的融合趋势越来越显著,财富资管这类金融行业正在被重塑。

    首先,本文不在过多的阐述ChatGPT是啥了(相信大家基本都已经清楚了),所以就【ChatGPT里的GPT,分别代表什么?】进行一下普及吧。

    GPT,Generative Pre-trained Transformer——生成式预训练变换模型。

    Generative,生成式,是指它能自发的生成内容。 Pre-trained,预训练,是不需要你拿到它再训练,它直接给你做好了一个通用的语言模型。 Transformer,变换模型,谷歌提出来的一个很厉害的模型,他可以帮助更好的去处理NLP相关的问题,是非常棒的神经网络结构。 接下来,回归正题,关于chatgpt对于金融行业的机会与革新,会分如下几个点来分享一下:

    1. 可能会存在的几个方向性的影响面情况 行业营销模式带来的改变。有了ChatGPT以后,投资者很容易就会了解到不同代销机构和财富机构销售产品的考核模式,已经有不少代销机构和财富机构转向以客户资产增值或者客户资产保有规模作为考核目标,这种 信息透明化 ,将会推动代销机构向财富管理模式转型,最终实现由中间收入驱动营销转向买方投资顾问专业驱动的营销。 在投研和风控方面的改变。市场上原本存在的许多金融产品,包含股票债券的定价和交易受制于信息不对称的情况,未来将得 益于ChatGPT的出现很多的信息不对称的问题消失 了。在未来,它也将会改变我们投研和风控的方式,这就要求资管机构加速数字化、智能化的进程 从客户服务的公平性来说,即 带来普惠 。在资产管理和财富管理领域,原来比如我们只有私人银行的客户才能够享受的一对一的专属服务,未来,可能有更加专业的ChatGPT来给你提供服务,可以想象,未来整个财富管理的格局或会发生非常大的改变。 营销支持的改变,即 AI生成+后期加工与结合运用 。ChatGPT生成内容的质量和效果还需要在后期进行加工和改善。运用不同业务下营销人员专业能力和技术知识,才能够将ChatGPT生成的内容达到更好的营销效果。但是在生成速度与框架脚本的设计上,还是会大大提速。 2. 落地到具体的场景来看 客户服务(智能语音、智能客服、智能催收):ChatGPT可以用于客户服务领域,为客户提供快速、准确的回复。

    一方面,它能够根据客户提出的问题,快速生成人类可理解的回复,与传统的智能客服、虚拟数字人相比,服务更加流畅,对客户更加友好,对话的内容有上下文的连贯性,让客户的体验得到提升。直白点说,让客户能聊得下去,比现在这种AB判断的智能语音要更贴近现实一些。 另一方面,ChatGPT赋能虚拟数字人,或为虚拟数字人在拟真形象、智能对话、情感化互动等方面带来长足进步,在智能客服、网点引导、财富规划、信贷审核等多个岗位进一步发挥作用。 智能风险管理:

    它能够学习客户的历史交易数据及大量文本数据,快速生成风险评估报告,为金融机构提供可靠的决策依据。据国盛证券研报,ChatGPT有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集含有超过万亿单词的人类语言数据。基于其高效的数据处理能力及内容丰富的数据集,或可在另类风险提示方面带来新思路。 另外他还可以通过实时监测市场风险,并追踪欺诈活动来防范风险和欺诈行为,提高金融机构和客户的安全性。在监测欺诈、识别异常账户行为和风险预测方面的效果,并探讨如何将这些技术应用于金融行业以增强风险管理。 产品销售支持:

    比如在保险销售行业,保险代理人需要具备专业知识,而保险产品相对复杂,仅在寿险领域就分为意外险、医疗险、重疾险、养老年金、万能险、分红险等,这些对于保险代理人而言学习成本非常高。一般而言,代理人往往只了解几家保险公司的产品,所推荐的产品很可能缺少差异性。 当ChatGPT等AI工具可以把全行业的产品集成,降低了代理人的学习门槛,让其更多的专注于理解客户需求,最终在更大的范围内遴选出适合客户需求的、兼具个性化和综合性的产品方案。 ChatGPT 可以处理大量的用户请求,并根据用户提出的问题提供自动化的回答。这可以节省客服人员的时间和精力,减少工作负担,提高营销效率,同时还可以节省企业成本。(图片来源于网络) 营销内容的生成:

    ChatGPT 可以基于用户提供的关键词和提示,生成有用的内容,例如文章、视频、图片、漫画等。生成的内容可以是丰富多样的,具有指导性、娱乐性和信息性等特点,可以吸引更多的目标受众。 还可以提供个性化内容推荐:ChatGPT 可以根据用户在金融机构已有的客户画像,生成个性化的内容推荐,通过千人千面的推送,将会大大提高用户体验,增加用户粘性,从而促进销售和客户对于品牌的忠诚度。 资产管理、财富管理和投顾的运用:

    当前投顾需要面对的客户需求五花八门,产品多种多样,经常会出现客户提出一个问题要快速反馈的情况,通过chatgpt可以给出如此有人性温度的答案。比如给老王推荐多资产投资(如FOF等),来降低波动,AI可以帮我们整理一段话术:

    (图片来源于网络)

    比如客户在了解多资产配置的作用基础上,希望看到一份投资建议书。我们可以利用ChatGPT能力快速生成。当然,此处由于GPT是个语言模型,对金融资产风险收益缺乏理解,只能给出一个大的框架。

    (图片来源于网络)

    3. 目前一些机构的试水的情况 招商银行:

    今年2月6日,招商银行利用ChatGPT在官微发布了一篇名为《ChatGPT首秀金融界 ,招行亲情信用卡诠释“人生逆旅,亲情无价”》的推文。

    财通证券:

    其团队人员近日在其公众号发布了一篇由ChatGPT撰写、Deepl翻译的实验性报告,名为《提高外在美,增强内在自信——医疗美容革命》,全文总共超过6000字。

    中国人寿:

    2月13日,中国人寿官方公众号曝光了其与ChatGPT的聊天记录。

    平安产险:

    2月12日,平安产险公开了与ChatGPT的“对话”。

    4. 行业对于ChatGPT看法以及未来的预期 ChatGPT是一种需要大量数据支持的技术手段;虽然它已经成为了生产力,但它仍然只是一个“通才”,在行业细分领域的专业性和人文关怀方面仍然难以深入掌握。要与金融业务深度结合,解决业务痛点,还需要将其训练为“专才”。

    就最近一个月的飞速发展与运用情况来看,chatgpt已经是现实的生产力,基本上对每个人都有价值。现在摆在我们面前的只是用哪个、怎么用的选择,不存在用不用的问题。

    另外ChatGPT也面临着许多挑战:

    ChatGPT是个语言大模型,它擅长逻辑推理,但并不能执行标准的计算机算法,金融数据的处理计算问题并不是其优势。 落地成本高,需要强大的数据、算力、算法做支撑。 模型学习的数据源较为冗杂,模型可信度需要实践验证。 可能会替代理财经理/保险代理人的一部分工作,但是不大可能完全取代。因为金融行业对信息准确性、安全性和用户隐私、人文关怀等的要求比较高,还需要解决与人类共情的难题。 和金融的结合一定要经过大量的训练,并且实时更新数据,同时与监管要求相匹配。 所以,对于ChatGPT,我们需要注意技术的快速发展,提高自己的专业能力和客户影响力,以避免被它无情地替代。但是同时,我们也可以利用ChatGPT这种技术的日益增强的支持,为自己的发展提供帮助,并让它为我们所用。

    本文由 @毅鸣 原创发布于人人都是产品经理,未经许可,禁止转载

    题图来自 Unsplash,基于 CC0 协议。

    该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

    给作者打赏,鼓励TA抓紧创作!

    {{{path> 赞赏

  • AI绘画神器Midjourney进阶手册:如何让生成的图片更加可控?

    UI交互 2023-03-29
    现在我几乎每天都在用 AI 绘画和 chatGPT,它们已经成为我工作的好帮手了。我从去年就对这个领域持续关注,确实是发展很快,尤其是最近几个星期,感觉每天都在搞大新闻。科技发展并非线性的,而是爆炸式出现在我们的眼前。

    现在我几乎每天都在用 AI 绘画和 chatGPT,它们已经成为我工作的好帮手了。我从去年就对这个领域持续关注,确实是发展很快,尤其是最近几个星期,感觉每天都在搞大新闻。科技发展并非线性的,而是爆炸式出现在我们的眼前。

    通过不断研究,我把很多有价值的内容整理成了教程,不小心就写成一个系列了,相信这个系列还会有更多更新,放心,都是免费的。

    那么接上一篇,今天继续和大家分享一些 AI 绘画的高级用法教程。这篇教程主要解决的问题是:如何让生成的图片更加可控。毕竟我们的工作需求是明确的,如果每次生成的内容太过随机,对工作来说可能就不是太有用了。

    往期教程:

    超详细!AI 绘画神器 Midjourney 基础使用手册 一、前提条件 需要魔法: 新用户可免费创作 25 张图片,超过需要办会员 版权问题:会员生成的图片版权归创作者所有 Midjourney相关资讯: 二、注册/链接 服务器 温馨提示:下方多图预警 1. 注册、创建服务器 ① 打开Midjourney官网,右下角选择"J

    阅读文章 >

    超详细!AI 绘画神器 Midjourney 进阶使用手册 前言 本文从Midjourney喂图、关键词、插画类/渲染类关键词等3个章节,帮你掌握 Midjourney 的进阶玩法。

    阅读文章 >

    一、如何画系列插画 有时候,我们希望能够画一个系列的插画,让主体形象保持稳定,并让它能保持一个风格不变,这个会更适合我们实际工作需要。

    举例:画一个人物,在保证人物形象基本一致的情况下,让她在服装、表情、动作和场景上做出不一样的表现。有几个方法可以尝试:

    1. 喂参考图

    先把自己喜欢的参考图上传,然后点开上传的图片,复制它的链接。(具体上传的方法,上一篇有讲过,这里不再赘述)

    然后在关键词的地方填上:图片链接+这张图的关键词。

    例如:链接图片.png, a Super cute sports girl, wearing a basketball vest,blueshortsbig watery eyes, clean bright basketball court background,super cute boy IP by pop mart, Bright color, mockup blind box toydisney stylefine luster, 3D render,octane render,best quality,8k brightfront lightingFace Shot,fine luster,ultra detail, --ar 9:16

    这是参考图

    这是生成后的图,基本上还是可以保持她的特征的

    接着给她换一件蓝色的衣服,同样的上传她的图片,复制关键词,这次我们把衣服的颜色改一下,在关键词中加一个 wearing a blue basketball vest

    2. 使用 panels 命令

    Panels 这个命令可以生成连续的动作和表情设计。如果你希望的是设计一个角色,并拥有连续的动作和表情,用这个命令就会非常方便。(提醒下,如果想画动漫角色可以把模型设置先改为 niji mode,画动漫角色效果会更好)

    我继续用上面的关键词修改一下作为例子:

    a Super cute sports anime girl,style by Miyazaki Hayao,6 panels with different poses 8K

    (说明:这里的关键词修改,我去掉了 3D 渲染风格,去掉了 3D 风格向的参考图,还去掉了很多修饰性关键词,约束太多可能会导致这个命令失效,我猜测可能是为了能兼顾到各种特征,所以存在一个权重问题,权重后面会讲)

    另外,使用 continuous running 也可以更稳定的舒服连续动作,甚至可以做成 gif 动画

    例如:a Super cute sports anime girl,style by Miyazaki Hayao,6 panels with continuous running

    可以看到,在 niji 模型下,画手还是差点意思,但作为参考图来说,已经挺好了。

    3. 利用 character sheet 命令

    创建一个角色的多角度以及特写细节

    例如:a Super cute sports anime girl,style by Miyazaki Hayao,character sheet,full body,8k

    我也顺便对比了下 niji 模型和现在的 v5 模型,同样的关键词,生成的结果差别还是挺大的。实测发现 v5 在画手方面确实要比 niji 更好了。

    4. 使用 emoji,expression sheet

    这里的 emoji 代表表情包,expression sheet 代表各种表情组合,可以用这个核心关键词设计出表情包

    例如,我还想用之前生成的角色做,那么我在关键词前面会把刚才的图片喂给 AI:图片链接.png a Super cute sports anime girl,style by Miyazaki Hayao,emoji,expression sheet,8k

    二、如何对生成的图片进行微调? 我在使用 AI 做真实需求的时候,就会遇到一个困惑,就算每次复制一样的关键词,但生成图一样会出现很强的随机性。那如何调教它,生成自己想要的图呢?经过我的研究,我发现可以利用 seed 参数,反向生成。

    1. 利用 seed 反向调整

    先从官方文档中看看 seed 这个参数到底是做啥的:

    Midjourney 会用一个种子号来绘图,把这个种子作为生成初始图像的起点。种子号是为每张图随机生成的,但可以使用--Seed 或--same eseed 参数指定。使用相同的种子号和提示符将产生类似的结尾图片。详细参数可以看看官方文档: https://docs.midjourney.com/docs/seeds

    默认情况下,这个种子是随机给的,所以如果我们想要比较相似的图,就需要把 seed 固定下来。简单来说,在用的时候,给关键词加一个 seed 参数就好,具体数字是多少无所谓(只要在 0–4294967295范围内)

    比如 caiyunyiueji is a cute sports anime girl,style by Miyazaki Hayao,emoji,expression sheet,8k --seed 8888

    这样就能保证每次生成的都是一模一样的图了。

    那有人可能会问,每次都生成一模一样的图有什么用呢?其实就可以反向利用这个特性,来对已经确定的效果图进行微调了。

    比如当我发现有一张图已经比较接近目标了,那么还需要有一些微调,怎么做呢?

    思路就是利用确定图片的 seed,再它的基础上再加上新的关键词,以此来对它进行微调。

    例如:彩云译设计 is a wild camping girl, cute wind element elf girl, Yellow wavy hair, cartoon styling design, backpack holding camera, Wearing cut duck hat, Dense foliage under strong summer sun Dense leaves under the strong summer sun, gradient style, tide play blind box, clean background, Laugh and sing happily,natural lighting, Bright color,8K, Super Detail, 3D, Depth of Field, Pixar Trend, super realistic, light tracking, complex details, Art background, Super detail, solid color background, fine texture, OC renderer, Ultra HD, fine texture, front body, 3D rendering, 8K,--ar 3:4 --q 2 --v 5

    假如我觉得这 4 张图的方向没问题,只是一些细节需要优化,如果我直接让它重新生成,那么可能会跟现在完全不同了。

    比如我让它重新生成一次就跟现在的完全不同了

    所以,怎么办呢?这里就需要获取它的 seed 了(注意:单张图片是拿不到 seed 值的)。

    方法是给这个生成图添加一个反应表情 envelope,那么 midjourney 就会以私信的方式给你发送这个 seed

    有了 seed 后,再把这张图之前的关键词都复制过来,再添加你的修改词,最后在关键词后面加上这个 seed,就可以实现对已确定的图片微调了。

    例如:我希望她的眼睛是蓝色的

    关键词:彩云译设计 is a wild camping girl, cute wind element elf girl, Yellow wavy hair, blue eyes,cartoon styling design, backpack holding camera, Wearing cut duck hat, Dense foliage under strong summer sun Dense leaves under the strong summer sun, gradient style, tide play blind box, clean background, Laugh and sing happily,natural lighting, Bright color,8K, Super Detail, 3D, Depth of Field, Pixar Trend, super realistic, light tracking, complex details, Art background, Super detail, solid color background, fine texture, OC renderer, Ultra HD, fine texture, front body, 3D rendering, 8K,--ar 3:4 --q 2 --seed 1485209209

    上面的图 U3 就跟之前的图很接近了,其他的图还是会有一些随机性,但这个方法确实是可用的,不同的图效果差别会比较大,你也可以自己去测试。

    2. remix mode 可调整模式

    还有一个办法是在设置中修改 remix mode 模式,支持你在给定的框架上做局部的调整

    例如:A specialty food shop selling high-quality Japanese ingredients, such as wagyu beef, matcha tea, and fresh seafood, cute 3d, kawaii, isometric, very detailed, cartoon, casual, gameart --q 2 --ar 2:3 --uplight --v 5

    我希望给 v3 增加更多绿植,在 rexim mode 模式下,可以直接在弹出框里修改关键词,很方便。默认情况下是关闭的,因为很多时候其实不大需要修改。

    关键词:Long vines envelops the building::2 ,A specialty food shop selling high-quality Japanese ingredients, more long cirrus on the whole building:: 2,such as wagyu beef, matcha tea, and fresh seafood, cute 3d, kawaii, isometric, very detailed, cartoon, casual, gameart --q 2 --ar 2:3 --uplight --v 5

    三、高级参数设置 1. 参考图权重

    --iw,image weight 图像权重,表示图像相比与文字的影响程度,不同版本取值范围不同,v5 版本的取值为 0.5-2 之间,在有参考图和关键词的情况下,设置对 AI 绘画影响的比重,数字越大越接近参考图。

    例如:我的参考图用了上面生成的这张图

    我把参考图的比重写为 0.5:图片链接.png 彩云译设计 is a wild camping girl, cute wind element elf girl, Yellow wavy hair, blue eyes,cartoon styling design, backpack holding camera, Wearing cut duck hat, Dense foliage under strong summer sun Dense leaves under the strong summer sun, gradient style, tide play blind box, clean background, Laugh and sing happily,natural lighting, Bright color,8K, Super Detail, 3D, Depth of Field, Pixar Trend, super realistic, light tracking, complex details, Art background, Super detail, solid color background, fine texture, OC renderer, Ultra HD, fine texture, front body, 3D rendering, 8K,--ar 3:4 --q 2 --iw 0.5

    当我把参考图比重改为 2 时:图片链接.png 彩云译设计 is a wild camping girl, cute wind element elf girl, Yellow wavy hair, blue eyes,cartoon styling design, backpack holding camera, Wearing cut duck hat, Dense foliage under strong summer sun Dense leaves under the strong summer sun, gradient style, tide play blind box, clean background, Laugh and sing happily,natural lighting, Bright color,8K, Super Detail, 3D, Depth of Field, Pixar Trend, super realistic, light tracking, complex details, Art background, Super detail, solid color background, fine texture, OC renderer, Ultra HD, fine texture, front body, 3D rendering, 8K,--ar 3:4 --q 2 --iw 2

    整体的效果会更接近参考图的效果。

    2. 图片融合技巧

    上传多种图片进行融合生成,有一个技巧就是一张图片最好只有一种特征,比如合并 2 张图,一张是有人物,另一张是只有背景,那么合并起来的效果会更精确。

    3. 关键词权重

    写普通关键词是用逗号分开,这个应该你都知道了,但其实还可以写多重关键词。它的意思是要 AI 不需要考虑单词的前后关系,而只把它们当成独立的单词,比如 hot dog 和 hot:: dog (到这里我付费的次数也快用完了,我就用官网上的案例给大家演示了)

    hot dog

    hot:: dog

    多个单词甚至长句也可以这样用,比如 cup:: cake:: illustration

    基于这个还有更高级的用法,给不同的单词赋予不同的权重 ,比如 hot::2 dog,可以看到 hot 这个词对结果的影响更大了。

    有增加权重,也可以减弱权重,比如这个权重可以是负数,意思是减弱某种元素的比重

    比如我生成了一张图上面有很多红色

    我不希望它出现太多红色,就可以在关键词后面加上 red::-.5,这样大红色就少了很多。

    4. 降低权重

    除了用数值降低某个元素的权重,还可以直接用--no 这个参数让某个元素尽量弱化,比如我们 AI 生成图的时候,经常会出现手的问题,可以给参数 -- no hands,这样手出现问题的概率更低。--no hands 跟 hands: -0.5 是等价的。

    5. 设置 v 版本

    不是越高的版本就一定越好,其实每个不同模型的侧重点会有所不同,比如-- niji 就是专门针对动漫的模型,--v 5 生成的图对摄影类的质量很高。具体的详细内容,可以看看官网介绍 https://docs.midjourney.com/docs/model-versions

    6. 设置图片比例

    --ar 1:1 这样就设置了 1:1 的比例,你也可以改成其他支持的比例。

    7. 还有一些不是很常用的设置

    --creative 更适合做脑暴和创意设计,做出来的图脑洞更大,更有创意性

    --chaos 100 或--c 100 指的是生成图的视觉风格,数值越大,这一组的风格差异就越大。取值范围在 0-100 之间,默认值是 0。

    --stylize 1000 或--s 1000,数字越大,生成的图片就越有艺术感。取值范围不同版本也不同,v 5 版本的范围是 0-1000

    最后 学习 AI 绘画和学习其他技能一样,也需要自己多练习,在练习的过程中掌握规律。有些知识单看教程觉得好像就是这么回事,但自己真正做的时候又会是另一番景象了。我自己为了写好这篇教程,已经把付费买的次数给用完了,但我觉得是值得的。

    通过不断的研究,我对 AI 绘画的知识更熟悉了,最后能把自己研究的心得总结成经验与大家分享,我是很开心的,也希望我的教程对大家有帮助,如果有不明白的地方欢迎与我交流。

    如果你有学到,记得分享到你的朋友圈哦~

    提高3倍效率!能落地的AI绘画&设计系统课来了! 如何快速入门AI绘画和AI设计?

    阅读文章 >

    欢迎关注作者的微信公众号:「彩云译设计」

  • 我眼中的「中国式科技创新」

    设计动态 2023-03-29
    相信大家最近已经被国外的科技创新刷屏了,先是Open AI连着放出大招,推出GPT 3.5后100多天又祭出“大杀器”GPT 4,后有全职员工仅11人的Midjourney进行了史上最重磅的更新:不仅给关键词就能做出你想要的图片,还解决了最难的细节刻画问题。

    最近一段时间,有关AI人工智能的科技创新动态已经在不少人的手机上实现了刷屏,比如GPT-4的推出,Midjourney等AI绘画软件的进步,等等。那么在这类科技创新动态中,我们要如何应对和自处?不如来看看作者的分析。

    相信大家最近已经被国外的科技创新刷屏了,先是Open AI连着放出大招,推出GPT 3.5后100多天又祭出“大杀器”GPT 4,后有全职员工仅11人的Midjourney进行了史上最重磅的更新:不仅给关键词就能做出你想要的图片,还解决了最难的细节刻画问题。

    这样的速度一度让人工智能圈感到十分震惊,包括大模型、深度学习、机器学习圈的各位大佬,他们在讶异的同时,更多的是茫然: 敢情并不是人工智能赛道不行,而是方向搞错了。

    不过,当这股浪潮传导到国内,风向却变了味。拿《新眸》近期爆火出圈的几个视频(其中,Midjourney那期超200万播放、20万次转发)来说,他们中的大多数第一反应是:国外又遥遥领先了,国内又要抄作业了,我们又要失业了。甚至有的网友直接吐槽,国内有的大厂心思都放在团购、买菜上了。

    先说结论: 这次由Open AI掀起的人工智能剧变,根本上还是应用层的创新,但它和早前玩法不同的是,这次是建立在LLM(大语言模型)上。 以数据训练为例,基础模型GPT 3.5训练一次就要花费300万-460万美元,而且,随着模型能力提升,参数持续优化,训练的成本还会不断增加。

    讲得再通俗点,这次变革是结构性的,而非卡位底层或者应用层。 这其实也解释了微软为什么会掷重金押注Open AI,原因很简单,无论是过去的Office 365、Bing搜索,还是它旗下的云计算业务Azure,本质上还是建立在传统的互联网架构上,GPT的兴起让微软看到跨时代产品的可能性。

    这也是《新眸》团队一直尝试分析,但始终没有得出很好结论的地方:过去我们一直把创新定义为“更好的体验”、“更低的成本”以及“更高的收益”,其中很大程度是受摩尔定律的影响,它来自英特尔创始人之一戈登·摩尔的经验之谈,其核心内容是:集成电路上可以容纳的晶体管数目每经过18-24个越就会增加一倍。

    但到了人工智能时代,人们陡然发现摩尔定律突然失灵了。究其根本,所谓的摩尔定律就是“加量不加价”的逻辑,“芯片能力翻番,价格不变”可能在内卷时代奏效,但一旦有颠覆式的创新出现,就会直接动摇底层根基,关于这点,苹果、AWS、特斯拉就是十分典型的例子。

    一、怎么衡量科技创新的含金量? 回到一开始讨论的话题,GPT的陡然领先是不是意味着国内玩家真的技不如人。

    答案是否定的。 纵观国内二十多年的互联网科技发展,我们在很多地方都保持着很高的竞争力,比如电商和物流体系、在线支付领域等,包括一直被诟病产品打造上,也有字节、Shein这样有国际竞争力的公司接连涌现。

    经过大量的试错,我们必须承认,眼下的科技创新环境已经变了,那些存活下来的公司都有一个特征: 顺势而为。 这点,小米创始人雷军也曾提过类似的观点,他以海底捞举例,认为好的产品不是性价比高,也不是有多少黑科技,关键是要能给用户制造惊喜。

    的确,在过去很长一段时间,我们都把科技创新通俗地量化成各种指标:研发投入(占比)、投入回报率以及专利数。这看起来多少有点本末倒置的意味,因为从最终成果上来看,这些指标只是过程,而非目的,更不是结果,就像一度被低估了的英特尔和英伟达,到了人工智能时代,反倒是英伟达最先抓住了机会,但你能苛责英特尔没有创新能力吗?

    当然,这不仅仅是国外科技的问题,国内在互联网科技本身起步就比较晚,其中的鸿沟并不是单单解决技术创新就能解决的。我们必须认识到,现在的科技创新已经不单单是一个点,而是一条线、一个面的多方联动,市场-产品-技术,只有这三者形成为飞轮体系转起来,才能说是真正的创新。

    就比如现在大火的GPT,它本身就不是一个低门槛的游戏,且不论训练一次的其它费用,仅支撑训练的底层算力,就是一笔巨额的开销。包括谷歌、亚马逊、百度、阿里这样的巨头想扎根其中,都要先搞明白一件事: 首先它得是一笔好生意,其次才是投入。

    这也是很多公司和高管团队没想明白的地方。包括之前的云计算、自动驾驶和SaaS浪潮,有的公司还没搞明白人工智能是什么,就拉着投资人投身其中,然后对标某家海外公司,招团队、拉估值,最后的结果可想而知。

    二、创新不是想当然,更不是噱头 国际范围内,除了硅谷,以色列和新加坡也是大名鼎鼎的创新之都。

    新加坡且先不论,单论以色列,你可能想象不到,一度被外界认为只有中美才能做出的大语言模型,居然也会在以色列诞生:AI21 lab不仅做了1780亿参数的大模型,还在自家模型上做了自己的应用,像极了隔壁的Character和Midjourney。

    回过头再看微软,无论是比尔·盖茨,还是如今的掌门人萨提亚·纳德拉,你可以对他们独到的商业眼光感到惊叹,但也不必过度高估了他们的创新能力。 有位曾经在微软工作的架构师跟我聊过这个问题,他认为现在微软的组织架构看起来是过时的,但却有着十分灵敏的商业嗅觉,这是微软保持基业长青的秘诀。

    这像极了早年间的一级市场投资行业,只要你运气足够好,在早期赌对了一家公司,那你就能获得丰厚的回报。但它和以色列的创新氛围,其实是截然不同的两条路径,以色列人少、土地少、资源更少,所以想发展重工业几乎不可能,唯一的出路就是脑力资源。

    当然,以上还不是最关键的,最重要的是很多以色列人真的把科研当爱好,而不是枯燥的工作,而且,研究开发态度极其端正,这也解释了为什么像Google、Apple、Intel、IBM这样的大公司会把目光聚焦在以色列,无论是并购、投资,还是开创联合研发办公司。

    反观国内互联网近10年的发展,确实应用层多点开花,以至于一个生鲜团购就有10几种玩法,几百甚至上千家公司。这是一个好现象,说明中国市场大、创新空间多,但也是一个坏现象,趋利角逐的最终结果,就变成了一场考试,能上985的就那几个,不同的是,没考上985的,最终的结局就只有被淘汰。

    这也是《新眸》作为分析师视角,观察到的不好的现象。每每海外有重大科技创新,我们中的很多人,甚至一些所谓的专家,第一反应是先大肆夸赞一番,然后开始等待中国玩家进入,但一旦有中国玩家进场后,他们的第一反应往往是苛责,百度文心一言就是最好的例子。

    该现象我至今都很诧异和不解,难道对方积攒十几年、甚至几十年的技术,光凭一大堆所谓的技术、产品、市场专家们,开开会、发发Paper就能解决的吗?我相信,个中的答案已经明了,很多时候,我们要弥补的,绝非技术上的欠缺,而是文化上的自信和自醒。

    三、「中国式创新」的底色和动力 即便放到现在,关于中国式的创新如何定义,仍然是一个十分棘手、短期内也给不出精确答案的问题,就像一个产品专家,他如果不能站在科技+人文的十字路口上,也很难做出大众级的产品,微信、抖音这样的超级APP如是、工业制造业升级也如是,只是我们没有注意到罢了。

    这恰恰是眼下中国式科技创新正在翻越的一道坎,互联网科技公司正在和传统产业发生潜移默化的融合,这种连接并不是一蹴而就的,甚至是极其缓慢的,但它背后带来的效率变革却是巨大的,关于这点,黑灯工厂就是最好的例子。

    《新眸》内部尝试归纳过这种变化的动力源泉,在调研过大量企业中高管后,我们发现了一个特别的规律: 大众媒介让创新显得有点拔苗助长。 浮躁的心态让很多人误以为,创新是可以在极短时间内交差的事,但我们却忽略了周期的重要性。

    拿GPT4来说,直至推出,官方说法也是花了将近6个月时间不断调优。

    所以,眼下的最好建议是,请给中国式创新多一点时间吧。

    作者:桑明强

    来源公众号:新眸(ID:xinmouls),专注于全球商业科技研究

    本文由人人都是产品经理合作媒体 @新眸 授权发布,未经许可,禁止转载

    题图来自 Unsplash,基于 CC0 协议。

    该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

    给作者打赏,鼓励TA抓紧创作!

    {{{path> 赞赏

  • 经济下行第一剑,互联网巨头先“斩”曲库

    设计动态 2023-03-29
    对于唱片公司来说,今年的春天比以往要冷一些。 往年,各大平台都在春天和唱片公司进行音乐授权续约,但今年却意外频出,一周就出现三起音乐授权续约风波,如果加上这几个月的类似新闻,就更多了。 主角不仅包括为音乐行业社交媒体广告收入贡献占比高达29%的Meta,还有一

    今年,各大平台在进行音乐授权续约时意外频出,出现了多次音乐授权风波,主角包括Meta和TikTok,涉及的唱片也不止本土音乐巨头,还包括三大唱片公司这样的巨无霸。为什么今年的音乐授权续约这么难呢?一起来看一下吧。

    对于唱片公司来说,今年的春天比以往要冷一些。

    往年,各大平台都在春天和唱片公司进行音乐授权续约,但今年却意外频出,一周就出现三起音乐授权续约风波,如果加上这几个月的类似新闻,就更多了。

    主角不仅包括为音乐行业社交媒体广告收入贡献占比高达29%的Meta,还有一度改变音乐行业趋势的TikTok,涉及的唱片公司也不仅包括本土音乐巨头,还包括三大唱片公司这样的巨无霸。

    那么,为什么今年的音乐授权续约特别难?

    01 “谈不拢了” 春天来了,但有些唱片公司的心还是冷的。

    3月16日,Meta和意大利作者与出版商协会(Società Italiano degli Autori ed Editori, 简称SIAE)宣布中断续签许可协议的谈判。

    SIAE指责Meta缺乏信息透明度,不提供广告和音乐相关数据,只是基于总部给的预算,给了一个一口价,这违反了《欧洲版权指令》;并称Meta已经在法国、澳大利亚、加拿大都试过这招,都失败了,这次也不会得逞。而Meta方的态度也非常强硬,直接下架了SIAE的音乐。

    3月17日,Twitter和三大唱片公司从去年秋天就开始的谈判也被《纽约时报》爆出“陷入僵局”。

    据悉,马斯克团队在收购Twitter后,原本对音乐授权表示感兴趣,并了解过与唱片公司的谈判情况,评估了成本。他还曾考虑恢复此前收购的短视频应用Vine,来挑战TikTok。但由于马斯克接手Twitter后,不仅大量裁员,陷入人事混乱,使得与唱片公司对接的人员几乎所剩无几,还大幅消减开支,使得关于音乐授权的评估和谈判无法继续。

    3月21日,据BBC报道,印度唱片公司Zee的曲库已经从Spotify平台下架。Zee是印度国内最大唱片公司之一,其YouTube关注用户达到9360万,在印度音乐频道中仅次于另一家印度唱片公司巨头T-Series,后者拥有2.39亿用户。

    据悉,下架的歌曲包括近两周内Spotify上最受欢迎的歌曲《Apna Bana Le》,以及在YouTube上播放量超过15亿次的印度经典电影音乐《Kala Chashma》。3月14日,即曲库在Spotify上的最后一天,印度每日前200歌曲中有20多首都是Zee的,足见其市场影响。

    所以,Zee下架Spotify后,也令众多印度网友在社交平台表达不满,还有网友表示要取消Spotify订阅,转向Apple Music。

    不到一个星期,就出现3起不同互联网平台关于音乐授权的谈判失败,这绝不是偶然。

    从去年下半年,就有音乐公司与平台的音乐授权陆续到期,并进入续约的谈判中,自此,“下架”、“告上法庭”的新闻就纷至沓来。 而如果把视野拉长,三大唱片公司今年其实也陷入了谈判不利的风波中。

    今年年初,TikTok在澳大利亚测试禁用三大唱片的音乐对平台用户活跃度的影响,以期在与三大唱片的新谈判中获得更多话语权;还有TikTok的竞品Triller也因未付授权费用被环球音乐和索尼音乐告上法庭,并且在几个月前下架了独立音乐版权代理巨头Merlin的音乐。

    不仅如此,几个月前,在印度本土最大音乐流媒体Gaana变成仅面向付费用户的平台前不久,Zee也和Gaana没有再续约,而是下架了自己的音乐。

    零零碎碎的续约失败新闻或许说明不了什么,但看到一周连续发生三起续约纠纷后,SoundCloud战略经理David Turner直言, “看这经济形势,我敢打赌,很快就会有更多音乐授权谈判失败的情况”。

    02 今年续约为何这么难? David Turner言下之意,今年版权授权许可频频“谈不拢”,主要原因还是互联网平台们没钱了。

    就以本月的新闻主角们来说,Meta已经在本月宣布了新一轮裁员计划,预计裁员1万人;加上去年11月的裁员,Meta在这半年裁员超过2万人。扎克伯格还将2023年称为“效率年”,音乐授权大概也在“增效”之列。

    再看Twitter,由于马斯克公开的激进言论等因素,自10月接手Twitter后,Twitter的广告收入就暴跌。据路透社报道,去年11月,Twitter上的广告支出同比下降55%,12月同比下降71%,当月收入和调整后利润同比下降约40%。加上当时马斯克为了收购Twitter而借贷的130亿美元也由现在的Twitter承担,每年需要支付的利息都超过10亿美元。看这个形势,音乐授权的谈判很可能暂无下文了。

    与此同时,音乐授权又是一笔不小的开销。 据《纽约时报》报道,虽然社交媒体的音乐授权许可费用各有不同,但对于比较大的社交媒体平台,每年授权许可费用可轻松超过1亿美元。

    在如今经济重压之下,那么也不难理解捉襟见肘的平台们为何失去合作诚意了。

    一个不得不承认的事实是,从利用率角度来看,有些曲库对于平台而言,可能被使用不多但授权费用也能高达千万美元,这使得平台在没钱的时候会第一时间想到这些不活跃的曲库。

    以Triller为例,连年亏损的Triller从去年年末就开始缩减音乐授权支出,率先下架了Merlin的曲库,给出的理由就是Merlin的音乐以摇滚或舞曲为主,在平台使用率不高。不过,虽然环球音乐和华纳音乐的曲库占到平台所使用流行乐的65%以上,Triller不打算下架,但也不太想给钱,一方面想要把付费方式从买断改为分成,另一方面拖延付款,逼得索尼音乐和环球音乐都先后将其告上法庭。

    据MBW报道, 2022年,全球音乐流媒体服务平台上总共有1.58亿首曲目,其中42%,即6710万首曲目播放量小于等于10次;24%的歌曲,即3800万首曲目完全没有被播放过。 与此同时,Spotify托管这些歌曲的云服务费用却可达到9位数,相当于托管费用中接近一半都打了水漂,还听不见响。

    如果在平台播放量比例太低,跌破安全线,那么拥有这些曲库的唱片公司势必会谈判中落入下风,其结果要么只能接受平台的低价,要么就只能被删除。

    反之,如果曲库播放量占比大,则可获得议价权,比如虽然Meta只给SIAE一口价,又在去年年末因为白嫖Epidemic Sound的曲库拒绝签约而被后者告上法庭,但对于环球音乐和华纳音乐的新续约,Meta甚至同意了唱片公司新提出的广告收入分成模式,让唱片公司们增收。

    还有一种可能是,撕破脸只是谈判的策略之一。由于平台近来“降本增效”,在谈判中能够展示的诚意必定有限,双方难以达成一致也很正常,但这未必就是最后的结果。即便是唱片公司的音乐已下架,只要双方有心找到一个平衡点,达成协议,音乐还可以随时上架。

    Kobalt代理艺人:棉花糖Marshmello 比如,去年下半年Kobalt也曾与Meta未能达成新协议,让Kobalt从Facebook和Instagram上下架了自己的70万首曲目。据《Variety》介绍,作为全球排名前五的发行商之一,Kobalt的季度播放量份额有时甚至高于三大唱片公司。

    据Kobalt自己估计,在英美每周前100的曲目和专辑中,超过40%都由Kobalt代理。可以说,对于平台而言,Kobalt绝不是可有可无的角色。果不其然,两个月后,Kobalt又与Meta达成协议,成功续签。

    至于Spotify,和Zee Music“分手”也绝不是其乐见的结果。虽然Spotify也在“降本增效”,但Zee Music绝不会是其想要“分手”的对象。

    Spotify印度总经理Amarjit Batra曾在采访中表示,印度现在是Spotify的主要市场之一,且不同于2019年在印度推出时70%的播放量都来自于国际音乐,如今Spotify印度70%的播放量都来自于本土音乐。所以,Spotify在采访中也表示希望尽快找到双方都接受的方案。

    总体而言,音乐市场此前对动荡的国际局势和金融环境并不敏感,反而是社交媒体平台受到宏观环境影响更大。这让原本被音乐公司视为新增长点的社交媒体平台们如今有给音乐公司添堵之势。

    但只要谈判双方有心,谈判的破裂可以只是暂时的。毕竟生意场上,没有永远的朋友,也没有永远的敌人,只有永远的利益。但几乎可以肯定的是,今年的音乐授权续约可能会更多波折,音乐公司的利益也势必或多或少会受到平台低谷的消极影响。

    作者: 万翛;编辑:范志辉

    来源公众号:音乐先声(ID:nakedmusic),解读音乐产业,见证黄金时代。

    本文由人人都是产品经理合作媒体 @音乐先声 授权发布,未经许可,禁止转载。

    题图来自Unsplash,基于 CC0 协议。

    该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

    给作者打赏,鼓励TA抓紧创作!

    {{{path> 赞赏

  • Stable Diffusion自学必看!6款适合小白的零基础免费入门教程

    UI交互 2023-03-29
    大家好,这里是和你们一起探索 AI 绘画的花生~最近优设为大家推荐了不少有关 Midjourney 的教程和资源,不知道大家有没有用起来?除了 Midjourney 之外,另一款大家经常听说的 AI 绘画工具应该就是 Stable Diffusion 了,那你了解它们之间的差别吗?今天我就结合自己的自学经验,为大...

    大家好,这里是和你们一起探索 AI 绘画的花生~

    最近优设为大家推荐了不少有关 Midjourney 的教程和资源,不知道大家有没有用起来?除了 Midjourney 之外,另一款大家经常听说的 AI 绘画工具应该就是 Stable Diffusion 了,那你了解它们之间的差别吗?今天我就结合自己的自学经验,为大家比较一下两款 AI 绘画工具软件的优缺点,并推荐 6 款适合零基础小伙伴的 Stable Diffusion 免费自学入门教程,帮助大家更好的理解和使用不同的 AI 绘画工具。

    Midjourney 入门及进阶教程:

    超详细!AI 绘画神器 Midjourney 基础使用手册 一、前提条件 需要魔法: 新用户可免费创作 25 张图片,超过需要办会员 版权问题:会员生成的图片版权归创作者所有 Midjourney相关资讯: 二、注册/链接 服务器 温馨提示:下方多图预警 1. 注册、创建服务器 ① 打开Midjourney官网,右下角选择"J

    阅读文章 >

    AI绘画进阶必看!9种 Midjourney 常用后缀参数 大家好,这里是和你们聊设计的花生~ 最近 AI 绘画真的越来越火了啦,开始有越来越多的设计师将 Midjourney 用到自己的设计工作流中,让它们生成各种设计灵感或素材。

    阅读文章 >

    一、Stable Diffusion 的特点 与 Midjourney 相比,Stable Diffusion(以下简称 SD)的优点有:

    ① 免费开源

    Midjourney 需要开魔法使用,免费额度用完之后付费才能继续,最低 10 美元/月。而 SD 在 B 站上有大神整理好的整合安装包,不用魔法,免费下载一键安装。 安装到本地的 SD 随开随用,生成的图片只有自己能看到,保密性更强。

    ② 拥有强大的外接模型

    由于开源属性,SD 有很多免费高质量的外接预训练模型(fine-tune)和插件,比如可以提取物体轮廓、人体姿势骨架、画面深度信息、进行语义分割的插件 Controlnet,使用它可以让我们在绘画过程中精准控制人物的动作姿势、手势和画面构图等细节;插件 Mov2Mov 可以将真人视频进行风格化转换;SD 还拥有 Inpainting 和 Outpainting 功能,可以对图像进行智能局部修改和外延,这些都是目前 Midjourney 无法做到的。

    推特网友@Toyxyz3 通过分别渲染手部网格深度和开放姿势骨骼的方式,在 SD 内实现对人物手指和姿势的精准控制。图片来源: https://twitter.com/toyxyz3/status/1629620938894643200/photo/1

    推特网友 @Claude 利用带有 controlnet 和 mov2mov 功能的 SD webUI,将真人视频转换为动画风格。图片来源: https://twitter.com/Claude2021/status/1634952496606236672

    ③ 训练自己的模型

    我们可以用 SD LORA 或者 Dreambooth 将自己喜欢的人物形象或者画风训练生成模型,打造自己的专属 AI 绘画工具,也有画师和 设计师 用自己的原创作品训练模型,之后有灵感了就之后用文字描述出来,让 SD 帮自己快速出各种概念草图。

    利用吴仓石 、郑板桥、八大山人、任颐等大师作品+现代人物训练而成的水墨风 SD LORA 模型—— 墨心 Moxin,图片来源: 墨心 MoXin | Stable Diffusion LORA | Civitai

    与 Midjourney 相比,Stable Diffusion 的缺点有:

    对电脑配置有要求

    在本地用 SD 生成图像和训练模型都需要显卡做支撑,所以 SD 对电脑显卡有要求。最好是 Nvidia 的显卡(N 卡),显存至少 4G,不然图像的生成速度非常非常非常慢(不是夸张),也容易出现报错或系统崩溃。如果你想自己训练模型,最好用高配置的台式机,显卡选 40 系列及以上,显存最低 12G,CPU 选 Intel i7 或者以上,内存越大越好。

    检查电脑显存的方法(windows):

    鼠标放在工具栏,单击右键打开“任务管理器”,选择顶部的“性能”,进入后下拉查看 GPU 的部分,找到“专用 GPU 内存”,下面对应的数字就是电脑的显存。下图显示的电脑显存是 2G,生成一张最低配置的 512*512px 的图像需要 8 分钟,而 32G 显存的生成速度只需几秒,所以显存低的电脑不适合运行 Stable Diffusion。

    需要较大的硬盘空间

    因为 SD 所有文件都是安装在本地电脑上,而且生成不同的风格图像需要下载不同的模型,一个大模型至少 2G,假设你想要尝试 10 种风格,那 10 个大模型可能就要 30G 的空间。一般要求装 SD 的那个盘要有 100G 的剩余空间,最低不小于 40G,且最好不要安装在 C 盘。

    想要生成好看的小姐姐图像,就需要下载文件接近 4 个 G 的 Chilloutmix 大模型,图片来源: ChilloutMix | Stable Diffusion Checkpoint | Civitai

    入门学习难度更高

    SD WebUI 的各种参数比 Midjourney 要复杂,而且很多功能都需要通过额外安装插件和模型来实现,因此我们需要了解各种参数的含义,不同的模型插件的使用方法,可能还需要了解背后的原理知识,因此入门学习的难度比 Midjourney 高。

    一个功能配置较完整的 SD webUI 汉化操作界面。

    高质量风格有局限性,不够灵活

    SD 目前的高质量的图像生成模型多集中在真人、游戏和二次元插画方面, 而且换一个风格就需要下载一种模型;而 Midjourney V5 可以仅通过文本提示词就快速生成各种类型和风格的高质量图像。

    看完上面的内容,想必大家对 Stable Diffusion 适合的使用场景、自己的电脑能否撑起 Stable Diffusion 已经有基本了解。下面为大家推荐 6 个 B 站上的高质量免费 Stable Diffusion 入门教程,包括如何下载 SD 整合安装包,了解 SD 的操作界面和各种参数,不同模型插件的安装和使用以及训练自己的 lora 模型等,教程内容全面、讲解细致,即使是零基础的小伙伴也能无障碍入门 ~

    二、整合安装包,解压即用 秋葉一键安装包: 「AI 绘画」Stable Diffusion 最终版 无需额外下载安装!

    SD 启动器: 「AI 绘画」启动器正式发布!一键启动/修复/更新/模型下载管理全支持!

    秋葉 aaaki-B 站主页: https://space.bilibili.com/12566101?spm_id_from=333.337.0.0

    首先向大家推荐自然是在 AI 绘画届拥有“赛博佛祖”aaaki 称号的秋葉大佬,他发布的 SD 整合安装包解决了之前需要进行环境配置的问题,真正做到“一键安装”。我目前用的就是这个整合包,安装过程顺利到自己都有点不敢相信。安装包下载链接在视频的简介里有说明,跟着 Up 的视频进行操作就与可以了。

    B 站另一位大佬@独立研究员-星空也推出了整合包,同样是解压即用,特点在于他会根据 SD 微调模型的发展状况进行安装包更新,目前发布的最新版本已经整合了 Controlnet 和像素化插件,下载后无需再自己再去一个个安装,更加便捷。大家可以先下载安装包,然后看一下合集里的更新介绍,就能明白安装包的用法了。

    星空一键安装包: AI 绘画 「Stable Diffusion」整合包使用 1 基本功能使用

    星空-B 站主页: https://space.bilibili.com

    大佬们分享的整合安装包帮我们解决了 Stable Diffusion 的安装问题,接下来要解决的就是如何使用的问题了。

    三、零基础手把手教程 链接直达: 喂饭级的 stable diffusion 教程!让每个人都能轻松学会 AI 绘画!

    如果你不理解如何安装和使用秋葉大佬的安装包,那么推荐你看 B 站的 UP 主 @靠谱的轩轩,他的《Stable Diffusion 喂饭级教程》目前已经更新了 11 集,从 SD 怎么安装、需要什么配置、操作界面上的各个按钮是概念解释到各种模型插件使用方法都有详细介绍,适合对 AI 绘画完全没有了解的小伙伴。

    四、绘画过程教学 链接直达: AI 绘画基础-01Stable Diffusion 零基础入门

    推荐零基础小伙伴看的另一个教程是 UP 主 @my3d 的《AI 绘画基础 》,他会分享 AI 绘画的详细过程,并借此讲解提示词、参数、模型插件等知识。UP 主本身是一位大学老师,讲得很详细但是节奏比较慢,质量还是非常不错,适合喜欢慢慢理解学习的小伙伴。

    五、快速入门教学 如果你觉得上面的教程进度太慢,想要快速学会怎么用 SD 生成好看的图像及训练自己的模型,可以看 YouTube 大神 @Kas Kuo Lab 的 SD LORA 模型训练教程,和 B 站大神 @StarPorridge 小粥 的 SD 入门和进阶教程。这两门教程信息密度很高,可以快速学会界面操作、用 Controlnet 控制人物姿势、安装使用模型以及自己训练 LORA 模型。

    Kas Kuo Lab 教程 YouTube 链接: Kas Kuo Lab (需要魔法)

    Kas Kuo Lab 教程 B 站搬运链接: Stable Diffusion 功能與介面

    小粥的 SD 基础入门教程: AI 手把手教学

    小粥的 SD 进阶教程: 你真的会用 AI 么?关于 AI 的 prompt,一定要学会!

    以上就是本期为大家推荐的 Stable Diffusion 零基础免费自学教程,希望对想学 AI 绘画的小伙伴帮助。喜欢本期推荐的话还请多多点赞收藏,之后会继续为大家推荐更多实用的 Midjourney、Stable Diffusion 等 AI 绘画相关资源。

    推荐阅读:

    AIGC神器 Midjourney V5 强势更新!逼真到令人发指! 大家好,这里是和你们一起探索 AI 绘画的花生~ 备受期待的 Midjourney V5 在上周四终于上线了,而且一发布就引起了不小的轰动,因此这次 V5 模型的图像生成效果“太惊人了”,无限逼近真实照片,让人难辨真假。

    阅读文章 >

    比 AI 帮个忙更好用!这 5 款神器让你效率暴涨200% 大家好,这里是继续为你们推荐 AI 效率神器的花生~ 自 ChatGPT 公布后,各种基于其 API 开发的应用就像雨后春笋般迅速出现,之前「优设 9 图」为大家介绍的“AI 帮个忙”就是其中之一。

    阅读文章 >

    提高3倍效率!能落地的AI绘画&设计系统课来了! 如何快速入门AI绘画和AI设计?

    阅读文章 >

  • 如何组织一场线上敏捷共创工作坊?来看大厂的总结(筹备篇)

    UI交互 2023-03-29
    线上敏捷共创类似于戏剧影视化的创新,即实现了观看戏剧从线下剧场到线上屏幕的创新,看似是共创载体/场域的改变,但其转变背后所需的筹划组织和注意事项是非常复杂的,否则可能会导致线上敏捷共创只是“走形式”。具体来说,线上敏捷共创有筹备/执行/离场三个阶段。筹备阶段,组织者作为编剧,构思包含主题/人物/背景的故事概要,主...

    线上敏捷共创类似于戏剧影视化的创新,即实现了观看戏剧从线下剧场到线上屏幕的创新,看似是共创载体/场域的改变,但其转变背后所需的筹划组织和注意事项是非常复杂的,否则可能会导致线上敏捷共创只是“走形式”。具体来说,线上敏捷共创有筹备/执行/离场三个阶段。

    筹备阶段,组织者作为编剧,构思包含主题/人物/背景的故事概要,主要任务是线上敏捷共创的前期准备与组织; 执行阶段,组织者作为导演,在舞台上交代戏剧情节,主要任务是线上敏捷共创流程的设置与执行,产出共创成果; 离场阶段,组织者作为后期,剪辑与上映戏剧,主要任务是作为协同者/赋能者通力合作,推进已经达成共识的共创成果。

    相比于线下,线上敏捷共创最需要调整和注意的是筹备阶段,尤其是线上场域的设置、成员构成与组织,因此本文将介绍如何进行线上敏捷共创的前期准备。

    更多 工作坊 教程:

    比设计冲刺还敏捷!如何高效组织一场共创工作坊 众所周知,设计冲刺(Design Sprint)是一项需要集合多角色、经历五天的共创工作坊,目的在于帮助产品团队快速了解用户痛点需求,快速找到切入点及相应产品方案。

    阅读文章 >

    一、目标共识,确定主题:上下同欲者胜,同舟共济者赢 线上敏捷共创工作坊通常由需求方找用研解决问题开始,敏捷共创只是用研帮助业务解决问题的一种手段,只有在同时满足下列情况下用研组织的敏捷共创工作坊才能尽其所长。

    用研组织线上敏捷共创的适用场景

    任务是备受关注的,敏捷共创投入的时间和人员成本高,对需求方很有意义才值得发起; 答案是悬而未决的,解决办法是未知的,需要集思广益/共同创造,如创新的方案; 挑战是力所不及的,面临的困难多,需要群策群力,甚至需要多个角色/部门联动解决; 共识是必不可少的,需要对解决方案达成高品质的共识与承诺,后续才能真正的落实; 用研能有所输入的,进行过用户调研,有能在共创现场启发参与者共创的报告/调研发现。 线上敏捷共创目标的制定与共识

    作为共创组织者不能臆想或揣测发起人目标,敏捷共创目标只有能够反应团队的原则和愿望,才能灯塔一样指引所有人朝着同一方向,因此在开始设计流程之前要充分把脉发起人的需求,让投入的时间为我们的团队和用户带来价值。将业务所需解决的问题转换成共创的主题,达成敏捷共创工作坊目标需要注意:

    收集共创需求时多方沟通,同业务/产品/设计等相关角色进行沟通,全面了解当下业务所面临的困惑与期望,特别需要注意的是要向上沟通,才能让共创更好的服务与应用于业务战略方向和战略规化。 提炼出明确的共创主题,提炼出的主题越明确、越具体、越单一越好,另外,由于线上参与者注意力更难专注,在数量上 1-2 个主题为宜,尽量将时间控制在 2-3 小时左右,集中精力解决最重要的问题。 正式确认与共识共创主题,用研将提炼的共创主题和方案,进一步同需求方进行沟通,以确保能够解决相应的业务问题。 二、参与者:人物是故事情节的核心,让对的人来到“共创现场” 在确定线上敏捷共创目标后,用研和需求方共同确定能为共创主题贡献智慧的团队和成员,进入“共创现场”的参与者对工作坊成功与否起着至关重要的作用。相比于线下,线上敏捷共创是参与者在屏幕上互动交流,参与度和专注度更难保障,更需要慎重选择让对的人进入“共创现场”。从参与者意愿和相关性(目标达成与自己的利益越紧密相关性越高)两个角度挑选,将相关成员划分为参与者和旁听嘉宾两类,如图所示。

    参与者的选择

    高意愿高相关:有意愿参与目标的达成,而且目标达成与自己的利益是紧密相关的成员优先入选; 覆盖多元角色:共创不仅意味多元的视角,也要考虑共创落实的可能性及所需资源,因此参与者需要覆盖各相关职能和角色; 乐于分享想法:优先选择比较活跃的/有想法/愿意表达的成员,如果用研不确定/不熟悉可以由相应团队推荐与建议。 参与者的分组

    控制在 4 组及以下,组数越多共创需要投入的时间/人力也越多 每组 5-6 人,如果每组人数过多,易出现责任分散,导致部分成员不参与讨论 每组包括不同岗位职能(产品/设计/业务)的角色,以保证每组角色的多元化 为了营造更“平等”的共创氛围,避免“一言堂”,如有“高位”人员参与可单独分组 对具有参与意愿低/相关性较低/无法全程参与/高职级老板等特征的相关成员,将其划分进旁听嘉宾组,并建立独立的线上会议,具体原因及操作方法详见本文“线上场域”部分。

    三、组织者:各司其职,解锁“场务小助手”新角色 线上敏捷共创工作坊的组织者通常由用研团队的小伙伴分工与配合,一方面是能更好的从用户视角向参与者输入相关信息,另一方面,用研小伙伴经过培训与实践对共创工具和流程比较熟悉,彼此之间的配合也更加默契和顺畅。

    相比于线下,线上敏捷共创组织者之间通过线上语音交流与协作,不如线下共创现场顺畅、便利,组织者不仅要负责各自任务,同时还要操作线上共创的工具,面临的任务多且难度大,如果分工不清可能会导致某个环节没人负责或者同时开麦等导致现场混乱的情况。基于过往的经历发现,在组织线上敏捷共创工作坊时,每个组织者在一场共创工作坊中尽量仅承担一个角色,职责分工要非常清晰,做到各司其职。

    相比于线下,线上敏捷共创的组织者角色,不仅是各个角色的核心任务发生了变化,还解锁了新的组织者角色“场务小助手”。

    串场主持人:主持线上共创的全流程,面向所有的参与者,负责共创目标的达成、现场秩序进程、现场的氛围。 小组引导员:共创通常分组讨论,每组需要 1 名小组引导员,负责小组内共创目标的达成、时间把控、维持现场执行和氛围等 调研输入者:线上敏捷共创时长较短,需要高效输入用户调研的核心发现,而非详实的用户故事,如果参与者听过相关的用研报告甚至可以省略该部分。 场务小助手:线上敏捷共创新增的、重要的组织者角色,线上共创通过操作电脑和软件来完成的,特别需要一名对工具熟练的场务小助手“幕后操作”和“现场答疑”,以配合主持人节奏,解答参与者遇到的操作问题。 四、线上场域:线上敏捷共创的关键道具 线上敏捷共创场域是整个团队创造的空间,所需物料和布置本质上同线下工作坊一样,即打造每个成员都可以进行“听说写看”的共享空间。

    1. 线上会议

    由于线上敏捷共创在不同环节需要分组讨论,因此在选择线上会议时,尤其要关注是否具有分组功能。另外需要考虑录制功能,避免作为后续分析与学习的材料;屏幕共享功能,分享用户调研时能呈现给参与者;权限设置功能,如串场主持人/场务小助手要有对成员分组的权限。能够同时满足以上功能的线上会议通常需要付费,如瞩目/腾讯会议/飞书等。

    由于旁听嘉宾存在不愿意参与讨论/需要中途离场等情况,为了避免共创氛围被破坏,建议单独建立线上会议,如使用内部工具 Joymeeting 会议。由场务小助手通过两台电脑设备同时进入线上共创会议(瞩目/腾讯会议室)和 Joymeeting 会议室,结合桌面共享给旁听嘉宾进行实时直播,在共创过程中鼓励旁听嘉宾发言或者文字,但需提醒他们要根据主持人的指示。

    2. 线上画布

    目前线上画布/白板基本都能满足线上敏捷共创的条件,选择时要考虑到学习成本/功能完整性/互动性三个方面,可选择 boardmix/teamind 等免费线上画布。

    认证/操作成本低:由于所有参与者和组织者都要认证/操作,尽量选择容易操作学习成本低的线上画布。 功能完整性:能满足同时使用的人数,确保所有成员能同时进行线上协作与创作;能够导入材料(如 PPT/图片等物料)和导出成果等;能适配不同系统,如 win/Mac 等。 有互动的素材:具有表情/贴纸/闹钟等小工具,可以帮助营造线上敏捷共创的氛围 以上是对线上敏捷共创工作坊前期筹备的简要梳理,如有疑问可在下方留言交流。后续将结合具体案例分享线上敏捷共创的流程设计与实施,欢迎持续关注。

    欢迎关注「京东设计中心JDC」的微信公众号:


让你的品牌快速脱颖而出,抢占市场份额,提升销量
免费获取方案及报价
*我们会尽快和您联系,请保持手机畅通