(报告出品方/作者:安信证券,焦娟、冯静静)
在虚拟数字人的整个产业链中,上游虚拟数字人的生成主要分为建模、驱动、渲染三大环节, 其中虚拟数字人的建模生成是非常核心的一个步骤,也是较为困难的一环,奠定了未来使用 的基础。目前虚拟数字人的建模生成主要有三种,按照人工参与程度的高低,依次为纯人工 建模、借助采集设备进行建模、以人工智能进行建模;同时涉及到相关的软硬件,包括建模 软件、驱动软件、渲染引擎、拍摄采集设备、光学器件、显示设备等。因此,虚拟数字人的 上游投入集中在专业人才与相关的软硬件件成本。
1.1. 纯人工建模方式——成本高、产能低
纯人工建模方式早就存在,虚拟数字人这一概念也不是这两年才有,而是可以追溯到 20 世 纪 80 年代,人们开始尝试将虚拟人物引入到现实商业世界中,此时的虚拟数字人的制作以 手工绘制为主。到 21 世纪初,CG、动作捕捉等计算机技术进步,建模师借助相关工具软件 进行制作虚拟人,大部分的成本仍然是人工成本。
纯人工建模的具体步骤为:1)运用电脑软件画设计稿,描绘建构出人物的三视图;2)根据 设计图纸确定人物三维的图形,运用 MAYA、3DMax、Zbrush 等三维建模软件建立基本的 三维模型;3)除了建模师,虚拟人的运营需要团队的协作,虚拟人制作的其他环节还涉及到贴图师、绑定师、动画师、道具师、三维场景设计师等。
目前纯人工建模方式仍在广泛使用,市场上一些超写实的虚拟人或者明星的虚拟人,均可以 基于这种建模方式做出来,但人工制作周期较长,且成本非常高,源于该种建模方式的成本 主要跟人力相关,一是取决于制作团队的配臵大小,二是取决于建模的精度要求,虚拟人越 逼真、越精细,所需的建模时间与成本就会越高。虚拟数字人相关制作人员的平均薪资水平 在 2021 年涨幅明显,随着元宇宙热度的升温而一路走高,目前建模师、绑定师、动画师、 道具师、三维场景设计师的月平均薪资水平分别为 10-15k、10-30k、10-20k、8-15k、15-30k。
以虚拟数字人“邓丽君”为例,数字王国从 2014 年开始打造 1.0 版本的虚拟邓丽君,当时 的技术难点主要在于没有足够的资料来参考,复刻已故明星的虚拟形象,基本上意味着从零 开始打造。虚拟邓丽君基本上是通过人工建模方式做出来的,在当时技术条件还不成熟的情 况下,制作团队参照了大量的邓丽君的过往照片、音频、视频,耗费了约一年半时间打造出 虚拟邓丽君的面容、姿态与神韵。再比如影视特效公司运用 CG 等技术还原已去世的保罗在 《速度与激情 7》中的演绎,相关建模、渲染成本增加了约 5000 万美元。
目前超写实虚拟人的制作技术已有了突飞猛进的发展,制作一个类似虚拟邓丽君同样水准的 虚拟人只需要几个月,但成本依旧较为高昂,产能低。虚拟邓丽君这种属于影视级别的建模, 可以将其定义为影视级、超写实、高精度,应用场景有限,主要服务于特别的领域,比如舞 台级别领域,且影视级别的虚拟人无法在普通的电脑端直接进行驱动,需要动用众多相关电 脑,甚至其渲染都需要一个网络来进行,比如现在有些地方建有渲染农场,在服务器空闲的 时候进行渲染。
影视级别虚拟数字人的前期建模成本为几百万到千万元,且不包括后续的驱动、渲染等。制 作周期取决于团队规模的大小,一般来说,预计一个 20 人的团队需要耗费约半年的时间。 所以,从团队配臵与制作周期来看,影视级虚拟人制作成本高的原因在于建模师、动画师等 相关人员的工资待遇比较高。
1.2. 借助采集设备进行建模——成本适中、应用广泛
现今虚拟数字人的制作时间与成本已大幅降低,但影视级的虚拟数字人对于众多品牌方来说 仍然太贵,目前市场上大多数的虚拟数字人是成本相对低的卡通画风形象,各类游戏中的游 戏角色其实是早期的虚拟人,可以被称为次时代游戏级别。不同于影视级别,次时代游戏级 别的虚拟人的渲染在电脑端/手机端就可以完成,为考虑到用户的硬件运算能力,次时代游戏 级别的虚拟人仍与超写实虚拟人在细节上有一定差距,即牺牲了一定的精细度,保证了画面 的实时渲染。
除了前述的通过传统纯人工方式建模之外,目前次世代游戏级别虚拟人的建模大多是借助于 外部扫描设备采集模型数据,数据的输入方式大致分为两种:
相机阵列扫描:使用上百台相机进行 360 度的环绕拍摄,构建三维模型,基于模型进行 数据的处理,然后转化成可以编辑的格式,再去进行相关的贴图、绑定、动画等操作。 相机矩阵输入方式的优点在于制作周期短、节省人力,可满足大多数虚拟人的建模需求, 是当前虚拟人建模的主流方式;但缺点在于不能从底层模型去大幅度修改参数;
结构光扫描:利用三维扫描仪对人体、外部环境等进行扫描,建立点云数据(point cloud data),扫描精度越高,得到的点云数据越多,制作出的模型就越精细。相较前一种的 相机矩阵扫描,结构光扫描是一种比较经济的扫描方案;但缺点在于扫描时间长, 难以满足运动类目标的重建需求。
与从零打造一个虚拟数字人相比,在有外部采集设备助力的情况下,虚拟数字人的建模成本 就会低很多。该种建模方式的成本主要为设备与人员成本,在几十万至一两百万元不等, 可以应用于游戏、电影(不需要超写实、高精度)等领域。若模型的精细程度越高,则 需要渲染的单元越多,成本就越高。
1.3. 利用人工智能进行建模——成本低、技术有待提高
第三种是通过人工智能的方式来建模,依据的是算法与机器学习。机器能够自动生成虚拟数 字人的前提是要获取足够多的数据,对大量的照片/视频进行分析,提取到人的各种数据与信 息,然后去模拟出没有提取到的那部分数据,比如鼻子的高度,这不仅依靠算法公式,背后还要基于机器学习,建立在机器对大量人脸照片/视频学习的基础之上,样本越多,算法生成 出来的模型就越精准。
人工智能建模的优势在于能够大幅降低成本。依靠前述两种建模方式,做一个次世代游戏级 别的虚拟人至少需要几十万元以上的成本,还不包括后续的渲染、驱动等成本。但是通过人 工智能技术进行建模,人力成本与时间成本都将降到最低。以前团队需要耗费数个月的时间 进行建模,而人工智能可以在很短的时间内快速生成虚拟数字人,建模的过程无需人工,后 期修缮环节需要人工参与,进而将建模成本控制在极低的范围。
人工智能建模的难点在于关键技术的突破。人工智能生成与驱动的虚拟数字人所呈现的效果 受到语音识别、自然语言处理、语音合成、语音驱动面部动画等技术的共同影响。目前人工 智能建模还远不能完全取代纯人工建模与借助采集设备进行建模的结果,尤其是超写实、影 视级别的虚拟数字人,人工智能技术还不能完美的生成与驱动,算法过于复杂。即使突破了 静态下高仿真的瓶颈,如何让数字虚拟人自然地交互,也是一大难题。人类可以从表情、肢 体中读取丰富的非语言信息,因此数字虚拟人的表情、动作中一些细微的不自然都能被人们 所察觉到。人工智能建模结果就像 Siri 等虚拟助理对话一样,存在一些差距,但仍在不断改 进之中。
综上所述,目前市场上主流的虚拟数字人建模方式包括纯人工、借助采集设备与人工智能这 三种,不同方式所适用的场景与所需的技术存在非常大的差异。由于人工智能建模方式依赖 于长时间的机器学习以及技术的成熟度,因此当前制作虚拟人的方式仍然较为传统,国内虚 拟人公司大多采用前两种建模方式,建模人员可以很好地把握虚拟数字人的精细度,尤其是 超写实虚拟人的建模要求不仅是外形相似,动作行为神态等后续驱动也是非常重要的环节, 需要人员在后期进行大量调试工作。此外声音也构成智能化虚拟人的重要一部分,如何让机 器合成的声音更加自然、有情感,依旧是语音合成技术的较大难点,早期虚拟人如初音未来、 洛天依等的声音,背后则是由真人经过训练配音的。
以人工智能为代表的技术将决定未来虚拟数字人的高度。以上三种建模方式的参与公司可以 大致分为两类,一类为传统 CG 或图形学公司,核心技术为其“美术”能力,通常更专注于 后期技术;另一类以人工智能技术公司为代表,凭借技术进入虚拟数字人领域,大多专注于 自动化生成。目前虚拟数字人的制作公司仍以第一类公司为主,发展至今虚拟数字人的制作 成本高昂,尤其是 3D 虚拟数字人的制作成本高达百万元,局限于 B 端应用,这一定程度上 制约了行业的大规模应用与发展。未来虚拟数字人的发展方向在于其能够应用于广阔的 C 端 领域,比如每个人均能拥有自己的虚拟人。因此,未来想要实现批量化生产虚拟数字人,重 要前提是大幅降低制作门槛与成本,而人工智能技术是推动虚拟数字人规模化应用的重要基 础。
2.1. 国内外虚拟人商业化存在差异
欧美日韩的虚拟数字人产业发展得相对较快,着力打造身份型虚拟数字人,一是重点打造虚 拟 IP,擅长做虚拟人的 IP 化运营;二是针对 C 端社交领域开发数字化身 Avatar,一些用于 生成虚拟数字人的工具化平台已经出现,可以快速生成自己的虚拟形象。虚拟数字人在 C 端 市场的商业价值在于其具备强大的规模化能力,未来元宇宙中虚拟化身/分身的需求有待释放。 而现阶段国内主要是在具体的服务端发力——服务型虚拟数字人,比如虚拟客服、虚拟 导购、虚拟讲解员等,在实际能够变现的场景运用的比较多,在打造虚拟 IP 方面的探索 相对不足。
身份型虚拟数字人与服务型虚拟数字人有着不同的商业模式,各有优势。
从变现能力的角度看,身份型虚拟人的变现能力更强。身份型虚拟人的商业模式类似于 真人明星,通过品牌推广或代言、参演节目、直播打赏、发布音乐专辑、售卖周边等方 式,依托粉丝经济进行变现,其特点是能带来较高的收入增量,如 Lil Miquela、初音未 来;而诸如客服、直播带货等应用场景下的服务型虚拟人,其主要经济效益不在于直接 创造增量收入,而是在于降低人力成本。虽然服务型虚拟人创造的经济效益较小,但服 务型虚拟人的内核是人工智能,是元宇宙的基础构成要素,长期来看有非常可观的 B 端 市场空间。
从数字资产的角度看,国外是真正的将虚拟人当作数字资产在进行运营,但是国内很多 的服务型虚拟人的应用,不是将虚拟人当作一项数字资产,而是当作一项成本进行投入, 更多是对现有行业的赋能,在短期内实现降低成本与提高运作效率。
总结来看,身份型虚拟数字人与服务型虚拟人的底层商业逻辑存在非常大的差异,甚至底层 技术路径也不同。海外企业对虚拟人的技术路径的实现、应用场景的要求更高,对收入看得 更长期;而国内虚拟人的发展更着眼于当下的运营效率的提高,商业化场景较为单薄,变现 方式大多局限于直播电商等短期流量红利中,或者智能导购、客服等行业,进一步拓展价值 空间很难,导致这个赛道的天花板偏低。
导致国内外虚拟数字人市场存在差异的原因,我们预计是技术发展阶段、用户规模等方面的 不同。
1) 运营层面,欧美具备较强的 IP 运营能力。一个成功的虚拟数字人的塑造,不仅是其形 象具备真实感,最重要的是其人格具备真实感,而虚拟数字人的人格化塑造的过程就是 IP 化的过程。与国外成熟的 IP 运营体系相比,国内文娱公司虽然已经有了 IP 构建意识, 但是 IP 持续更新与运营能力不足。纵观美国娱乐影视行业的发展历程,IP 始终是好莱 坞的核心,并通过 IP 延伸出强大的多元化产业链条,比如迪士尼。
2) 技术层面,欧美公司虚拟数字人制作水平高且分工明确。好莱坞 IP 运营的历史与好莱 坞电影工业发展是一脉相承的,即工业的发展水平与盈利状况影响着 IP 运营的水平与 效果,虚拟数字人行业的发展亦是如此。一方面,欧美基于生产技术优势,已经有一些 用于快速生成虚拟数字人的工具化平台出现(如 Omniverse Avatar、MetaHuman Creator),且有较多面向 C 端的产品。另一方面,欧美虚拟数字人行业的上中下游分界 明显,一体化程度低,专精某一技术发展,对非核心技术采取外包合作;而国内有较多公司采用产业链一体化的形式进行虚拟数字人制作。
3) 用户层面,国内的优势在于庞大的用户规模,存在各细分领域的需求。基于人口基数优 势,国内产业在众多细分方向上均较容易形成规模效应,虽然国内外存在一定的技术落 差,但虚拟数字人在国内有多元化可探索的空间。因此,国内企业更注重于服务型虚拟 数字人的开发,以定制为主,根据用户需求进行特定设计,这一选择有助于规避不同行 业的技术差异。
2.2. 国内外虚拟数字人应用案例
基于影视特效行业的多年沉淀,虚拟数字人在制作端已经形成了一套较为完备的工业化制作 流程,即虚拟数字人的制作生产已不是难题,问题在于运营端,对虚拟人的运营更多是如何 变现。不同类型、不同应用场景的虚拟数字人,其作用与所产生的价值不同,背后的技术路 径也不同。现阶段已实现商业化的虚拟数字人主要以虚拟偶像、虚拟主播、虚拟客服等为主, 涵盖文娱产业、直播带货、品牌营销及其他 B 端应用场景:
虚拟偶像 AYAYI、Lil Miquela、Imma 等以图片形式为主,制作主要通过建模及美工;
虚拟美妆达人柳夜熙则从静态图片升级为动态视频,其运营逻辑类似于网红、KOL 领袖, 单个发布作品的制作周期相比图片更长,技术以传统动画影视制作方式为主;
金融、文旅、销售等行业的虚拟客服则开始有了人工智能的加持。
因此对于虚拟数字人公司来说,在制作虚拟数字人之前,需要思考虚拟数字人的“人设”定 位及运营逻辑。不同的运营逻辑将带来不同的效用价值,要大致规划好未来的变现路径。就 像明星有“人设”一样,虚拟数字人也有“人设”,进而对应不同领域的应用。做一个虚拟 数字人的门槛有限,制作出来的虚拟形象如何被更多人喜欢与接受,如何打造人设、做什么, 才更重要。(报告来源:未来智库)
2.2.1. 虚拟偶像:IP 运营为核心,商业价值弹性大
从虚拟数字人的发展现状来看,相对于服务型虚拟人,变现能力更强的是身份型虚拟人,尤 其是美国,在应用方面重点打造虚拟 IP,日韩也主要落地在文娱领域,擅长打造二次元与娱 乐偶像。国内虚拟人市场关注度比较高的也是虚拟偶像这一细分市场,对标初音未来的洛天 依在国内推出后,带动虚拟偶像产业突破亚文化圈,成为了文娱领域中的新现象,但是发展 相对滞后于国外。
与真人明星类似,虚拟偶像打造的核心在于 IP 的运营、人格化的培养,通过发布音乐作品、 参加节目、产出内容来增加曝光度,积累一定的粉丝数量后再通过演唱会、广告代言、周边 衍生、直播等路径进行变现。但源于国内虚拟偶像的发展起步较晚、技术不成熟、IP 运营较弱等因素,虚拟偶像的商业变现始终是个难题。国外成熟的虚拟偶像拉开了品牌营销的先河, 如美国的 Lil Miquela、日本的 Imma 是各大时尚品牌与奢侈品品牌的合作宠儿,商业化路径 走得比较成功的案例;国内也诞生了洛天依、翎 Ling、A-SOUL、柳夜熙、AYAYI 等虚拟偶 像。
虚拟偶像案例一:Lil Miquela
Lil Miquela 是国内外认知度最高的超写实虚拟人之一,被打造为一位 20 岁生活在洛杉矶的 西班牙裔巴西混血女孩,模特兼歌手。2016 年起,Lil Miquela 背后的团队就开始通过社交 平台运营她,发布单曲、分享生活日常等,并赋予了其一定的人格化。Lil Miquela 的虚拟形 象让人真假难辨,大多数人一开始没有意识到 Lil Miquela 是并非真实存在的人类,她拥有自 己的世界观、价值观,拥有其他“数字人”朋友。
Lil Miquela 背后的运营公司是位于加利福利亚的科技公司 Brud,这家致力于创造数字人世界 的媒体工作室,将机器人技术、AI 运用到了商业。Brud 对 Miquela 的运营,注重真实感。 Lil Miquela 以 Instagram 作为宣传主阵地,截至 2022 年 3 月,Lil Miquela 在 Instagram、 TikTok 上的粉丝量均超过了 300 万。Lil Miquela 的 Ins 账号以图片展示为主,发帖频率平均 为 3-5 天,发帖内容为分享生活日常,包括家居生活、品牌活动、外出旅游、朋友聚会、美 食美妆等,合作过的一线品牌与媒体包括 Chanel、Gucci、Prada、Vogue 等。
虚拟偶像案例二:A-SOUL
2020 年 11 月,乐华娱乐与字节跳动合作推出虚拟偶像女团 A-SOUL,由向晚(Ava)、贝拉 (Bella)、珈乐(Carol)、嘉然(Diana)、乃琳(Eileen)五位风格各异的成员组成,截至 目前已经推出了多支单曲。成员嘉然成为 2021 年度 B 站百大 UP 主,成员贝拉成为 B 站虚 拟主播区第一个达成万舰成就的主播,团体与肯德基、欧莱雅男士、Keep 等多个品牌进行 过合作,A-SOUL 已成为国内虚拟偶像的代表。根据招股书显示,乐华娱乐的泛娱乐业务收 入从 2020 年的 2110 万元增长至 2021 年的 3790 万元,同比增长 79.6%,主要原因是虚拟 艺人组合 A-SOUL 的商业发展产生收益,我们预计 A-SOUL 贡献了约 1700 万的增量收入, 且这一收入是与业务伙伴字节跳动分成之后的收入。
在 B 站的虚拟主播当中,“舰长数”最多的 5 位虚拟主播,全部出自 A-SOUL。在 A-SOUL 入驻之前,B 站虚拟主播大多采用 Live2D 技术,仅可活动上半身,面部表情相对僵硬,与 用户的互动交流也不足。某种意义上,国产虚拟偶像 A-SOUL 的横空出世激活了的 V 圈团体 (虚拟主播圈),3D 直播更是颠覆了原本只需“中之人”坐着直播的虚拟主播行业,给观众 带来沉浸式的观看体验。
A-SOUL 火爆与成功离不开先进技术支持与体系化运营。A-SOUL 由字节跳动提供底层技术 支持,乐华娱乐负责“中之人”、内容策划运营,乐华娱乐对于偶像打造、人设运营具备一 套非常成熟的体系:五位团员个性鲜明,运营着六个微博账号、一个 B 站账号,日常更新社 交平台动态、发布单曲、参与品牌活动、参与直播等,基本上维持着每两天发布新内容的频 率。
虚拟偶像案例三:柳夜熙
2021 年 10 月 31 日,一个会捉妖的虚拟美妆达人“柳夜熙”在抖音发布了第一条短视频作 品,短时间内引起了非常大的关注度,仅以一条短视频登上热搜,获赞量达到 300 多万,同 时涨粉数上百万。截至 2022 年 3 月 21 日,柳夜熙抖音号粉丝数 865 万,获赞总数 2578 万, 共发布 8 条短视频、2 个图片作品。
柳夜熙凭借独特的人设定位与剧情化内容实现了差异化突围。超写实虚拟人柳夜熙以独特人 设吸引用户,其人设标签为“元宇宙、国风、赛博朋克”,开启了虚拟人的微短剧模式,打 破了传统的“网红式套路”,以剧情化方式出道。根据抖音账号,截至 2022 年 3 月 15 日, 柳夜熙账号所打造的精品短剧《柳夜熙:地支迷阵》已更新到 4 集,单集时长为 3-4 分钟, 产出周期约为一个月,总播放量为 2 亿,随着剧情的推进,柳夜熙的人物内涵也越加丰满。
柳夜熙背后的制作运营公司为创壹科技,团队从 2021 年初开始策划柳夜熙项目,在经过大 约 8 个月后,虚拟人柳夜熙正式出炉。在塑造柳夜熙的过程中,公司对相关技术的流程进行 了重构,在柳夜熙之后的其他虚拟人的制作周期已缩短至 3-4 个月。
目前柳夜熙并不急于变现,团队旨在打造一个可以长期运营的 IP 矩阵。作为一家已经在影 视特效行业运作了四年的内容型公司,创壹科技的内容创作及运营优势显著,不同于市场上 其他的超写实虚拟人以图片作为主流输出方式,柳夜熙最大的特点就在于她的视频化、故事 化的呈现方式,并与真人一同参演短剧。此外,除了柳夜熙,创壹科技也在打造其他的虚拟 人,计划搭建出“元宇宙版的中国漫威”, CEO 梁子康表示“我们已经有了一个美妆赛道的 柳夜熙,接下来半年到一年中我们计划推出 5-10 个不同赛道、不同领域的不同虚拟人或数 字人”。未来,以柳夜熙为代表的虚拟人将不仅限于传统的 IP 变现方式,还可能与游戏、电 影结合,并拓展潮玩、品牌虚拟化及数字藏品等更多元素(36 氪)。
柳夜熙与初音未来、洛天依、A-SOUL 并非同一种虚拟数字人,后三者更多是二次元世界的 产物,是卡通形象;但柳夜熙则是“超写实虚拟人”,其出圈带动了超写实数字虚拟人的兴 起,随后越来越多的超写实虚拟数字人出现,我们认为类似柳夜熙这样的中高品质虚拟人将 会是未来 B 端市场的主流。但柳夜熙的背后也暴露了行业的一些问题,比如超写实也意味着 更高的技术门槛与制作成本,虽然团队有技术基础、有运营经验,但柳夜熙的制作难度并不 低,3-4 分钟短视频的制作周期约一个月之久,高昂的成本拖累了产出效率,容易错失短视 频的流量峰值运作周期。另外,不仅 IP 的打造需要一定的时间周期,真正拥有自我意识的 虚拟数字人目前仍处于研发阶段,距离商业化运营还存在一定距离。
2.2.2. 直播带货:头部虚拟主播与 AI 虚拟主播的作用不同
国外的虚拟数字人如初音未来、Lil Miquela 等早已可以通过广告、演出与代言等方式进行变 现。与国外形成鲜明对比的是,2020 年后的国内虚拟数字人则与直播带货行业结合,探索 虚拟主播带货。我们将可以带货的虚拟主播分为两大类,一类是头部的或特定领域的 KOL 虚拟主播,另一类是 AI 虚拟主播,两者所起到的作用不同。
部的或特定领域的 KOL 虚拟主播:作用与真人 KOL 类似。虚拟偶像进行带货,这也是其 实现商业价值最直观有效的方式。当然虚拟主播特征也要符合品牌调性,人设越鲜明、受众 越明确,带货效果越好。比如洛天依是较早试水直播带货的虚拟主播之一,主要销售护理类 产品,还曾做客李佳琦直播间联合直播带货。
AI 虚拟主播:作为服务型虚拟数字人而存在。虚拟数字人能够在直播带货行业率先落地应用, 原因在于带货是最为直接高效的变现方式,此类虚拟人主播可以定位为“工具人”,在人设 构建初期即可上岗产生效益。随着人工智能技术与直播行业的不断结合,支撑虚拟主播落地 的技术门槛降低,AI 虚拟主播正逐步规模化应用中。
品牌方部署虚拟直播间,主要是出于成本与收益的考量。带货的虚拟主播,MCN 机构与品 牌方最为看重的几个指标依次是 ROI、互动情况、观众观看时长、转化效果等。
虚拟主播的成本低:对于品牌方而言,邀请中腰部以上的网红达人进行直播带货,所需 付的坑位费、佣金等费用并不低。品牌方大多有自己的直播间,需要经常直播,根据前 程无忧招聘信息,普通带货主播的月薪资水平约 1 万-2 万元。目前已经有一些工具化的 平台出现,如京东云数字人主播平台等,可以一站式为品牌方搭建虚拟直播间,一个普 通的虚拟直播间部署简单、成本不高,以蓝色光标与阿里达摩院合作推出的虚拟主播直 播电商解决方案为例,虚拟直播间价格为 9.9 万元/年(蓝色光标官网)。
虚拟主播可以 24 小时在线:真人主播的时间、精力有限、流动性也较强,但虚拟主播并不是来取代真人主播的,可以在真人主播休息的时间上岗,尤其是对中腰部品牌而言, 虚拟主播可做增量贡献,原因在于进入直播间的消费者已经对品牌有一定认知,只需了 解商品与折扣等信息,就有可能决策购买。
总体来说,电商直播行业人才缺乏,中腰部以上的主播少且成本高,对主播的投入产出具备 非常大的不确定性。因此对于无力培养主播的中小品牌方而言,选择 AI 虚拟主播不失为一 个好策略,AI 虚拟主播的成本低,且其带货能力不一定亚于真人主播,性价比高;对于中腰 部品牌方而言,一年的虚拟主播服务费在几千元到几万元不等,可以作为日常运营,补充真 人未播的时段,如凌晨档,实现降本增效。
2.2.3. 其他 B 端应用:以 AI 为内核的数字员工赋能行业发展
2021 年虚拟数字人火热的背后是相关技术的成熟,如自然语言处理、计算机语音、计算机 视觉,甚至人工智能内容生成技术,这些技术有了一定程度的突破,促进了虚拟人的应用场 景进一步扩大,渗透至更多行业。继阿里的 AYAYI、抖音的柳夜熙之后,如湖南卫视“小漾”、 快手电商虚拟主播“关小芳”、央视新闻 AI 手语主播、中国气象局服务虚拟人“冯小殊”、 万科“崔筱盼”、江南农商行“VTM 数字员工”等虚拟数字人陆续亮相。
可以发现,电商与内容领域之外的虚拟数字人正被大众所认知。另外,虚拟数字人也符合数字经济发展方向,2021 年 10 月,国家广电总局发布的《广播电视和网络视听“十四五”科技发展规划》明确指出,将推动虚拟主播、动画手语广泛应用于新闻播报、天气预报等节目 生产,提高制播效率和智能化水平。同时,探索短视频主播、数字网红、直播带货等虚拟形象在节目互动环节中的应用,增加个性化和趣味性。
在前文中,我们指出虚拟数字人可细分为身份型与服务型两种,两种的技术基础及应用场景 均不同。前者更倾向于在文娱领域应用,制作技术更强调创意、美观,如虚拟偶像、虚拟主播;而后者可在特定场景提供服务,替代真人作为数字员工而存在,制作技术更强调智能化、 交互性,例如虚拟客服、虚拟讲解员等。
其实一些虚拟员工早已应用于诸多行业中,赋能行业发展,比如 AI 虚拟客服是一个很大的 应用类别,尤其是在一些专业性较强的客服领域(金融证券、保险服务等),通过虚拟人可 以比较准确且生动的去解答大家的疑问。对于服务型企业而言,虚拟客服在普通 AI 产品的 基础上增强了互动体验,并有利于塑造品牌形象,而相关的成本大约相当于招聘了一个新员 工。以百度智能云 AI 人机交互实验室的发展为例,其早期的客户为金融、供应商领域,现 在增加了广电客户、互联网娱乐客户等,甚至一些品牌商也想做虚拟代言人。
长期来看,以人工智能为内核的数字员工将成为元宇宙的重要建造者。顺应数字经济的发展 趋势,在人工智能技术的加持下,未来有一些行业将通过虚拟数字人进一步提高现代化、智 能化的水平,如政务、文旅、教育等领域都已出现各式各样的虚拟数字人,在日常生活中扮 演着重要的角色。更长远来看,在未来元宇宙的建设中,服务型虚拟人可以代替人去发挥一 些关键生产要素的作用。元宇宙将带来数据洪流(如 3D 场景、360 度渲染场景),不可能单 靠人力去处理这些海量的数据,具备越来越强的自主学习与决策功能的人工智能辅以人工去 微调,可大幅降低构建元宇宙的周期与人力成本。
2.2.4. C 端社交:元宇宙中虚拟化身/分身的需求有待释放
虚拟化身/分身是未来人们在元宇宙中的身份象征。在元宇宙发展初期,市场上已经有一些 VR 社交平台出现,对比目前的几个主流 VR 社交平台 Horizon Worlds、Steam VR、网易瑶 台、百度希壤,有布局办公场景、社交场面、游戏场景等不同场景。对比分析这些 VR 社交 平台后,可以发现尽管他们主要布局的场景不同,目前搭载的一些内容不同,未来的愿景不 同,但是其中有一个关键的共性都是指向虚拟数字人。进入所有 VR 社交平台的第一步都是 先设计好自己的人物形象,所以我们看好元宇宙中 C 端虚拟数字人的需求。在未来元宇宙的 数字场景中,每个用户都需要有自己的 3D 虚拟化身(可以是卡通的,也可以是超写实的), 开放世界或游戏中大量的非用户角色(NPC)也需要做到千人千面。
尚待挖掘的 C 端虚拟数字人市场机会。随着用户从互联网/移动互联网迁移至元宇宙中,虚 拟化身/分身的需求将会迅速增长。对于用户而言,设臵虚拟化身形态是进入虚拟世界的必要 步骤,用户也可以根据自己喜好设臵多个形象迥异的分身。但目前来看,因为技术的局限性 与高企的成本,短期内 C 端虚拟数字人的需求与创造力难以得到最大程度的释放。因此对于 参与方而言,C 端虚拟数字人市场需求有待被挖掘,商业模式也存在非常大的创新空间,比 如形象定制付费、功能付费、年订阅制、NFT、与服装品牌合作开发数字服装等。
未来工具化平台降低使用门槛,让普通人实现“虚拟人自由”。无论是从玩家角度还是从游 戏角度出发,从零开始制作虚拟人,都需要较长的周期并且会耗费较高的成本。这种情况之 下,传统建模或者 CG 技术的制作流程与效率显然是不适用的,无法满足建造海量的虚拟数 字人的需求。现在可以看到,一些工业化的标准流程与制造工具已经出现,降低制作虚拟人 的门槛,创作者与普通用户可以更加便捷的生成属于自己的虚拟形象。
目前市场上最具代表性的比较先进的工具化平台为英伟达的 Omniverse Avatar、Epic 的 Metahuman Creato,国内也有部分公司推出虚拟数字人交互平台,如腾讯 NExT Studios 的 xFaceBuilder、网易伏羲、科大讯飞的虚拟人交互平台等。这些工具或平台一方面是服务于 公司本身的一些业务或开发工具,但另一方面也可以服务于开发者进行一些早期的开发与配 备,普通玩家也可以用这些工具便捷地生成自己的一些虚拟形象。
3.1. 长期看,虚拟数字人是新一轮的 IP 孵化与商业化
长远来看,数字人/虚拟数字人是元宇宙中重要的构成要素,也是人工智能技术在元宇宙中的 重要应用之一,会随着元宇宙的发展而不断进化,未来更加智能、更能实时交互的数字人无 疑将是重要的发展方向。
元宇宙作为计算平台,是内容产业当下的重大技术性触发要素,其中的数字人及其人机交互 有望得到变革与重塑。内容产业是供给决定需求的行业属性,重大技术会革新“供给端”, 进而直接“革新”内容产业。
第一,人的交互对象与交互方式均发生根本性的变化。我们前文所讨论的虚拟数字人,只是 未来元宇宙中“人”的其中一种形态,元宇宙中的交互对象新增了三类,为人的数字人、虚 拟数字人、虚拟数字人的机器人,内核均为人工智能,背后是生产力的变化,未来数字人相 较于目前的虚拟形象有很大的不同,生成机制不同、驱动方式不同。因此我们交互的对象除了人之外,未来更多的是人工智能体。数字人当下只是在入门级的发展,未来会走向智能化; 虚拟的数字人未来也有望配备现实的机器人。
第二,虚拟数字人革新了“轻资产”公司的资产负债表,大幅优化利润表。“轻资产”公司 对“轻资产”的收购或经营,是资产负债表中的商誉或应付账款,数字人则真正成为了公司 的“重资产”;数字人要么降成本要么降费用,提升净利率或毛利率。
第三,虚拟数字人更重要的是重塑商业模式。虚拟数字人既用于作品内容,也用于变现内容, 将重塑内容产业的业务模式与商业模式。相关公司的业务模式、盈利模式将实质性改变。
元宇宙赋予了虚拟数字人新的活力,虚拟数字人连同数字藏品一起,背后是元宇宙统领下的 新时代的生产力与生产关系的脉搏,带来新一轮的 IP 孵化与商业化。
1) 过往的 IP≈头部,未来的 IP≈特定/细分领域的专业度、辨识度、号召力;过往的 IP 更 多是版权及流量运营,未来的 IP 后退一步还原为创作者及其确切的作品;
2) 数字人与数字藏品绝对跟你息息相关,故对你最大的挑战,是你要将心态还原为一无所 有的 00 后,首先不要排斥抵触它,其次不要傲慢与偏见;
3) 这一轮的 IP 孵化与商业化,是真正的“以人为本”,“人”既包括现实人及其虚拟形象, 也包括数字人及其未来的机器形态;
4) 数字人与数字藏品,命门是创作者及其确切的作品,你可以运营数字人,但更重要是运 营你自己,你(包括你的法身)的 IP,确切的作品是什么?你的运营模型是什么?你想 达成怎样商业化的目的?元宇宙是更纯粹的内容、交流、交易空间,交流与交易的底层, 就是 IP;
5) 分发与流通环节竞争会更激烈,数字人背后的技术加持,作品量更多、商业化路径缩短 且每一环变现效率更高;数字藏品背后的机制则会放大 IP 商业化的天花板(泡沫化);
6) 要么成为 IP,要么成为用户;让数字人成为你的资产而非成本;让数字藏品成为你的作 品而不是消费;
7) 钱可能真的不再重要,钱是现实世界的硬通货,未来应该不是元宇宙时代的通货。(报告来源:未来智库)
3.2. 短期内,预计国内虚拟人率先在特定服务型领域规模化应用
聚焦当下,现在语境下的虚拟数字人已不同于以往的虚拟数字形象,生成机制、驱动方式均 发生重大变化。且入局方更多样,除了传统的 CG 或图形学公司,以技术见长的科技公司以 及互联网巨头悉数入局,加大资本投入,如国外的 Meta、英伟达、Unity,国内的腾讯、字 节跳动、阿里巴巴、网易等均在虚拟数字人方向投资布局。同时,有众多虚拟数字人创企在 近一年内涌现。
根据亿邦动力,2021 年全年,虚拟数字人相关投资有 16 笔,融资金额从数百万元人民币到 数千万美元不等,投资方包括红杉资本、IDG 资本、顺为资本、峰瑞资本等知名投资机构, 以及字节跳动、小米、网易等互联网或科技公司。其中,蔚领时代科技在 2021 年 12 月底完 成 B 轮融资,以总金额 4 亿人民币创下该领域单笔融资金额的最高记录。2022 年,虚拟数 字人赛道一级市场依旧火热,根据天眼查数据显示,从 2021 年初至 2022 年 2 月 23 日,国 内共有 42 起“虚拟人”相关的投融资事件,投资规模累计超 33.89 亿元。
可以发现,投资方所投资的虚拟人创企,其业务模式大多集中于超写实虚拟人、虚拟人生态 运营、人工智能、实时在线互动技术等相关的上下游产业链,投资方向更为偏好新技术的运 用与虚拟人的运营,源于:一方面,生产虚拟数字人不难,难点在于如何利用新技术去降低 成本;另一方面,在巨头林立的状态下,有虚拟数字人运营能力或能够形成数字人平台的公 司有更高的价值。
2021 年虚拟数字人伴随着元宇宙的兴起而备受瞩目,经过了一年的市场教育期,诸多入局 方加速探索可落地的场景。在元宇宙方向上,中国的优势在于“内容与场景、协同方”这两 大板块,同时基于现阶段的技术水平判断,中短期内我们预计国内虚拟数字人将率先在某些 特定场景中发展落地,如直播带货、虚拟客服等领域,即服务型虚拟数字人预计将率先规模 化应用。
虚拟人行业还处于较为初级的发展阶段,当下发展存在诸多痛点,如虚拟人研发投入成本高、 商业化场景单薄、技术不成熟等,行业有非常大的优化空间,未来可以关注行业以下几点变 化:
成本的持续下探:如果采用纯人工或借助外部采集设备方式进行建模,人力成本的存在 限制了整体成本的下降,进而限制了虚拟数字人的规模化应用。只有当虚拟数字人的建 模成本降到一定程度时,才有望从 B 端向广阔的 C 端渗透。
相关技术的成熟:技术是推动虚拟人应用落地的核心驱动力,目前虚拟数字人的制作已 经不局限于 CG、美工等传统手段,而是涉及到实时渲染、Al 驱动等新技术的运用。目 前虚拟人技术与应用场景的结合依然存在局限,比如在直播中的虚拟人的交互问题,如 何让虚拟人做到与商品、用户的自然互动。
硬件性能的提高:虚拟人的生成与驱动需要强大的硬件支撑,即 AI 算力硬件,包括人 工智能芯片、驱动虚拟人的芯片、渲染芯片等。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】。未来智库 - 官方网站