虚拟数字人在各行业里的应用已经越来越广泛,那么随着技术越来越成熟,数字人未来的形象及发展,可能呈现怎样的趋向呢?这篇文章里,作者围绕数字人做了介绍和分析,不妨来看一下,或许可以帮你更加了解这一概念背后的图景。
随着数字人的热度越来越高,各行业运用的应用场景越来越丰富,数字人也越来越被大众所知晓。特别是2022年下半年到2023年,比如北京冬奥会的开幕式表演、气象播报、手语解说中频频现身;数字人主播在电视台中的主持。
各种晚会与明星互动表演:2022年江苏卫视跨年晚会舞台上,“虚拟邓丽君”便与周深共同完成了《大鱼》、《小城故事》和《漫步人生路》三首歌曲的合唱;2022年5月18日,首个文博界虚拟宣推官文夭夭:唐代花钿妆容,双髻丸子头,着一袭淡雅长裙,腰系唐朝花鸟镂空香熏球。
本文就数字人的形象类型、不同类型的制作周期与限制条件、普及程度与大众认知程度、运用的优劣势以及未来发展的趋势这些维度就个人的见解与各位分享。
首先简单介绍一下什么是数字人:
虚拟数字人指存在于非物理世界中,由计算机图形学、图形渲染、动作捕捉、深度学习、语音合成等计算机手段创造及使用,并具有多重人类特征(外貌特征、人类表演能力、人类交互能力等)的综合产物。
市面上也多将其称为虚拟形象、虚拟人、数字人等,代表性的细分应用包括虚拟助手、虚拟客服、虚拟偶像/主播等。
其中在目前的运用中,较为常见的有2D真人、2D卡通、3D卡通、3D写实、3D超写实这5个类型。
2D真人:通过真人在专业录影棚录制的视频再加AI训练而成;用户也可以通过图片把用户的外观特征再加AI训练而成。其表情神态、肢体动作等堪比真人效果——目前很多人可能接触到的是抖音、淘宝等直播电商平台上,有很多此类型数字人。
2D卡通:通过 2D 建模生成,具有非常强的可塑性。如世界第一虚拟偶像日本梦幻歌姬“初音未来”的形象、洛天依等。——目前其实在运用层面上,已经不是很常见了。
3D卡通/3D写实:通过高精度原画设计、高写实 3D 建模、高水准的虚拟人引擎导入、高精度动作捕捉、最后完成精致的修帧渲染方能完成。——随着GPU以及算力的发展,目前越来越高进度的3D数字人运用在APP/小程序/机具终端上。
3D超写实:超写实是指人物外观仿真度高,栩栩如生,这种虚拟人需要面部面数在1万面以上,高精度经得起360度无死角的怼拍。面部材质不仅十分接近真实皮肤的质感,还可以根据相机的距离进行自动优化,皮肤、五官、头发、肢体几近真人。如Ling、柳夜熙等——目前更多的还是运用在最为独立IP,作为企业形象代言人,可以去承接视频宣传、海报宣传、跨界互动上。
2. 从制作周期、制作方式维度来说明阐述一下不同类型数字人的情况制作周期:
制作流程:
2D数字人:
2D卡通数字人较为简单:主要通过手绘或者美术人员来实现。
2D视频数字人:
3D数字人制作流程:
1)虚拟形象设定构思:首先我们需要知道虚拟人的形象风格及类别;
2)虚拟形象建模、建模形象绑定、动作捕捉。基于虚拟形象IP设计或真人偶像绘制原画和三视图、招牌动作表情。进行面部及身体3D建模,选择关键点,将识别关键点映射至模型上,进行绑定。关键点绑定的数量及位置影响最终效果。利用动作捕捉设备或特定摄像头+图像识别,捕捉在形体、表情、眼神、手势等方面的关键点变化。
3)实时驱动渲染
真人演员(在虚拟偶像中称为中之人)根据制作需要进行相应表演,实时驱动虚拟数字人表演。
4)实时内容输出互动
最终将复活的实时数字人接入实时渲染引擎。
——稍微展开聊聊(什么是恐怖谷效应):
3D技术限制存在恐怖谷效应。所谓恐怖谷效应,是指当机器人或虚拟人对人类的拟真程度到达非常高的程度后,由于和真人只有一点点的差距,反而会使现实人类感到恐惧。而如果能突破这个临界点,人类对机器人或虚拟人的恐惧度就会迅速下降。
随着技术的越来越成熟,以及硬件设备(移动手机、硬件大屏等)性能越来越强大,大众对于数字人的期望也会变的越来越高。
1. 从制作的角度来看近年来,拍照式相机阵列扫描重建得到飞速发展,目前可实现毫秒级高速拍照扫描(高性能的相机阵列精度可达到亚毫米级),满足数字人扫描重建需求,成为当前人物建模主流方式。国际上 IR、Ten24 等公司已经将静态重建技术完全商业化,服务于好莱坞大型影视数字人制作,国内凌云光等公司制作的拍照式人体扫描系统也已经在电影、游戏、虚拟主播项目中成功应用。
相比静态重建技术,动态光场重建不仅可以重建人物的几何模型,还可一次性获取动态的人物模型数据,并高品质重现不同视角下观看人体的光影效果,成为数字人建模重点发展方向。
2. 从渲染的技术来看实时渲染技术的突破助力写实类数字人实现实时交互,应用范围快速扩大。
随着硬件能力的提升和算法的突破,渲染速度、渲染效果的真实度、渲染画面的分辨率均大幅提升,在虚拟人物实时渲染方面,已经能做到以假乱真。
3. 从形象展现端的角度来看数字人作为数字 IP 不仅需要助力品牌实现差异化和年轻化,还能让用户快速建立品牌联想和品牌标识。
目前的打造趋势:造场景、立人设、创运营。
场景:
立人设:
创运营:采用“有故事 + 有进化 + 有持续性”的运营模式,打通全域式营销通道,为数字人 IP 续航发展注入能量。
1)技术向上,成本向下
在元宇宙时代,强大的企业将开始跨足不同领域,合并不同学科的知识,以加速技术创新并将其应用于实际产业。在技术不断升级的情况下,这将推动行业标准化和智能化的发展,提高生产效率。随着技术的发展,高精度虚拟人的制作成本将不断降低,使得内容创作者能够更轻松地专注于创造内容,而不受成本的限制。这意味着未来我们将看到更多的创作者将资源用于创作本身,从而推动内容产业的进一步发展。
2)价值向内,责任向外
在元宇宙时代,拥有内容生产能力的虚拟人,将成为“内生力量”,构建起元宇宙价值的“内循环”。创造内容的虚拟人将成为元宇宙价值的重要组成部分,就像是一个内部推动力量,为元宇宙的发展构建起一个内部的循环。如果虚拟人在元宇宙中违反法律和道德规范,那么虚拟人的所有者将会被视为主要责任人,需要接受虚拟世界和现实社会的不同审判。
3)行业破壁,产业融合
元宇宙的核心是“融合”,随着产业的升级,它将重新连接整个产业链,引发新的场景和业态的涌现。人类社会与元宇宙将以“元宇宙+”的模式长期共存,虚拟人作为一种关键的数字工具,将广泛渗透到传统产业中,实现向外扩展,成为推动各行业效率提升到新水平的关键手段,继互联网之后的又一重要推动力。
2. 商业模式国内很多公司选择自己开发语音、文字和图像处理能力,而国外则更倾向于使用微软、AWS、Google等公司提供的核心自然语言处理(NLP)技术,将其整合到产品中,让客户可以自由选择。
这可能是因为国外主要由计算机图形(CG)公司主导市场,而国内公司更注重业务集中化。未来,一些国内公司表示他们也会向外部公司开放部分技术能力。这种差异在未来可能逐渐减小,因为国外公司更趋向于提供标准化的虚拟数字人形象,包括丰富的音效和模板。
相比之下,国内公司的提供相对较有限,更多的是根据用户需求进行特定设计,以满足定制化项目的需求。在交付方面,国外主要以特定的虚拟数字人为主,让客户方进行训练和迭代;而国内则更注重提供内容。
国内大多是传统的AI公司,在这个赛道中基于虚拟直播或虚拟主持人播报起家,并开始关注这两项技术的周边产业,如完整的直播应用方案、运营等并逐渐向其他领域延展。
但由于国内市场和内容消费的市场太大,缺乏业务延展的动力。部分公司在向消费级的完整解决方案拓展。
除了 Epic这个游戏引擎公司外,其余的公司都是专注于这个领域的。就目前动向而言,可能会沿垂直行业发展。国外企业更多聚焦于2C,延续了从日本兴起的虚拟陪伴文化(这一方向在国内主要体现在AcFu和哔哩哔哩中)。我国企业则多聚焦于实用性更强的2B2C领域,通过客服等服务型场景降本增效,更快的兑现技术价值。
3. 总结目前,虽然数字人在应用方面还面临一些问题,比如产业链不够顺畅、场景无法很好地连接、成本较高等。但随着“元宇宙”的快速崛起,整个产业链将更紧密地结合在一起,使技术更先进,成本更低,使得数字人进入普通家庭,提高企业的质量和效率。
在元宇宙中,每个人都将有一个数字身体,这个数字身体的主体就是虚拟人。虚拟人参与到元宇宙的社会活动中,与由智能驱动的虚拟人形成了“人机共生”的完美结合,创造了一种新的商业形式。
虚拟人已经开始在政务、商业、娱乐、医疗、教育、金融、养老等各个领域发展,不断提升自身能力。这体现了“元宇宙”中虚拟与实际的密切关系。
在未来很长的时间里,元宇宙中的虚拟人将成为热门话题。但无论如何,我们要尊重人类、尊重自然、尊重科技、尊重宇宙、尊重艺术,让这个不可避免的未来变得更美好。
本文由 @毅鸣 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。