虚拟数字人,活得并不容易
出品|虎嗅商业、消费与机动组
作者|空心三角
题图|虚拟数字人AYAYI,燃麦科技官网
3月25日,抖音@柳夜熙账号更新了短剧“地支迷阵”的第五集,在科幻+玄幻的背景下,虚拟数字人和现实存在的人类互相倾轧,冰冷的科技和温暖的人性迸撞出火花。在评论区,除了“你竟然可以在抖音看电影”这样的褒奖外,还有“求问作者,这条视频要花多少钱”的好奇,以及“是不是该更新了”的期待。
而过去半年,“柳夜熙”账号实际上仅发布了11条作品,除去几条30秒左右的宣传视频,只有最初的亮相视频和5条4分钟左右的正片。众所周知,互联网没有长久的记忆,这样的产量对以抖音为主阵地的短视频创作者来讲,是远远无法令人满意的。
其实对国内用户而言,过去半年,已经是虚拟数字人自诞生以来存在感最高的一段时间。
一方面,以Meta(Facebook)为代表的科技巨头再度抛出元宇宙概念,引发市场追捧,“虚拟数字人”被视为未来人类进入元宇宙的介质,随之站上舆论风口;另一方面,北京冬奥会成为当前虚拟数字人技术的展示舞台,无论是体娱明星的虚拟分身(如谷爱凌虚拟分身Meet Gu),还是以公共服务为导向的虚拟主播(如央视AI手语主播),都让大众对虚拟数字人产生了更直观、更深入的认知。
Meet Gu 3D Avatar风格化数智达人/图片:网络
数据也能反映国内虚拟数字人行业的热度。根据启信宝数据显示,2020年国内虚拟数字人相关企业新增数量为36080家,2021年该数据达到66293家,同比增长80%。天眼查数据显示,我国现有“虚拟数字人”相关企业约30万家。
当前正在孵化的虚拟数字人项目数量暂时不得而知,但根据普遍存在的一个团队、一条技术链路同时支撑多个虚拟数字人IP孵化的并行模式估算,这个数字当以万计,甚至更多。
如果模糊掉纯概念阶段的虚拟数字人历史,那么Crypton Future Media(日本音声制作和音乐软件公司)于2007年推出的“初音未来”可算作是第一个广为人知的虚拟数字人,我们此前所见的虚拟数字人也以二次元形象的虚拟偶像和Vtuber居多。而本轮热潮中,虚拟数字人逐渐开启多元化发展:外在观感层面,依托新一代引擎和技术,超写实数字人、虚拟分身已经与现实存在的人类真假难辨;功能应用层面,具备更多服务属性的虚拟员工、虚拟主播开始呈现规模应用趋势。
在艾媒咨询发布的《2022 中国虚拟人行业发展研究报告》中,将国内虚拟人产业的发展历程分为4个阶段:萌芽阶段(1980-1999)、探索阶段(2000-2014)、初级阶段(2015-2019)、发展阶段(2020至今),而发展阶段的特征是,“技术、需求均有突破,虚拟偶像凭借独特的人设吸引年轻群体。”
中国虚拟人产业发展历程/图片:艾媒咨询
在当下发展阶段,整个行业进入快速扩张期,但距离成熟仍有距离。 就近而论,虚拟数字人仍未有获得广泛认可的权威定义和标准化分类;从长远看,元宇宙构想落地尚早,虚拟数字人发力缺乏环境支持。
那么从眼下出发,已经孵化和即将孵化的数字人们可能都面临同样的问题——如何活着?正如互联网时代的许多新事物一样,数字人们也必将经历“雨后春笋-大浪淘沙-适者生存”的考验,因此,技术迭代、长线运营、商业化路径可能是行业近期最需要关心的几个问题。
注:本文采用中国传媒大学《中国虚拟数字人影响力指数报告》中的分类方法。技术上,虚拟数字人可以分为智能驱动、真人(中之人)驱动两大类。应用上则包括身份型(如真人虚拟分身)、服务型(如虚拟员工)、表演型(如虚拟偶像)三大类。”
技术先行一步?
虚拟数字人的制作是一个相对复杂的流程。以新华社联合腾讯互娱旗下NExT Studios推出的虚拟数字航天员小诤为例,NExT技术团队介绍了超写实数字人的制作流程。
扫描:采用Photogrammetry扫描系统对特定演员进行全方位扫描,包括脸部模型、身体、衣服等,随后生成点云模型。建模:针对身体和脸部特征,将点云模型转成低模,便于后续绑定制作。同时手工制作扫描出错或扫描不到的地方,如口腔内部、眼睛、牙齿、头发。绑定:基于FACS(面部表情编码系统)、MotionBuilder(3D角色动画软件)和Maya(三维建模、动画软件),完成人脸、身体绑定,生成仿真的虚拟形象。动画:采用面部、身体动作捕捉方案,结合后期人工动画精修,实现虚拟形象的动态展示。渲染:通过虚幻引擎,完成角色渲染和动画输出,所见即所得。而虚拟数字人的制作,同其它工业化制程一样,不仅包括产品的迭代,也伴随生产工具的革新。例如,通过开发基于FACS的表情模型(Blendshape)制作工具,大幅提升表情模型数量,解决虚拟形象面部表情僵硬的问题;通过自动化算法,解决虚拟角色和真实演员身体比例不一样导致的角色穿模问题。
自2017年以来,NExT Studios团队逐渐摸索出两条超写实虚拟人制作管线,分别取名为xFaceBuilder®和xMoCap®,对应虚拟数字人的面部和身体制作,除了数字人领域,二者也应用于腾讯的PC游戏和手游项目。
虚拟数字航天员小诤/图片:新华社
目前,多数大型科技公司都有技术团队试水虚拟数字人孵化。而对有实际需求,仅缺少技术储备的应用方而言,百度智能云曦灵数字人平台提供了相对简单的一站式接入方案。
百度智能云AI人机交互实验室负责人李士岩介绍,曦灵平台可以满足数字人的低成本快速定制,同时提供人设、业务、内容方面的运营支持。其中3D卡通数字人可以通过人脸识别、照片建模分钟级生成,2D平面数字人可以通过上传真人视频小时级生成。而3D高清数字人方面,非特异型数字人(没有现实或虚拟的具体参照形象)支持分钟级生成,同时支持AI驱动;特异型数字人(有具体的参照形象要求)成本最高,需要10到30天。
需要注意,快速低成本生成的数字人与虚拟员工等服务性需求契合度较好,训练完成基本可以无缝接入当前应用场景。但对于虚拟偶像等表演型需求,生成虚拟形象只是第一步,更精细的打磨和长期的运营支持必不可少。
央视AI手语主播/图片:央视新闻
和虎嗅有过交流的多个虚拟数字人团队,都认为数字人的工业化生产即将到来。 可以说,当前虚拟数字人技术正在快速发展和迭代,至少在外观上已经无限接近所想即所得,以至个别超写实数字人正是因为在审美层面过于完美,而被识别为假。
但与此同时,当下数字人在交互上的瓶颈显而易见,现有AI技术还不足以支持数字人养成独立行为,独立思想则更远。只是在潮流概念和技术驱动下,数字人的发展先于需求一步,然而也正是因为技术的瓶颈,数字人尚未打通自身的生存路径。 反映到当下,每一个数字人要想成为长久存在的“人”,更多还是靠幕后运营团队去支撑。
运营后继乏力
暂时不考虑身份型虚拟数字人的应用,目前表演型虚拟数字人主要以To C为主,而实用型数字人主要以To B和To G应用为主。保持活跃、保有关注,是悬在每一个虚拟数字人头顶的达摩克利斯之剑。
目前虚拟数字人的曝光方式主要有以下几种途径:发布离线视频、图片(如柳夜熙,AYAYI等超写实数字人);才艺直播、舞台演出(如A-SOUL,洛天依等二次元虚拟偶像);参与大型活动、特殊场景报道(如央视网小C、新华社小诤等媒体虚拟员工)。上述数字人IP面临的挑战,也是整个行业必须直面的问题。
其一是成本。 去年10月31日,柳夜熙凭借“捉妖”题材短视频爆红,一夜涨粉363万,影响力在中国传媒大学发布的《中国虚拟数字人影响力指数报告》中名列首位。但至今5个月以来,柳夜熙抖音官方账号总计发布视频数量为11条,更新频率每月2次,粉丝留言中“催更”频繁出现。
而在《影响力指数报告》中排名第五的AYAYI一直活跃在平面媒介,通过晒硬照保持较高的曝光频次。但翻看其小红书动态即可发现,高频次的晒照并没有持续推升人气和互动量,反而从最初的峰值有所回落,动态下方的评论区也时不时收到“新片质量不如早期照片精致”的反馈。
现象级虚拟数字人柳夜熙/图片:网络
据百度李士岩介绍,“采用传统方法制作CG级的视频、海报成本很高,一分钟视频做一个月可能是算短的,2到3个月也很正常。目前生产工具还没有做的特别好,限制了生产力,而生产力又进一步限制了生产关系的创新。未来通过人工智能深度学习,可以一定程度上压缩生产周期。”
腾讯NExT Studios团队也证实了成本瓶颈,“超写实数字人是虚拟数字人技术皇冠上的明珠,有远高于二次元纸片人的制作难度,国内行业积累有限,相关技术人才也很稀缺,大部分国内厂商的生产能力都被压制在一个较为初级的水平线上。但与此同时,团队只需要在某一两个环节上有长板,也就容易脱颖而出。
目前市场上的虚拟数字人制作公司大多是创业型公司,有短期融资变现的强需求,因此会比较追求快速生产或规模化,对于精工细作很难兼顾。一个超写实虚拟数字人形象恐怕至少要投入100至200万制作费用才能不至羞于见人,甚至即便投入了也未必能做出令人满意的角色。”
曾经引起轰动的黄仁勋虚拟人也可作为参考,根据英伟达官方博客,黄仁勋虚拟人在发布会上出镜的14秒视频,共有34位3D美术师和15位软件工程师协同参与,总计近千工时。
其二是内容和运营。 对于A-SOUL、洛天依等虚拟偶像,可供直接参考发展路径是明星艺人,那么业务能力和粉丝运营能力便是两项硬指标。只是国内Vtuber行业起步较晚,且一直囿于小众,专业的中之人、能为虚拟偶像定制内容的创作团队都很稀缺;与此同时,能弄明白“二次元为爱发电”,能玩转粉丝经济,能熟谙饭圈文化的运营团队更是屈指可数。
拥有多年流量明星培养、管理经验的乐华娱乐,可以说代表了国内虚拟偶像运营的较高水平。在过去一年中,乐华既有与方文山、许嵩合作,为A-SOUL量身打造新作品的手笔,也不只一次犯过运营不够精细化的错误——比如“嘉然直播玩手机”事件、“向晚中之人疑似曝光”事件。
虚拟偶像组合A-SOUL/图片:A-SOUL官方微博
除此之外,还有一些案例也反映出当下数字人运营的壁垒。去年年中,国风写实数字人翎_Ling发布小红书笔记,称某品牌口红“滋润不干”,引发网友质疑。“AI知道口红好不好吗?”“AI就人物带带衣服这类货还差不多,化妆品、护肤品就免了吧。”
国外数字人网红鼻祖Lil Miquela也曾遭争议——2019年,Lil Miquela通过Vlog分享了一段自己在和陌生人共乘计程车时遭到骚扰的过程,但网友认为将遭受性侵作为营销手段明显过界。
可见,用户对数字人的信任,主要集中在视听感观。尽管数字人从外观上已经足够接近人类,但现实和虚拟的鸿沟仍然很难跨越。
不过在李士岩看来,时间可以解决很多问题,“因为计算机技术的发展,一直在追求将物理世界的信息进行数字化,如果有足够的发展周期,感觉、其它一切都是可以数字化的。”
其三是打破同质化。 当前数量较多的虚拟主持人、虚拟带货主播、Vtuber等,是AI驱动应用最多的场景。7*24小时在岗,随时、随地工作的特性体现了技术的优势。但正如前文提及的《影响力指数报告》而言,目前虚拟主播技术借力多、自主少,需要关注、提升。“同质化竞争”是虚拟主播的重要挑战,无论是专业媒体经营,还是企业或者个人运营的,其主持、直播功能雷同,要突出重围则需更强的内容策划和运营能力。
腾讯NExT Studios团队表示,“虚拟数字人是一个新兴产物,在市场上引起一定的关注、热度、吹捧也属正常。伴随着数字人技术的日趋先进、门槛降低,比如英伟达的 Omniverse Avatar、Epic 的 MetaHuman Creator等工具推出,用户能看到同类水准的东西越来越多,审美品味也会随之提高,对优秀作品的需求会放大。届时用户不只会被虚拟数字人漂亮的形象吸引,而会更进一步看到TA背后的表演、内涵甚至于精神。那么 那种只靠一张皮、一张图,而缺乏形象背后深度运营能力的数字人肯定都会快速退潮,死在沙滩上。 ”
商业路径未明
根据量子位发布的《虚拟数字人深度产业报告》,到2030年,我国虚拟数字人整体市场规模将达到2700亿,其中身份型数字人(包括虚拟偶像、虚拟分身等)约占1750亿,服务型数字人约950亿,市场目前仍处于培育阶段。至于应用层面, 替代真人服务的虚拟主播和具备IP潜力的虚拟偶像是当前市场热点 。
而在艾媒咨询提供的数据中,虚拟偶像产业保持稳定增长态势,2021年,虚拟偶像带动整体市场规模和核心市场规模分别为1074.9亿元和62.2亿元,预计2022年将分别达到1866.1亿元和120.8亿元。
腾讯NExT Studios团队也认为虚拟偶像、Vtuber可能是目前最有商业化前景的方向,“毕竟能与用户直接交互,想象空间比单向的CG视频更大。”
在一众虚拟数字人前景未明的时候,虚拟偶像团体A-SOUL给业界注入不少信心。3月8日,乐华娱乐向港交所递交招股书,通过各机构对招股书的解读,推测出A-SOUL在2021年取得的收入应不少于1700万。尽管这个数字只占乐华总收入的不到3%,远远无法和乐华旗下的流量明星相提并论,但已经是虚拟数字人迄今取得的最好成绩。
国内虚拟偶像产业预测/图片:艾媒咨询
至于其它表演型、服务型数字人,除了流量变现,目前还没能看到明确的商业路径。虚拟带货主播可以节约商家的人力成本,但能否替代真人的评测功能,与真人是竞争关系还是竞合关系仍有待验证;借助春晚、冬奥会吸引到广泛关注的虚拟媒体主播、记者,似乎使命完成,又回归了此前不温不火的状态;而当下企业的大部分“虚拟员工”,与此前的智能客服差异不大,能被人记住的,只有少数采用独特人设展现企业品牌形象、用于营销的IP。
虎嗅也从燃麦科技(AYAYI孵化团队)了解到,“目前数字人只占公司四分之一的业务板块,当AYAYI引领了数字人行业以后,其实她的任务已经完成,我们现在正在筹备数字厂牌,孵化数字艺术家,举办数字艺术展览,上线数字藏品平台等。”
每一类、乃至每一个数字人,可能都在探索自己的生存之道。那么此后一段时间,什么样的数字人可能会接近成功呢?
在较近阶段,腾讯NExT Studios团队认为主流的打造虚拟数字人IP的途径可能会有如下几种:
1.自带IP属性的明星。例如虚拟邓丽君、梅兰芳、威尔史密斯等真人的数字复刻,运营思路其实就是真人明星的再现,是最具技术和产品挑战的一种数字人形式。2.与真人联动的虚拟数字人IP。此类IP运营方式会对运营方有更专业和更全局化的要求,一般都有传统的艺人经纪公司参与,主要以突破既有用户圈层、规避真人塌房风险等为核心诉求。3.基于成熟的MCN网红打造IP。在此维度上,由于可观的技术投入费用在前,虚拟数字人必然趋于劣势。4.基于故事、游戏虚拟世界创建出来的IP。此类IP打造方式更符合传统IP的打造思路,从文字到平面、立体、动态… 内容形式也会从传统纸媒、多屏覆盖到新媒体的各个维度,属于高举高打的形式。整体投入巨大,且成功概率呈漏斗型,只有经久不息的内容和质量才能持续打动观众,形成真正的IP。5.基于二次元形象而打造的虚拟数字人IP。这类虚拟偶像虽然相对技术门槛低,但用户触达难度高,并非光靠砸钱堆人就能成功。
国内虚拟人产业链/图片:艾媒咨询
在稍长远的周期中,百度李士岩认为,数字人是基于计算机平台的交互载体,将呈现段落式发展。“当下所处的平面计算时代,主要以服务型与表演型数字人应用为主,下一个阶段是更大的时代,暂时定义为空间计算时代。空间计算时代计算平台呈现的信息不再是平面的,而是实时三维的,届时核心用户的行为大概会有社交、获取商品、信息消费、获得服务四类,那么能够提供个性化交互、能提供情绪价值和内容价值的虚拟分身是必选项,能够提供人文情感关怀、又能保证效率的服务型数字人则是另一种应用形态。 在未来的空间计算时代,一定会产生比现在平面计算时代更大的市场。 ”
写在最后
正如柳夜熙“地支迷阵”短片中抛出的核心矛盾——随着虚拟数字人技术的进一步发展,舆论泡沫、伦理制约等问题将可能成为潜在的风险,人类也必将直面AI与人类、数字人与人类的议题。
对此,李士岩认为,“ 在当前的虚拟数字人领域,人工智能更像是一个生产工具 ,人的创造力加上生产工具,可以更高效更低成本地生产内容。”
腾讯NExT Studios团队也分享了他们的看法。
“作为科技产物,虚拟数字人背后的“魂”或“神”,依旧需要依托人、或者人工智能完整表达。随着计算机图形技术、动捕技术以及AI技术的发展,虚拟数字人将在场景技术、情感技术、交互技术上产生长足的进步,这就会让未来的数字人越来越接近于真人,甚至于超越。
整体来看,虚拟数字人的进化路径由拟人化走向同人化,最终将走向超人化,实现归真超实。 在拟人化阶段,数字虚拟人是由计算机虚拟合成的、高度逼真的三维动画人物;在同人化阶段,数字虚拟人的外观、情感、交流能力、理解能力等各方面与真人相同;在超人化阶段,数字虚拟人的能力将超越自然人。
未来虚拟数字人的发展不能单独依托技术,要拥有足够的竞争力,必须打造全新体验,对整个应用场景深刻理解。满足用户需求,给用户前所未有的情感体验,让用户接纳虚拟人,才是虚拟人走向成功的必经之路。”
Bitcoin Price Consolidates Below Resistance, Are Dips Still Supported?
Bitcoin Price Consolidates Below Resistance, Are Dips Still Supported?
XRP, Solana, Cardano, Shiba Inu Making Up for Lost Time as Big Whale Transaction Spikes Pop Up
XRP, Solana, Cardano, Shiba Inu Making Up for Lost Time as Big Whale Transaction Spikes Pop Up
Justin Sun suspected to have purchased $160m in Ethereum
Justin Sun suspected to have purchased $160m in Ethereum