虚拟人乱战,技术才是王道
文:蛇眼财经
来源:蓝鲸财经
经由国内外企业如腾讯和Meta(原Facebook)的推波助澜,2021年刮了一阵“元宇宙”风,由此也把相关技术和事物带火了,要说最引人瞩目的,虚拟人是其中之一。
虚拟人发展到今天这个阶段,已经能称得上是井喷期了,各类虚拟人百花齐放。这一时期的虚拟人已经不单单是作为“另类明星”而存在了,由于AI技术的更进一步发展,虚拟人作为真人劳动的补充,已经基本胜任一些简单的重复性工作了。在技术和理念的加持下,虚拟人开始突破已有的应用场景。谁能想象虚拟人的未来?谁能想象虚拟人带给世界的变化?
虚拟人的终极目标
“虚拟人”实际上是个非常宽泛的概念。从洛天依、初音未来这类耳熟能详的二次元风格形象,到王冰冰和谷爱凌的真人虚拟形象,她们当然是公认的虚拟人;但往宽泛了说,《小神龙俱乐部》中的小神龙、被技术手段“复活”了的邓丽君、小米的小爱同学、穿着皮套的福瑞和奥特曼同样是虚拟人,甚至我们可以说神话中的人格神也是一种虚拟人。
但是,关于“虚拟人”这个范畴存在一个根本性问题:如何分辨虚拟人与ACG作品中的虚拟形象?如果我们认为虚拟形象就是虚拟人,那么ACG是否只是虚拟人参演的作品?反过来说,如果虚拟人就是虚拟形象,那么我们所处的世界是否就是一个庞大的虚拟空间?因此,如何判定虚拟人,尤其是今天数字化了的虚拟人,关键点是世界观。
世界观决定了虚拟的性质,即“虚拟指向的对象”被确定了下来。ACG作品构建的世界观,对我们来说是虚拟的,但对于其中角色来说却是真实的,他们的交互对象也不是我们;但虚拟人以现实世界观为基础,交互的对象也是真实存在的人类。我们可以想象,在古代或者别的计算机技术还没有发展的时代,也是存在这样的区别的。
然而,我们能够发现,“虚拟人”在今天已经狭义地成为“数字虚拟人”的代称了。在古代,“上帝”是的的确确地在教徒们共同构建的意义空间内进行互动的,虽然看不见摸不着,但是真实存在。可现在,我们已经无法想象,在没有数字技术辅助的情况下,人应该如何与虚拟人进行互动。就好像虚拟人这一事物越发展,它就越被限制在某个框架内。
实际上这是虚拟人表现形式发展的必然趋势,“数字化”的重要性被极大地凸显出来了。纵观虚拟人的技术发展历程,我们几乎可以断言,“数字化”是当下最适合虚拟人的表现形式。
一是因为易复制,数字化的存在和表现形式就已经决定了虚拟人能够广泛的与每一个人进行交互;二是因为可塑性强,虚拟人的实质是0和1,因此只要改变代码,理论上就能迅速塑造完全不同的虚拟人;三是为交互打下了基础,这也是数字化的重要意义,通过数字化,虚拟人的互动方式就不再是单向度的了。
在现实世界观和数字化的基础上,“交互”进一步塑造了当下极为狭义的“虚拟人”。实际上,交互可以说是虚拟人的“终极目标”,也是虚拟人发展到今天必然产生的能力。虚拟人之所以为“人”,而不是猫猫狗狗,正是在于我们要求在于虚拟人交互的过程中,得到具有“人的特性”的反馈:人的行为、人的情绪、人的语言。
简而言之,“世界观”告诉我们谁是虚拟人,“数字化”和“交互”对此又进一步划清界限、澄清前提。准确来说,文章讨论的对象应该叫“数字虚拟人”,这是与其他意义上的虚拟人最大的不同,但为了行文简洁,我们在下面还是继续简称为“虚拟人”。
因此我们必须意识到,今天的虚拟人与之商业化紧紧围绕“数字化”和“交互”这两个关键词进行交织演变——要么数字化,要么交互,要么两者兼有。
谁在生产虚拟人?
虚拟人是个典型的风口市场,市场走向极大地受到行业氛围的影响,并未再现智能手机那样一经推出就迅速席卷全球的景象。2021年,由于元宇宙的火爆,被视为元宇宙场景入口之一的“虚拟人”正式进入资本眼中。根据Choice数据,2021年,28家虚拟人概念股中,有25家公司的股价累计为涨;但在此之前的2020年,却只有11家公司股价累计上涨。
目前来看,虚拟人产业链面向生产的基础层和平台层市场有两个特点,一个是“乱”,另一个是“技术为核心”。
首先,虚拟人市场之所以“乱”,是因为目前技术和应用还相对不成熟,导致虚拟人市场仍旧非常复杂,具体表现为产业链相对割裂、产品与需求匹配度低、内容生产成本高、生产周期长等痛点。
为虚拟人提供其所需基础软硬件的,国外有微软、Meta(原Facebook)、谷歌、索尼、红绿蓝芯片三大厂等,国内有影创(AR、VR等)、凌云光(机器视觉)、青瞳视觉(动捕)等。
为虚拟人提供其核心能力所需软硬件的,有商汤、旷世、依图、科大讯飞、搜狗、数字王国等。这些厂商负责建设虚拟人制作开发所需要的平台,并且生产相应的行业解决方案,主攻方向就是技术输出。
紧接着,像是虚拟人离不开的数字化,包括建模和渲染,有欧特克、Houdini、Unity和Epic等厂商;人设规划方面也有B站、阅文、原力、虚拟影业、数字王国等厂商在做。
从上述众多企业来看,我们也不难发现虽然虚拟人挤入了众多巨头,但在虚拟人这个细分领域,还没有出现一位处于能够“一锤定音”地位的龙头,进场的企业更像是“偶然”发现自身技术或者擅长方向与虚拟人十分契合,因而“顺势”进入该领域,在产业链内尚未形成“合力”。
其次,虚拟人之所以表现出“以技术为核心”的特点,是因为“数字虚拟人”的诞生有着太多的前提——其中最重要的,就是“数字”。正如前文所述,数字化的特点就已经决定了虚拟人的表现形式和商业化会紧紧围绕数字化进行。这就意味着,只有牢牢掌握技术,企业才有资格在这个行业生存下去。
虚拟人是直面真人的产品,尤其是虚拟人“人的特性”,使其中任何瑕疵都可能会引起消费者的不适。这不仅提高了虚拟人实用性的难度,还更加强调了虚拟人技术的重要性。市面上的技术看起来大同小异,但本质区别很大,就好比业内靠算法能把表情做得好的公司凤毛麟角。
因此,技术上的闭环仍旧是虚拟人企业的核心竞争力。在虚拟人真正火热起来之前,底层、硬件、数据库和算法可能分别掌握在不同的公司手中(这也是虚拟人市场乱的原因之一),就导致用户在做自己的虚拟人时往往要与几家不同的公司同时联系,这就使得虚拟人的成本和生产周期高居不下(所以有些用户选择亲自下场)。
不过,值得指出的是,目前已经有了一些正在做一站式解决方案的虚拟人企业,例如网易伏羲、创幻科技和拟仁智能等。整个2021年,国内新增虚拟人相关企业6.6万家,融资2843起,融资总额高达2540亿元,整体呈现井喷之势。但就像2015年突起的VR热一样,当时VR公司在现在的存活率甚至不到5%,没有核心技术和商业模式的虚拟人公司,生命周期可能都超不过一年。
生于数字化、服务于数字化
整体来看,虽然虚拟人的应用场景随着技术的进步还有待挖掘,但虚拟人需求的类型相对清晰,且十分广阔。在虚拟人的消费端,可以画出来这么一个四象限坐标系:其X轴零点左右分别为“C端”和“B端”;其Y轴零点上下分别为“身份型”和“服务型”,虚拟人几乎所有的应用场景都可以划分进去。
也就是说,虚拟人的应用场景,可以排列组合出四种类型:B端-身份型、B端-服务型;C端-身份型、C端-服务型。其中“身份型”与“服务型”的判断标准为:有无独立设定人格——有,大概率是身份型虚拟人,重点在皮;无,大概率是服务型虚拟人,重点在服务。
首先来看虚拟人市场的B端,在虚拟人的布局上,互联网巨头表现得尤为积极,对身份型和服务型虚拟人都有极强的需求。在身份型虚拟人方向上,字节跳动先是在2021年和阿里巴巴一块投资了乐华娱乐,推出虚拟偶像女团A-Soul以后,又在2022年1月投资了杭州李未可科技有限公司。无独有偶,例如芒果超媒推出了虚拟人“小漾”,在综艺节目《你好星期六》中与何炅进行互动;B站的“2233娘”同样非常出名。
这些身份型虚拟人商业模式重点在于IP运营,主要盈利来源于代言营销和直播带货,因为他们最重要的资产就是自身独特的外形和设定。在具体的商业应用中,B端-身份型虚拟人既可以用真人驱动,也可以用计算机驱动。例如虚拟偶像在直播过程中,要想对弹幕做出极为精妙、富有个人魅力的反馈,就必须以真人驱动,但外在仍旧表现为其虚拟身份;而在使用计算机驱动的时候,这时候虚拟人的行为都是预先设定好的,一般以影视特效、游戏和社交分身等为主要应用场景。
在服务型虚拟人方向上,需求一般是集中在对交互要求相对简单的场景中,像是新闻播报主持、文旅导航导游和金融客服等。例如浦万科集团推出了数字员工“崔筱盼”,负责处理应收/逾期提醒和工作异常侦测;浦发银行则与百度、原力联合推出了数字员工“小浦”;而新华网与搜狗联合推出AI主播家族“新小萌”、与腾讯联合推出数字记者“小诤”。
这些虚拟助手,部分地替代了简单的真人劳动,但效率却提高了成百上千倍,而且还不会疲劳、不会有负面情绪,只要有电就能无限地运行下去。在这样的情况下,虚拟人能够代替真人服务,通过预置的知识库、知识图谱以及用户自主设置触发条件等,对用户的基本诉求进行行为和语音识别,并以固定话术进行回应。
而在这种简单的重复交互之上,还有一种多模态的交互模式。在某个场景中,基于真人形象提供顾问、关怀、陪伴和事务处理等服务。其最大的不同在于提供了关怀感和真实感,能够应用于医疗健身领域、个性化交互AI助手和情感陪伴等场景。但对个性化、拟人程度和交互能力都有极高要求,因此这类应用尚处于较为前期的阶段。
同时,我们发现,B端的身份型和服务型虚拟人其实没那么泾渭分明,“身份”与“服务”之间也并不相互冲突,因此没有非常死板的规定,还是要以具体的使用场景而定。而且,身份与服务当中暧昧的空间也极大地提升了虚拟人本身的魅力。
值得一提的是,这些B端玩家有些并非单纯的用户,它们同时也是积极入场的玩家,像是腾讯、阿里、网易和B站,它们既是虚拟人的重度用户,也是推动虚拟人向前发展的投资者,往往采用的是自产自销的模式,当然这也符合他们一贯的追求把持产业上下游的秉性。
C端虚拟人市场在应用场景上,是比较狭窄的。在四象限中,C端-服务型几乎是一片空白,需求几乎都集中在身份型这一区域内。这丝毫不令人意外,服务型虚拟人归根结底是企业追求生产效率的产物,而C端用户大部分时间都作为消费者,并没有如此需求。但是虚拟人数字化的不受拘束的外在表现,能够突破人类自身形象的限制,强化消费者对于自我的表达。所以不光是A-Soul那样的正规军,我们还能够看到数量极为庞大的“散户”纷纷转型虚拟主播。
他们的虚拟人制作价格往往从数千元至数十万元不等,与B端用户定制虚拟人动辄数百万元甚至更高的规模完全不能相比,承制人的硬件设备和制作水平也大多不比专业团队。但考虑到他们是如此广泛地存在着,所以我们完全能够意识到,将来虚拟人产业进一步发展后,这些C端消费者将会迸发无穷的潜力。
将虚拟人的消费端划分成四个类型以后再进行分析,我们能够清晰地发现,虚拟人消费重B轻C,但C存在着巨大的长尾市场。同时,在B端,身份型和服务型虚拟人都拥有广阔的应用场景;而在C端,身份型虚拟人应用较广。之所以会产生这样的特点,是因为B端用户追求效率、追求增值,而C端消费者一般不需要虚拟人来提供简单的重复劳动,而需要能够突破自身形象局限的身份型虚拟人(C端消费者的虚拟人一般以自身形象或喜好为设定基础)。
新世代:与虚拟人共生
虚拟人的概念是如此波澜壮阔,以至于一篇几千字的文章根本不可能将它阐释清楚。但我们仍然能够从虚拟人的现状判断,将来必定是一个与虚拟人共生的新世代。
虚拟人不仅是未来社交的入口,更是人在现实之外虚拟空间的延伸。自从互联网技术诞生的那一刻起,现实空间就与数字空间发生重叠,虚拟人不过是在此进一步的发展罢了。从这个角度出发,虚拟人的出生、发展和完善是必然的。
虚拟人虽然是必然的趋势,却并不是万能和完美的事物。虚拟人的主动性仍旧由“人”来发挥,不管是由真人驱动的身份型虚拟人,还是由计算机驱动的服务型虚拟人,他们的底层逻辑归根结底还是“人”。前不久A-Soul的塌房事件,和历来众多“毕业”的虚拟偶像或许也在向我们暗示,绝对不会塌房的完美虚拟人可能根本就不存在。
在文章末尾,暂时地跳离出虚拟人的商业范畴,来反观虚拟人本身,我们会发现,人类如何与虚拟人——这一人类自身的造物——共处,才是“虚拟人世代”的终极命题,商业化只是其中一部分罢了。