观点:数字人被百度玩明白了
作者 | 郭照川 编辑 | 麻吉
来源:霞光社
一直以来,数字人被认为是元宇宙的入口。
7月6日,在2022百度世界大会的预沟通会上,一位红发少女率先登场,以兼具“科技感”和“专业度”的虚拟形象,在此次会议全程担任了关键的串词、控场、提问和嘉宾介绍工作。
实用型虚拟数字人正在走进大众视野,百度旗下数字人度晓晓就是其中之一。虽然她的“主业”是百度App的虚拟AI助手,但度晓晓同时又被赋予了实用性的“多重身份”:
她既是参加过国内顶尖艺术院校毕业展的“AI画家”,又是成功挑战过高考命题作文的“AI作家”,还是创作过歌曲、接过广告、发行过MV的“AI偶像”。
作画、谱曲、做主持、写作文、陪聊天......百度硬核技术支持下的数字人特有的创造性和交互性,让人不得不相信现实世界与“元宇宙”的边界正在被打破,数字人则将成为与日常生活密切联结的有力辅助。
拥有个性化交互能力的数字人,真的存在吗?元宇宙发展到现在,最先进的数字人又被赋予了哪些意想不到的能力?
图源:2022百度世界大会预沟通会
从二次元到“N次元”
谈到虚拟人物,难离“二次元”。
从初代虚拟偶像初音未来,到许多传统行业的数字代言人形象,基本上都是由二次元人物设计脱胎而来。
对于“二次元”来说,创造是最难的。虽然这些数字人外观设计得十分完美,但应用路径也非常单一,哪怕是超写实数字人形象,都脱离不了无法实现交互、本身无法创造的局限。
而在今年的西安美术学院的本科毕业展上,有一系列命名为“无界”的画作,打破了传统数字人的创造“结界”。
这一系列作品的创作者,是百度数字人度晓晓。虽然画面由AI数字人所绘,但也被美院教授认证为 “已经达到了本科美术生的基本要求”。其商业价值同样不可小觑,这些绘画数字藏品其中的四幅,在获展出之前就已经卖出了超过17万元的高价。
今年6月7日高考结束后,度晓晓又以全国新高考Ⅰ卷作文《本手、妙手、俗手》为题,在40秒的时间内完成了审题、逻辑、创作等步骤,创作出了40多篇不同的高考作文,还被高考研究专家申怡老师,评判为可以打出48分的“高分作文”。
不久前,“#国内首个可交互虚拟偶像度晓晓”还登上了热搜。她作为百度数字人作词、编曲了歌曲《每分 每秒 每天》,还和龚俊数字人一起举办了新歌发布会直播。知名乐评人耳帝也认为,度晓晓背后的人工智能创造内容确实可以“提高创作效率、降低门槛、辅助创作”。
在AI内容创作能涉及的领域内,度晓晓几乎无处不在,于是她也被大家笑称为元宇宙时代“最卷数字人”。除了能写会画的“数字才女”度晓晓,百度旗下另一位数字人希加加,也吸引了不少关注目光。
希加加一度被称为“第一个吃到汉堡的数字人”。在成都和大连的繁华街头,希加加成为数字人新品推荐官,从麦当劳门店上方的巨大屏幕中闪身而出,抓住了一只大汉堡,一瞬间虚拟与现实的连接让人过目难忘。
图源:麦当劳
她不仅成为了“00号太空数字乘客”,登上了我国第一艘数字载人飞船,还接下了和Qee熊、FE赛车一起合作设计的许多任务,俨然像一个赛博朋克的新员工了。
目前数字人真正落地后,展示出来的实际使用价值,已经超出了我们想象中的认知边界——从被动的二次元单薄形象,演变为能备实理解能力,能实现创意作品的自动生成的数字人物,给世界带来越来越多的惊喜。
从被设定问答程序的单一“二次元”,到富有创意、适用场景更多元的“N次元”,度晓晓和希加加等百度“AI数字人家族”的出场,让数字人赛道的前景变得更加惊艳。
告别“虚火”,铺开实际应用价值
随着“元宇宙”和“Web 3.0”概念崛起,数字人成为当下最热的风口之一。
根据艾媒咨询数据,2021年中国数字人产业市场规模和核心市场规模分别达到1074.9亿元和62.2亿元,预计2025年将达到6402.7亿元和480.6亿元。光是2021年全年,虚拟数字人相关投资就有16笔。
2022年第一个月,虚拟人领域百起融资金额累计已经超过了4亿元人民币。曾经推出知名虚拟IP“翎”的魔珐科技,也在今年4月刚刚完成了B轮和C轮共计1.3亿美元的融资。
伴随着市场对数字人的极高期望,也出现了很多质疑声音。
许多人认为目前元宇宙以及数字人尚处在非常早期的阶段,反而是风刮得太猛,导致只剩下“概念横行”“一把虚火”。此类看法并非空穴来风,当下依然存在着许多行业隐忧,例如数字人AI驱动技术不达标、实际应用场景不足、制作成本太高等等。
然而,随着数字人的应用场景和技术提升,此次百度数字人也展示出了其特殊性:
度晓晓和希加加与市面的上其他数字人的不同,她们最大的突破点就在于已经实现了“可交互”——无论是度晓晓还是希加加,都可以在多样化的实际应用场景中高度拟真,实现像真人一样互动。
度晓晓已经具备了对话能力。闲来无事,用户可以像真人一样随时和她聊天,或者让她唱歌来听,独特的情感交互系统让她像一个随时在身边的虚拟助手,又像一个真实存在的可靠伙伴。
图源:百度APP
甚至面对不同的人的交互方式,个人性格和爱好,度晓晓也会呈现出不一样的理解和反馈。也就是说,在你身边的数字助理度晓晓,无时无刻都和你共同处于向更优秀的自己的进化之中。
除了对话,度晓晓还能真正做到“理解”用户,区分闲聊与搜索意图,满足用户提出的更多生活需求。例如当你告诉度晓晓“想要看电影”时,她会像朋友一样给你推荐影片。而如果你的需求是“想要喝咖啡”,她甚至能自动跳转到咖啡小程序,方便你下单一杯咖啡外卖。
虚拟朋友穿插进整个生命过程的陪伴,满足能交互、有回应、满足多种功能需求,才是理想中数字人的“最终形态”。
数字人之战:大厂实力图鉴
各家互联网大厂,纷纷在数字人领域疯狂加码。
不久前,字节跳动收购了虚拟社交公司“波粒子科技”,也是看上了其拥有的虚拟人物形象自定义核心技术,意在为元宇宙再添一张牌。近年来专注于智能语音和AI技术的科大讯飞,也在去年年底上线虚拟人交互系统1.0,试图拓宽人工智能生态。
事实上,百度在很早之前喊出了“All in AI”的口号,2020年就已经筹备上线的度晓晓,诞生于元宇宙浪潮发端之初,一开始就具备了AI驱动下的视觉识别和语音识别能力,背后百度又有AIGC(AI generated content,人工智能创造内容)内容技术的支持。
百度旗下的虚拟人家族,在互联网大厂的元宇宙赛道竞争中的优势也很明显。
根据第三方机构发布的榜单,百度凭借多年以来语音、视觉等AI能力的积累,在数字人综合实力方面排名第一,尤其在数字人大规模落地领域,有着强大领先实力。
一方面,百度数字人背后拥有知识增强大模型“文心大模型”。
度晓晓、希加加都是具备AIGC能力的数字人,度晓晓创作的AI画制成的数字藏品,在百度上线24小时内就卖出了8700多份。而这种平均每幅画用时只需要数十秒的数字人创作,完全颠覆了当下已知的内容生产模式。
这样令人惊异的AIGC高效输出能力,则是依托于百度文心大模型。数字人的绘画创作技能,靠的就是文心大模型-跨模态图文生成模型ERNIE-ViLG。
另一方面,百度AI算法得到突破,使得数字人的制作成本极大收缩,降低了批量生产数字人的门槛。
百度集团副总裁袁佛玉,在2022百度世界大会的预沟通会上也表示,“随着百度AI算法的突破,能让数字人制作成本十倍、百倍地下降,还能让数字人生产周期,从动辄几个月,缩短到小时级别。”
这一切,都让数字人大规模应用落地,甚至让实现“人均一个数字人小助手”的元宇宙未来理想成为可能。这也正是今年百度世界大会的主题“AI深耕,万物生长”所阐释的,在出行、产业、生活等领域,人工智能都将发挥前所未有的作用。
7月21日,度晓晓、希加加等百度AI数字人家族成员,都将深度参与到百度2022世界大会之中。
今年的百度世界大会,更像是一场对于尖端人工智能技术的一次创新式全民科普。拥有强大创造实力,具备陪伴和交互能力,且能实现可控成本批量复制的数字人,已经为我们打开了元宇宙的大门。
Band Protocol Integrates X Layer to Expand Cross-chain Interoperability and Real-World Data Access
Band Protocol integrated with X Layer to enable a unified experience and smooth interactions across ...
The Dawn of Decentralized Shopping: Inside Web3Bay’s Vision for E-Commerce
Explore Web3Bay’s transformative impact on online retail through blockchain innovation. Dive into it...
Vottun and Arbitrum Unite to Advance Blockchain Scalability and Interoperability
Vottun has announced its integration with Arbitrum to provide improved scalability, fast processing,...