文|陈根
今天,越来越多的虚拟人正我们的日常生活中落地应用。可以说,随着数字技术和智能技术的进步,虚拟人是必然到来的一个未来趋势。
中国人工智能产业发展联盟发布的《2020年虚拟数字人发展白皮书》中对虚拟人有明确的释义:虚拟人是指具有数字化外形的虚拟人物,依赖显示设备存在,并且拥有人的相貌、人的举止以及人的思想。
简单来说,虚拟人就是“数字人+人格”。值得一提的是,虽然当前,各行各业的虚拟人层出不穷,但大多数虚拟人,依然只是利用信息技术实现的人形外观的数字人形象,并不具有人格,我们离最终形态的虚拟人也仍有距离。
那么,怎么样赋予虚拟人人格呢?或者说,虚拟人的最终形态,究竟是什么?
没有人格的虚拟人
目前的虚拟人,其实大致可分为两类:2D虚拟人物和3D虚拟人。
其中,2D虚拟人是根据真实图像建模的,与真人非常相似。服装、发型等外观不支持自由修改,形象相对固定。2D虚拟人不能在3D场景中使用,不能在3D中呈现,也不能在VR,AR和游戏中使用。
3D虚拟人则具有多种风格,可以自由地创建风格化的外观。它具有广泛的应用场景。主要应用场景包括内容创建、IP创建和创意内容创建。它具有多交互、多形式、自由修改的特点。它可以与真实场景匹配,以进一步增强逼真的效果。
从技术角度来看,2D虚拟人一般采用静态扫描技术制作,即使用40-60台摄像机拍摄真人全方位的照片,并根据照片的光线和角度进行矩阵扫描,从而在软件中呈现出2D立体图像。静态扫描技术只需要拍照和少量所需数据,即可低成本创建2D虚拟人体图像。而今天,我们看到的越来越多走进了直播间24小时直播不休息的的虚拟数字人,其实更多的是2D虚拟人。
当然,相较于2D虚拟人,3D虚拟人体建模对软件和技术有更高的要求,采用动态扫描技术,通过人脸特征识别、空间变换分量、模型重建分量、骨变形分量等方式,采集光影效果或照片数据,纹理融合组件等合成多模态3D模型,除了真实图像外,还包括卡通,二维等类型。
值得一提的是,今天,尽管随着技术的进步,虚拟数字人的成本也有所下降,特别是2D视频类虚拟人,但对于3D虚拟人来说,技术的有限和成本的高企依然是许多企业面临的问题。
来自中科院深圳先进技术研究院智能设计与机器视觉研究室的信息显示,制作、训练虚拟人的技术还不够成熟,尤其是3D成像设备、后期制作开发等成本居高不下,建模效率相对较低。同时,虚拟人的算法性能有待进一步提升,特别是实时面部表情捕捉与还原的精准度亟待提高。另外,当前人机交互相关技术也还未成熟,虚拟人更多承担辅助角色,无法独立参与实际意义上的工作。
当前,制作3D虚拟人的价格,便宜的有几万元,贵一些的需要上百万元,更精细且并发要求高的,花费上千万元的也有。根据蓝色光标《元宇宙营销工作手册》,仅设计一个虚拟人形象就要花费10-100万元,后续的内容制作和智能驱动研发还需持续投入。
价格高昂的同时,虚拟人产能也不足。当前制作虚拟人,大部分仍采用3D建模+动作捕捉,这种传统的方式,虽然可以生产出电影画质的虚拟人,精致细腻,但成本依然很高,无法生产更多虚拟人。
可以说,当前的3D虚拟人的开发,更多的还是人们对新技术、新业态的一种好奇、验证和尝试。更重要的是,目前,不管是2D虚拟人,还是3D虚拟人,都还不是最终形态的超级自然虚拟人,不仅与我们的真实生活隔着一个次元的距离,也并不具备真实的人格。
不可持续的中之人
显然,想要让虚拟人拥有人格并不是一件容易的事。
在通用人工智能出来之前,“中之人”似乎是目前最好的虚拟人技术方案。所谓中之人,就是在虚拟外表背后的真实扮演者,他们的动作会被捕捉并映射在虚拟人上。虚拟外观加现实的人格,这才使人们造出了真正的虚拟人。但问题是,由中之人扮演的虚拟人,并不具备可持续性。
2022年,由字节跳动、乐华娱乐倾情打造的国内虚拟偶像女团A-SOUL也忽然宣布,旗下成员“珈乐”进入“直播休眠”,终止日常直播和绝大部分偶像活。
看起来,A-Soul是突然宣布的“休眠”,但实际上,解散的暗流早已涌动。在A-Soul宣布解散之前,A-SOUL成员,国内人气最高的虚拟主播嘉然在B站直播了自己的生日会,在这场不到3小时的直播里,她总共收到了粉丝259万的打赏,创造了国内虚拟主播单场直播收入的新纪录。然而,这259万的收入,嘉然的中之人却只能拿到零星一点。
根据知乎网友惊蛰的爆料:“粉丝每次送她们的打赏。50%给了B站,49%给了幕后团队,竟然还有1%,能给到她们本人”,“不是总额的1%,是去掉B站部分后,剩下部分的1%。实际是粉丝支出额的千分之6”。换言之,B站粉丝续费一个138元的舰长,中之人可以拿到的仅有6毛钱。
此外,在“休眠”公告发出后,大量关于中之人珈乐的私密网易云、B站和豆瓣账号的截图在粉丝之间开始传播。在B站和豆瓣,“珈乐”转发着珈乐的切片和二创,一定程度上参与到对A-SOUL的讨论中;而在网易云平台,她不断地宣泄自己的负面情绪,包括“在训练中伤到了胸椎”、“动捕服划伤了大腿”等等身体上的伤病,以及“被领导辱骂”、“在凌晨被叫醒”等工作中的问题。这些动态勾勒出了一个与人们认知完全不同的“珈乐”和她极度糟糕的精神状态。
最直接的薪资问题之下,当然还有运营过程中的种种乱象。比如官方强迫成员间营业,逼迫成员续约,续约了就要面临更加严苛的工作环境,训练出一身伤病,甚至还有职场霸凌等林林总总的问题。
所有的爆料都指向同一个答案:这些看似生活在光环里的虚拟偶像,背后的中之人的处境,甚至不如一个普通的打工人。
无独有偶,著名的日本虚拟偶像“绊爱”,因为拥有四个不同的中之人而遭到粉丝的极力反对,导致如今宣布“无限期休眠”。
虚拟男团动画导演强项曾经做过一个通过中之人实现的虚拟主播项目。在主播生日当天,公司收到了许多由粉丝送出的真的鲜花、口红、化妆品等真人才能用的东西。即便他们的偶像是虚拟主播,但他们其实很清楚自己喜欢的是虚拟外表下的中之人。这个事情也让强项在重新反思自己的产品逻辑之后,中止了项目。
可以看到,中之人技术的确在一些情境下满足了用户对陪伴的需求,但它并没有真正解决虚拟人的核心问题,即如何赋予虚拟人独立的人格和情感。今天,虚拟人的外表虽然是一个吸引人的因素,但却不是虚拟人的核心属性。
“皮”和“魂”之间的平衡是关键。虚拟人的外表可以起到吸引用户的作用,但真正让用户留下来并建立情感联系的是虚拟人的内在特质,包括对话能力、情感理解、人格塑造等。甚至从功能性和情感上来看,虚拟人的“魂”比“皮”更加重要。正如电影《她》一样,一个真正拥有灵魂的AI,即便只有声音没有外壳,同样可以为用户带来心灵上的安慰。
虚拟人的最终形态
那么,怎么样赋予虚拟人人格呢?或者说,虚拟人的最终形态,究竟是什么?
从本质来看,虚拟人依然是一项“仿人”的技术,那么,想要虚拟人真正带来像人一样的体验,其实只有两个方法——把人带到虚拟空间去,或者把虚拟人带到现实空间来。前者对应的其实还是元宇宙的市场,而后者对应的则是机器人或全息投影等技术。这才是虚拟人产品的最终形态。
那么,怎么把人带到虚拟空间去?其实原理很简单,就是我们在数字世界打造的一个真正的数字孪生人。当然,数字孪生人不仅仅是通过计算机、深度学习、类脑科学、数字孪生等等合成的一个具有人类特征的虚拟形象,更重要的是具备更高级的智能和自主互动能力。
也就是说,数字孪生人将会成为我们在元宇宙的虚拟角色,并且是不受空间与时间限制的可以在这个虚拟环境中活动,数字虚拟人甚至可以脱离我们的物理躯体的寿命限制,可以在虚拟世界中实现永生。而实现数字孪生人的背后,需要的是则软件版的大脑、基于软件而改变的自我、精神意义上的双胞胎的技术支持。
美国艾伦研究所的科学家早在2003年就开始着手建构人脑以及非人灵长类大脑的基因表现图谱联结图谱。2010年起,美国国家卫生院以及数所大学也联合展开了“人类大脑联结计划”,共有一千两百位健康受试者(包括数百对双胞胎以及他们的非双胞胎手足)接受了大脑造影、基因定序以及行为检测。
德国与加拿大的科学家也在合作进行“巨脑计划”,目前,他们已经建立了一个来自六十五岁女性的三维大脑模型,其高达二十微米的分辨率,让单一细胞都几乎无所遁形。另外,自适应可塑伸缩电子神经拟态系统(SyNAPSE)计划则希望利用神经突触模拟芯片来建立一个数位大脑。
2014年,IBM成功发表了仿人脑芯片。该芯片拥有一百万个“神经元”以及2.56亿个“突触”,可以短暂模拟大脑活动。同年,日本的“京”超级计算机(K Computer)使用八万三千个处理器,也成功模拟了人类一秒钟脑部活动的百分之一。2013年,欧盟也展开了“人脑计划”。这项十年计划拥有十三亿美元的资金,旨在通过尖端的计算机工具来绘制一张精细的人类脑部活动地图,并希望利用这些信息来建造一台能够模拟人脑网络结构的超级计算机。
或许在未来,当拥有意识克隆的生物学原型躯体死亡时,虽然克隆的意识也会想念它的躯体,但它并不会感觉到躯体已经离世,这就像截肢的患者也会想念自己被截肢的部位一样,但是假若有合适的假肢,他们仍然能够很好地适应生活。当越来越多的人通过意识克隆在虚拟世界打造出具有意识的虚拟人时,人类也在延续自身——即便是以意识克隆的形式。
虚拟人的另一种终极形态,则是由AI驱动,再由全息投影投射到我们的现实世界,与我们真实的交互。这需要AI具有复杂的自我学习和情感理解能力,能够准确理解人类语言的含义、情感和背后的意图。再通过全息投影技术,高度智能化的虚拟人就可以以高度逼真的形象呈现在我们周围的空间中。这将为交互增添更多层次的现实感,让人们能够在真实世界中与虚拟人进行面对面的对话、合作和探讨。虚拟人不再仅仅是一个数字化的存在,而是在我们的视野和现实环境中实实在在地存在着。
当然,虚拟人的人格和最终形态是一个复杂且有待探索的领域,但随着技术的进步和社会的变化,可以预见的是,在不远的未来,虚拟人将会在元宇宙中成为人类的数字伙伴,或者在物理世界中与我们共同生活。