虚拟世界数字人的历史变迁:从小众走向共生

        元宇宙的风潮,助推着各种各样虚拟世界数字人频繁出现在广大公众我们的视野,娱乐休闲、社交关系、营销等市场领域充分发挥其价值。

        去理解虚拟世界数字人时,需对其词组通过拆分。

  • 虚拟世界”对应物理,特别强调展示方式,包含图片、视频、直播等方式存在于电子屏中,如 App小程序、软硬一体信息显示设备及。元宇宙下,VR设备及与全息投影也将成为最重要的存在形式。
  • 数字”特别强调技术方面。虚拟世界数字人资源优势多项技术存在包含建模驱动、视觉部分设计、语音可识别、彩色图像可识别,和多模态技术方面与深度去学习等,有关技术方面逐渐成熟成为其发展中最重要的助推力。
  • 人”指的高度拟人化。外在上,虚拟世界数字人有着特定的五官、身高和体重,更有甚者能被刻画出出毛孔和细纹。内在上,虚拟世界数字人有远非正常地人的情商和三观,能与人沟通交流和互动。

        综上,虚拟世界数字人指存在于非物理全世界中,由计算方法机图形学、图形色彩渲染、连贯动作捕抓、深度去学习、语音再合成等计算方法机手段创造出及使用,并具有独特多重人类明显特征(相貌明显特征、人类表演中能力方面、人类交互能力方面等)信息综合自然产物。但从虚拟世界数字人发展的历史的看,虚拟世界”数字”和“人”并不同步发展中,技术方面是最终决定虚拟世界数字人的发展中层度的重要核心外部因素。因而,本文将从技术维度,讨论虚拟世界数字人发展脉络。此前,零壹智库、01区块链联合《陆家嘴》杂志针对虚拟世界数字人发布了第一期虚拟世界数字人TOP50排行榜”虚拟世界偶像 TOP30和虚拟员工 TOP20也欢迎关注。

        一、虚拟世界数字人的萌芽期与初步发展

        早在20世纪 80那个年代,将虚拟世界人引入到生活现实全世界的一些想法了会出现。

        1982年,动画片《太空要塞》中的女扮演林明美作为虚拟世界歌姬出道,其专辑也失败打入后来的国内知名音乐排行榜。日本媒体抢先提出了虚拟世界偶像”荣誉称号。

        1984年,全世界首位虚拟世界影片演员“MaxHeadroom诞生了,出演影片,并拍摄数支广告,英国妇孺皆知。

        1998年,英国虚拟世界乐队 Gorillaz会出现,由主唱 2-D贝斯手 MurdocNiccal吉他手 Noodl和鼓手 RusselHobb四位虚拟世界扮演共同组成。

        此时,虚拟世界人概念先行,给与虚拟世界正面形象以立体化化人设,并带入普罗大众我们的视野。但受制于技术发展,数字化”这个阶段并不明显。打造出虚拟世界人的技术方面以手工绘制为主,人物正面形象以 2D卡通的方式展示,展示形式以事先完成的音频和视频为主,并不不具备实时获取交互基本功能。

        图:初代虚拟歌姬“林明美”

        进入 21世纪,虚拟世界人的数字化明显特征渐渐较为明显。

        正面形象已创建上,虚拟世界数字人就从手绘转向 CGComputGraphic计算方法快速机动画)和连贯动作捕抓等计算方法机技术。

        传统形式 CG技术方面脱胎于游戏行业,主要原因基于专业及 CG应用软件通过相关的建模、动画制作完成和渲染等,也可以从外形、眼神到连贯动作方面还原真实真人的影视级效果。

        连贯动作捕抓技术方面信息来源于电影工业,即进行红外线摄像机、连贯动作深度分析该系统,透过由受试者身上反光球中执行反射回去的光源,将运用比较摄像机拍摄到2D影象转换成 3D相关资料。

        2007年,日本虚拟世界歌手“初音未来”诞生了与流行的成为虚拟世界数字人在该阶段最重要的里程碑。

        初音未来的虚拟世界正面形象采用传统 CG和连贯动作捕抓技术方面。连贯动作捕抓技术方面的助力下,初音因为未来也可以直接把采用传统人类的眼神和动作,借助 CG技术方面,能对连贯动作捕抓可生成的人物骨骼”通过“无痕”对接。初音未来的一颦一笑都与人类更为逼近。

        作为虚拟世界歌姬,初音未来的歌喉基于 VOCA LOID电子音乐制作完成语音再合成应用软件)采样于日本声优藤田咲,创作者就可要图片描述歌词和旋律,就能系统自动行成歌曲。此基础上,制作完成方和粉丝为初音未来创作了超 10万首歌曲,包含红遍大街小巷的甩葱歌》等。

        2010年 3月 9日,初音未来在日本举办名为初音未来日的非常感谢祭”初音之日”Miku\’sDai这是史上首场 3D全息投影演唱会。全息影象成像面积超过 15平,由 4块全息投影膜拼接而成,并采用传统高流明的投影,配合好三维动画其他内容投射到全息投影膜上。该技术“重生”初音未来,其首次以 3D正面形象现世。

        图:初音因为未来非常感谢祭

        从形象创建、演唱形式到互动方式,初音未来在数字”上垮了一大步。诞生了仅五年,其已经创下了超 100亿日元的经济效益,正式了掀起虚拟世界偶像风潮。

        这个阶段,国外也诞生了虚拟世界偶像。2001年,中国首位虚拟少女“青娜诞生,以全数字、3D动画和动捕技术方面已创建而成。2012年,洛天依的正面形象部分设计首度正式公布,至今成为中国最著名的虚拟世界偶像,并出现在春晚、奥运会盛大开幕式上,成为真正的国产偶像。

        

二、2D转向 3D可怕谷效应凸显

        

        2016年,一位巴西和西班牙混血女孩 LilMiquela引发普罗大众热议。

        和健康的小麦色肤色、长着浓眉和雀斑、扎着标志性的丸子头和齐刘海,和新锐时尚潮流的穿搭、十分丰富的社交关系的日常,LilMiquela很快在Instagram被吸引大量地粉丝。但其略带建模痕迹的照片引起了一场“真伪辨论”很多粉丝我相信她真实的存在人物,只是修图“狠”点。直到黑客们入侵了账号,才最终确定了由 3D电脑动画公司 Modelingcaf制作完成的虚拟世界人。

        LilMiquela具有独特十分非常强烈的性格方面明显特征。用自己的实名账号,互联网上声讨跨性别者平权,与 LGBT社会群体站在同个阵线,需要支持种族平等自由,还与虚拟世界人女友秀恩爱,并再后来正式宣告提出分手。2018年,LilMiquela与特朗普、蕾哈娜等人一同被美国《我们的时代》周刊列为“25位最有影响力的互联网人物”

        LilMiquela会出现让人直呼惊呆了虚拟世界数字人再次受到关注更多。相同于 2D动漫形象,3D拟人形象旁边捕和身体机能建模对建模提出了更高要求,需以及使用三维建模技术方面可生成正面形象,相关信息维度增加,所需的计算方法量更大。另外,这个阶段虚拟世界数字人的个性独特明显特征凸显,进行在社交关系平台上发表自己的一些想法,渐渐不具备社会影响力。

        图:LilMiquela右)

        随之 3D拟人形象的会出现,可怕谷效应就会出现。

        1970年,日本自动化机器人专家森昌弘提出可怕谷理论,因为自动化机器人与人类在外貌、连贯动作上相似,因为人类会对自动化机器人产生正面的以及情感。当自动化机器人与人类的十分相似层度达到一个特定程度的时,一点点的区别都要显得十分刺眼的光芒,并带来负面情绪和反感情绪。而当自动化机器人与人类的十分相似度继续上升,人类对其以及情感会再度回到背面。

        虚拟世界人不但需以假乱真的建模技术,还需要在眼神、连贯动作和交互能力方面上提升。

        比如,当虚拟世界人面对自己镜头笑容,嘴角上翘的幅度、眉眼和皮肉之间联动等细节都需被照顾到来说所有动态的拟人虚拟世界人来说,细节的不到位通常带来说不出的身体僵硬和古怪。因而,可怕谷效应下,不但建模技术方面需能够实现拟真,色彩渲染和交互上也提出了更高要求。

        色彩渲染和交互能力是个“此消彼长”过程中。游戏中的扮演更为特别强调交互能力方面,色彩渲染出的扮演仿真性较差,而影片色彩渲染出的扮演能达到肉眼分不出真假的境界,但是不不具备交互性。

        2018年 5月 30日,腾讯对外公布了一个名为“Siren深入研究项目中。这是由腾讯、EpicGameCubicMotion和 3Later企业合作中打造出的一个虚拟人物。相同于通常虚拟世界人,Siren色彩渲染的真实的性和交互性之间找到达到平衡,打造出了不具备实时获取交互能力方面的数字虚拟世界人。

        Siren所有的连贯动作眼神都由实时获取捕抓和实时获取色彩渲染行成。操作方式者需将一套特制的设备及戴在头上,这一设备及会实时跟踪 200多个脸部明显特征点,再把这些明显特征点实时反映到该系统结构的3D面部建模上,最后呈现出为以每秒 60帧输出的连贯动作眼神。整体捕抓过程中会在15毫秒内完成,基本上不会有什么延迟。

        图:虚拟世界数字人Siren

        2021年 6月,由新华社、腾讯联合打造的全球市场首位数字航天员、数字本报记者“小诤”会出现。小诤在不到3个月的时间——被打造出来,相较 Siren制作完成周期大大缩短了一半。这过度依赖于一套高效人脸制作完成管线 xFaceBuild进行将建模、绑定、动画等两个环节列入平台并统一解法,大大大大缩短了制作完成的流程。

        毕竟,从整体成本上去讲,虚拟世界数字人的整体成本开支十分大。比如团队在小诤”脸上种了10万根面部汗毛,这对机能的消耗掉是极为规模庞大。昂贵的规划建设整体成本使得虚拟世界数字人难以在以及商业市场领域大规模落地。

        图:虚拟世界数字人“小诤”

        

三、AI技术方面的文中带来大规模以及商业化应用

        

        随之虚拟世界数字人技术的发展中,AI技术方面成为制作完成和驱动虚拟世界人重要的工具使用。AI技术方面的需要支持下,数字人制作完成过程中得以简化,深度去学习算法再次突破,提高虚拟世界人语音表达、语义去理解和对话等能力。

        2022年中国虚拟世界人相关产业发展中白皮书》中,数字虚拟世界人被分为下述两种:

        狭义虚拟世界人(Metahuman指通过 CG建模、手绘形式完成4虚拟世界人前期制作,进行牵头动捕、面捕技术方面能够实现驱动的虚拟世界人。

        超级无敌自然而然虚拟世界人(Albe指主要通过 A技术方面“一站式”完成4虚拟世界人的已创建、驱动、其他内容可生成,并具备感知、直接表达等无需人工操作干涉的系统自动交互能力方面。

        近五年,AI虚拟世界数字人生成和驱动上展现了较高的效率方面。企业级 AI数字人数字经济发展“新动能”中,跟据数字人拟人化程度,和其生产制作完成的系统自动化整体水平两个维度,数字人被分作五个等级。

        图:数字人L1-L5一级(商汤智能相关产业深入研究院)

        A I迅速发展中和融入行业的态势使得虚拟世界数字人融入各个行业的发展中成为可能会。

        报告中指出,L4和 L5一级的数字人不但不具备高度的拟人化呈现,正面形象、连贯动作和智力层面都更逼近于真人水平,能听懂、看懂、有记忆、自学习,与人通过自然而然交互;同时,制作完成流程中也融合了大量地的人工操作智能算法技术方面来提高数字人的其生产效率方面,大大降低了数字人的制作完成整体成本。

        目前仍然,相互融合 AI打造出数字虚拟世界人以相互融合行业应用于了成为最重要的大趋势。

        以科大讯飞为例,基于其自主研发的语音再合成、可识别、自然而然语言和文字、彩色图像处理方式等技术,创新突破发布最新虚拟世界可生成、驱动、交互技术方面,搭建了科大讯飞 AI虚拟世界人交互平台。该平台也可以提供更多虚拟世界人形象构建、AI驱动、API接入、多场景问题具体方案,能够实现一站式的虚拟世界正面形象打造出提供服务。

        目前仍然,虚拟世界数字人在各行业已经得到广泛地应用于。特别是娱乐休闲和传媒行业,虚拟世界偶像和虚拟世界主播赛道非常火爆,这类虚拟世界数字人也羸得观众深受。金融、和教育、医疗、政企等行业,虚拟世界客服、虚拟世界王老师、智医助手、数字员工等也开始出现。

        

四、元宇宙催生数字虚拟世界人新赛道

        

        2021年下半年,元宇宙点燃了整体市场。元宇宙作为虚中有实互相交融的空间,带来了无尽的想像力,而进入元宇宙的第一步为打造“化身”过去的,互联网下的化身更多是2D彩色图像,而元宇宙中的化身将是千人千面”代表用户的一个人正面形象。

        作为人类在元宇宙的车辆通行证和身份标识,元宇宙带来了数字虚拟世界人新的基本形态—虚拟世界化身。

        至此,数字虚拟世界人能按应用于场景划分为两类,一类是身份型虚拟人,如虚拟世界化身和虚拟偶像,这类虚拟世界人拥用完全的独立身份,被赋于具有独特个性独特的自由人格明显特征。另一类是提供服务型(基本功能型)虚拟世界人,这类虚拟世界人能投入其生产和服务,以虚拟化身的正面形象中执行偏标准化的任务。

        图:数字虚拟世界人分类

        随之元宇宙的发展中,打造出虚拟世界化身的消费需求有待释放出,为虚拟世界数字人带来了.C端市场的以及商业其价值。

        随之彩色图像可识别技术方面,人体可识别算法的快速进步,价格昂贵的光学动捕设备不再是建模和驱动的必备工具使用。普普通通摄像头、传感器等设备及也能够支持“小白”已创建人物正面形象和通过精准的驱动。目前仍然,用于可生成虚拟世界数字人的工具使用化平台了会出现。

        以线上社交关系提供服务公司 Spatial为例,其推出的VR化身已创建平台需要支持任何人在几分钟内完成4虚拟世界化身已创建。用户能进行互联网摄像头拍摄、或是从设备及上上传自己的照片,用于已创建一个基于用户外貌的3D自定义 VR头像。后,用户也可以自标准定义肤色外观造型,或是修改头像衬衫的的颜色。

        除了头像的仿真性,平台还需要支持用户展现与他人互动时习惯的肢体连贯动作。用户也可以进行 VR耳机中的手部追踪功能,需要支持化身跟着用户的连贯动作,展示用户的手势和身体形态。来说也没 VR设备及的用户,平台嵌入了相同肢体连贯动作或舞蹈动作,用户能进行键盘按键,展示他在肢体上的风格特点鲜明特色。

        图:Spatial平台

        另外,面捕、动捕技术方面及设备的家用再打开了创作者市场。

        所有动态捕抓技术方面帮组人们能够实现了人的实在身体机能向虚拟世界化形象转移的互动过程中,这样的交互形式重新开启了创作者的肉身与虚拟世界偶像身体机能的虚中有实触达通道,也是人与机器之间的一种新的互动方式。

        以 FaceRig为例,一款应用于于手机和电脑上的虚拟世界主播软件,需要支持用户将自己的脸变为各种各样卡通正面形象,并提供脸部眼神追踪,真实的展示主播的眼神和动作实况。

        斗鱼平台上,很多主播都以及使用这类应用软件来打造自己的虚拟世界偶像。比如,斗鱼直播平台中拥用干万粉丝的一条小团团”借助面捕和所有动态捕抓技术方面,主播以可爱的虚拟世界正面形象实时获取所有动态地投射在屏幕上。搭配着其独特的声,其收获了大量地粉丝。

        借助脸部捕抓和所有动态捕抓技术方面,一个人创作者能能够实现本身正面形象或基于本身外观造型明显特征的虚拟世界化转移,并打造出对外交互的虚拟世界数字人形象。

        图:一条小团团卡通正面形象

写在前面:

        

        快速回顾虚拟世界数字人的发展中艰辛历程,技术方面是重要核心核心要素,而人们对虚拟世界数字人的想像和不懈最求更是催化剂,助推虚拟世界数字人从 2D动画走向 3D超写实,从定制化走向通用化,从商业端走向用户端。

        元宇宙将人类带向了一个新的虚拟世界互相交融我们的时代,虚拟世界数字人也将成为新的人机交互方式,和人类的最重要的存在形式。更有甚者在因为未来,人们数字化身和原生虚拟世界人的差别将渐渐被弱化,元宇宙的参与其中者成为“碳基生命”和“硅基生命”混合在一起体。

        正如科大讯飞对虚拟世界数字人的想像:

        懂情感,爱人和被人喜爱;

        有个性,并不千人一面;

        智慧……并善良,帮组人类是初心;

        每一人都可以获得,而不是可望而不可即。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容