AI时代的到来,似乎为这一曾经“聊胜于无”的技术,注入了新的灵魂。凭借愈发逼真的形象,数字人开始在更多的场景、行业中进行赋能。
1
“前浪”艰难探索
很多人在谈到数字人的过去时,往往都会陷入一个误区,认为最初的数字人仅仅是个被炒起来的概念,是个像VR那样,看似潜力无限,实则可有可无的“鸡肋”。
实际上,这样的看法,忽略了一个重要的现实,那就是:
在数字人诞生的早期,不是人们没有对数字人的需求,而是当时的技术、成本,根本满足不了这样的需求。
具体来说,早期的数字人,主要存在着成本高昂、技术标准不统一、形象难以与真人媲美等缺陷。
据国内领先的数字人企业风平智能介绍,在数字人处于2D卡通时代时,虽然也有部分企业,出于营销时增加新奇感的需要,订购了一些数字人,但其中99%的数字人,在订购之后半年就再无人问津。
究其原因,是当时数字人的成本太高,而应用场景却又太窄了。
试想一下,花费数十万制作出来的卡通数字人,除了在部分需要增加“新奇感”的应用场景外,还能用在什么地方呢?
你不能指望人们在上课、开会或讲座这些严肃的场景里,看着一个卡通形象滔滔不绝吧?
后来,虽然随着技术的进步,数字人的形象开始逐渐朝着写实、3D的方向发展,可居高不下的成本,仍然让许多企业望而却步。
2020年,随着元宇宙概念的火热,市场对于提高数字人生产效率和提升商业化的诉求日益高涨。同时,5G、AI等新技术更新换代,也让数字人得到了焕发新生的机会。
其中几项关键的技术,让数字人极大地提升了与真人的接近度。
例如,人像驱动引擎,可以通过4D扫描、智能绑定等AI技术,实现数字人的唇形驱动、肢体驱动、表情驱动、手势感知等,同时减少动作捕捉、CG合成的制作流程,大幅降低了成本。
而智能对话引擎,通过自然语言处理技术,为数字人快速定制对话能力、持续提升对话效果。
这些技术,让数字人在表现力、智慧度、交互能力上都得到了大幅提升。
可以说是BAT三巨头中,最早实现真人级数字人的企业。
小样本“数智人”从直观上感受是2D视频,但背后其实是3D人像技术在支撑。通过3D人脸结构的先验信息引入,使数智人口型、表情更到位,让小样本“数智人”形象实现“皱纹级”还原。
除了百度、腾讯这些大厂外,一些默默耕耘于数字人垂直赛道的企业,也凭借日益精湛的技术,打造出了更逼真和生动的数字人。
在数字人领域钻研已久的风平智能,就是一个这样的代表。
其独特的XGen智造系统,和丰富、可定制的知识库,在低成本高质量生产数字人的同时,还能使每一个数字人都拥有独一无二的“智能大脑”。从而扩展了其多元化的场景应用能力。
同时,通过深度学习技术建模,风平智能的数字人还能支持129种语种,实现了跨国互动无障碍的交流。其制造的数字人,已应用在了新东方的课堂直播中。
在这一阶段,数字人所呈现出的总体趋势,是制作成本的大幅度下降,以及表现力的突飞猛进。
而这些技术进步,所带来的直接的后果,就是数字人技术的不断下沉和趋同。