预见·科技|数字人技术再进化 科技大厂已实现“凭空”捏人

7月17日,小冰公司宣布全新的“零样本”数字人(Zero-shot Xiaoice Neural Rendering)技术正式上线。据介绍,与之配套的还有基于该技术的全新普惠型数字员工产品,意味着一经推出就开始探索商业化。

从去年初开始,小样本数智人生产就已经在腾讯、百度、商汤等玩家中布局。此次迭代到的“零样本”数字人技术,则是依托大模型基座及数字人交互套件,将数字人所需的训练数据压缩至“秒级”,使定制时间达到“立等可取”,而且生成的数字人能够直接应用于实时交互。
业内人士透露,对于数字员工这一产品而言,从小样本过渡到“零样本”在全球尚属首次。其本质上是三方面的技术升级:一是Z-XNR技术和TTS语音大模型的融合框架,实现秒级数据高质量形象声音复刻;二是大模型基座与Agent构建框架搭建了数字大脑平台,让交互精准更易适配各种场景的原生工作流;三是透影音画传输系统,可以承载端到端的多模态实时交互和AI对话等场景,提供流畅自然语言交互。
生产数字人所需样本越来越少,背后是相关技术的不断完善,使得数字人定制过程变短、成本降低,一定程度上加速了数字人的应用落地,也催生了更多场景应用和商业化。比如,此前B站UP用AI“复活”奶奶、已故明星“说话”视频引发关注,电商平台上也有店家推出了“复活亲人”的商品。
同时,无样本地“捏人自由”,也蕴含了诸多安全风险隐患。在中国科学院信息工程研究所的正高级工程师韩冀中看来,保障这些互联网上海量的敏感隐私数据在被授权后的如何安全清洗,是一个极大的数安挑战,因为这些高质量的数据对行业内的任何一个公司来讲都是一个特别大的诱惑。对此,他建议,相关企业应依据法律法规,对合成的内容进行明确标识,避免相关内容的混淆,从源头上降低网络虚假信息的泛滥可能。