Skip to content

什么叫做数字人

通过 CG 创造的与人类形象接近的数字化形象,并赋予特定的人物身份,这个数字化形象就是数字人

数字人技术相关概念

  • CG: Computer Graphic 计算机动画
  • NLP:Natural Language Processing 自然语言处理
  • CV: Computer Vision 计算机视觉
  • 动作捕捉:记录真人动作并迁移到数字人模型上
  • 面部捕捉:捕捉面部表情并同步到数字人面部
  • 语音合成:将文本转换为逼真的语音输出
  • TTS: text to speech 文本合成语音
  • ASR:语音转文本

数字人基础架构

业界提出“五横两纵”的数字人技术架构。 五横是指数字人的制作、交互相关的五大技术模块:

  • 人物生成、人物表达、合成显示、识别感知、分析决策 两纵:2D 数字人和 3D 数字人 Alt text 并不是所有的虚拟数字人都有交互功能,在有交互的数字人中,又分为真人驱动、智能驱动。

数字人产业链

国内数字人产业链,自上而下可以分为基础层、平台层、应用层,总共三层。 Alt text

前景

不仅可以增加个性化的用户体验,还在多个领域,如教育、医疗、娱乐、客服等发挥独特的作用,还可以作为品牌形象的延伸,提供 24 小时不间断的服务。

数字人常见分类

按人格象征:虚拟 ip、虚拟世界第二分身 按图形维度:二次元、3D 动画、3D 超写实、超真人形象等。

趋势总结

NLP大模型是数据人的巨大杀器,GPT等的自然语言处理大模型的发展,解决了数字人只会念稿,不会交互的能力,它们对信息内容的挖掘和分析能力越来越贴近人类的日常交流表达。

备注

部分资料来自,《2020 年虚拟数字人发展白皮书》