随着大模型和空间计算的快速发展,数字人商业化已经成为一个热门领域。数字人是指通过计算机技术和人工智能技术生成的虚拟人物,可以模拟真实人类的外貌、语言和行为。百度数字人的核心团队由人工智能专家、计算机图形学专家和语音识别专家组成,他们致力于研究如何将人工智能技术应用于虚拟人物的创作和生产。
IXDC采访到百度数字人与机器人业务负责人李士岩先生,就目前达模型浪潮下,数字人技术正在经历的变革、对我们生活和工作的影响、数字人领域的技术研发取得的重要成果等问题做出详细的解答。
在当前大模型和空间计算浪潮的背景下,数字人技术正经历着怎样的变革?这些变革将如何影响我们的生活和工作
数字人跟空间计算主要带来的场景变化主要是第一,基于大模型是集中在对数字人的底层能力所产生的资产的生成数字人的驱动,数字人的对话能力交互能力以及内容生产的性能方面,带来质的变化。举个例子,比如说原来要构建一个2D的数字人,基于原来的做法训练时间要1-3天,但是现在基于我们视觉大模型的技术,能够5分钟自动化的完成数字人的训练。在数字人的交互能力上,基于LRM自然语言的大模型,可以使得原来我们的对话能力是基于领域来分别训练和构建的,然后需要的成本非常高。但是现在基于大模型的技术,可以用很少的数据就能够训练一个领域模型,且它的对话效果较原来呢也有一些质的提升。
百度在数字人领域的技术研发取得了哪些重要成果?这些成果将如何推动数字人的商业化进程
现在数字人或者说任何一个行业的商业化瓶颈,在需求极其丰满的前提下,都是产品的交付效率和产品的成本。基于这几点的考虑,目前我们几年的投入上面,第一是在这个数字资产的创建方面,我们使他原来的比如每做一个3D的超写实形象,用传统方式来做要几万到几十万不等。但现在我们在上面投入了很多,能够就一些基础的简单的三维人像模型在超写实维度,做到基于照片的自动化的生产以及基于产品的平台化建设,使他的交付效率,过往的数字人的很多企业的做法是要给企业交付,数字人要交付很多东西,然后有复杂的使用流程。那现在我们更倾向于将这些所有的产品能力,集成到一个标准化的像PPT、像word一样易用的软件当中,来交付客户来使用。比如在直播带货的这个领域,过往使用数字人直播带货的成本还是很高昂的,那现在基于大模型的基础,他只需要拿到一个标准化的软件、文案,可以自动化的生成问答、可以自动化的生成数字人、可以自动化的生成一个基于数字人平台的直播间,可能他只需要经历一小时的简单培训,有一个人他就能够用这个产品来做直播带货。
数字人商业化在目前市场中的地位和前景如何?您认为未来数字人的应用领域有哪些可能性
数字人的商业化的发展速度非常非常的快,每年有很好的增长率,同时在数字员工、虚拟偶像、城市IP、企业IP等领域,我们也看到了非常大的市场空间,尤其是在虚拟偶像跟直播带货两个赛道,我们看到都是接近百亿级的市场空间,目前基于空间计算的发展,也为这几个赛道带来了新的机遇。因为基于空间计算,里边的不仅是三维的人,三维的空间和物体都要重构,来给人们带来一个叫平面显示计算设备完全不一样的体验,整体的体验提升是非常大的,数字人它本质上还是计算平台内的一个交互载体或内容载体,所以它的发展方向一定跟计算平台的发展是息息相关的。我觉得大概是分为两个阶段。就第一阶段基于大模型的发展它会让数字人能有更好的对话能力、更低的内容生产能力,甚至基于大目前的应用来改变一些比如说直播带货,这个行业的一个叫生产关系,基于大模型会带来一波增长,下一个阶段就是基于空间计算平台,我们相信,由于数字人是空间计算平台,我们每个人进入空间计算平台里的一个基础设施,是你的身份证、是你在里边你的替身。所以我觉得基于空间计算平台,里边的从服务到内容到我们自己的二分身的场景,都会非常大的市场增长空间。
0人打赏
机构简介
百度数字人与机器人业务负责人,管理业务的产品研发、运营和商业化。深耕大模型和空间计算相关应用,是常年奋战在业务一线的人工智能标杆产品领导者。曾任职百度人工智能交互设计院架构师和人机探索实验室负责人,北京邮电大学企业导师、中国服务设计十大青年,具有50+项专利、10+篇论文。
这里拥有全球领先的用户体验创新知识。全网独家,更权威,更全面。
每一年,来自全球领先企业的专家、CEO们都给我们分享最成功的案例、方法与前瞻观点。帮助数以万计的从业者们解决产品、设计、运营、技术、管理等5大内容类别的困惑与瓶颈。在这里,你可以观看500+国际体验设计大会高清权威视频课程。
IXDC带你建立全球视野与能力,解决专业困惑与职场瓶颈,足不出户汲取让你成长的海量知识。联系在线客服:18826260168