首页 POWER4EDU 生成式AI视频创作独角兽公司Synthesia发布新功能,让数字人根据文本内容调整语气、表情和肢体动作等
生成式AI视频创作独角兽公司Synthesia发布新功能,让数字人根据文本内容调整语气、表情和肢体动作等

生成式AI视频创作独角兽公司Synthesia发布新功能,让数字人根据文本内容调整语气、表情和肢体动作等

  近日,据海外媒体报道,来自英国的基于生成式人工智能技术的视频创作和生成服务商Synthesia发布了最新的功能升级,推出了名为“Expressive Avatars”的最新功能。据介绍,“Expressive Avatars”功能能够使数字人具备根据所传递的内容上下文调整语气、面部表情和肢体动作语言。这将帮助Synthesia的用户为他们的目标受众创造出比以往任何时候都更加真实的视频。

  据Synthesia公司称,“Expressive Avatars”可以通过表情、眨眼甚至眼神的细微调整来表达一系列情绪,以配合数字人讲话的上下文。想象一下,当数字人在谈论一些令人兴奋的事情时微笑和大笑,或者在谈论一些悲伤或忧郁的事情时缓慢地说话,停顿时间也会更长。

  Synthesia的首席技术官Jon Starck表示,这项技术为数字人带来了一定程度的复杂性和真实感,模糊了虚拟与现实之间的界限。

  为了达到这种程度的情绪预测和真实感,Synthesia使用了EXPRESS-1,这是一种深度学习模型,经过数小时的文本和视频训练,展示了现实世界中文本的表达方式。Jon Starck补充道,EXPRESS-1可以实时预测每个动作和面部表情,并与说话的时间、语调等无缝结合。这带来了令人惊讶且非常自然的人类的表达方式。

  虽然具有像真实人类一样表情和说话能力的数字人很容易被滥用来欺骗人们并造成个人或者社会伤害,但Synthesia正在积极地确保以企业为中心的用例,特别是在通信和知识共享方面。例如,该公司表示,医疗保健公司可以使用“Expressive Avatars”新技术为病人制作更多共情的视频,或者市场营销团队可以使用“Expressive Avatars”技术在讨论新产品的视频中传达出兴奋和乐观的情绪。

  Synthesia成立于2017年,由一群人工智能研究人员组成,其中包括来自斯坦福大学和剑桥大学的研究人员。在2023年6月份,Synthesia获得了9000万美元的融资,成为了生成式人工智能领域的一家独角兽规模公司。

延伸阅读:

  及时了解最新的全球教育科技投资,请关注我们的Edtracker栏目(知识星球),查阅全球教育科技周报和月报。关于Edtracker,可以查阅我们之前的介绍(点击这里)。

Powered by Froala Editor