首页 映魅观点 研究观点 Soul Machines:打造由AI驱动的具备自我学习能力的数字人,且具有协作能力
Soul Machines:打造由AI驱动的具备自我学习能力的数字人,且具有协作能力

Soul Machines:打造由AI驱动的具备自我学习能力的数字人,且具有协作能力

  2022年2月份,数字人技术公司Soul Machines宣布完成了7000万美元的B1轮融资,由软银愿景基金(SoftBank Vision Fund 2)领投,其他投资者包括了Cleveland Avenue、Liberty City Ventures、Solasta Ventures以及公司老股东淡马锡(Temasek)、Salesforce Ventures和Horizons Ventures。自2016年成立以来,Soul Machines共计对外募集了1.35亿美元的资金。

  和其他数字虚拟人公司相比,我们认为Soul Machines本质上是一家通用人工智能(Artificial General Intelligence)公司。在其理念中,我们生活的世界越来越数字化,在物理世界和数字世界之间也需要一种不同于以往的人机交互界面,而数字人(Digital People)则会是其中一个选项,并且可以应用于非常多的生活、工作等场景,而不仅限于娱乐。

  2020年5月份,Soul Machines发布了Digital DNA Studio,目的是让更多的企业可以轻松快速地创建自己的数字人。不同的企业面对的消费者群体不同,他们提供的产品也不同,传递给消费者的品牌味道也不同,因此,企业需要个性化的解决方案来与消费者建立起有吸引力的情感联系。还有一个重要的考量因素是这种解决方案是否能够大规模地应用,从而降低投入其中的边际成本。

  由于需要面对极其丰富且难以预先确定的使用场景,Soul Machines需要不仅是要做到和其他数字虚拟人那样的逼真外表、丰富的面部表情、肢体语言等,还需要具备相当的人工智能。换句话说,在Soul Machines的数字人的背后是有一个称为“大脑”的东西存在的。

  根据Soul Machines的官方介绍,Human OS是一个融合了数字大脑(Digital Brain)和自主动画(Autonomous Animation),并且是由数字大脑来驱动自主动画的实现。在数字大脑中又包含了多项技术细分,如机器学习、自然语言处理、内容感知(Content Awareness,这是一种确定特定文件、应用程序或其他数据存储中包含哪些信息的能力)、情感分析、机器视觉等。

Digital Brain模拟图

  正如前面提到的,Soul Machines的数字人需要面对的是一个极不确定的场景,谁都无法预测它将面临的互动是什么。因此,它需要有更为增强的表达方式,这是自主动画(Autonomous Animation)的发挥能力的地方。自主身体动画(Autonomous Body Animation)可以让数字人通过适当的身体手势来增强他们的语言交流,从数字人的手或者胳膊开始,最终包括整个身体,都能够尽可能提供丰富的表达。

Soul Machines数字人的肢体动作展示

  仅此而已吗?在2019年,Soul Machines与全球知名护肤品品牌宝洁公司(P&G)的SK-II品牌宣布了全球第一个自主动画数字人:YUMI。YUMI不仅会向消费者提供美容建议,还会帮助他们更好地了解自己的皮肤,选择适合自己的SK-II产品。

YUMI

  对于YUMI和其他数字虚拟人的区别,Soul Machines在其官网上也做了详细的描述。

  自主:YUMI可以大规模运行,可以自主地进行人工干预。YUMI通过一个数字大脑来表达情感和信息,利用人工智能,她可以像真正的人类一样做出反应和互动。

  “真实”的人:通过Digital DNA Studio,YUMI被开发成栩栩如生的,但具有独特的个性,像一个“真正的人”一样。逼真的人物角色被认为更值得信任,人们对它更加有亲和力,更喜欢它而不是卡通角色。与逼真的角色相比,卡通角色会造成额外的认知负荷。

  反馈:和很多其他的虚拟人常被设计成按照预先编写好的“剧本”运行不同。YUMI会和她面对的消费者做出反应并进行适应。

  整合:YUMI是一个有着任务的数字人,因此需要把她和相关的信息进行整合。因此,她可以提供给消费者所需要的帮助、建议和提示,而所有这些都是消费者需要的。

  AI驱动:YUMI具有自我学习的能力。YUMI不会什么都知道,但如果她不知道,她会知道该怎么做。她代表了一种新的方式,让品牌以一种高度可扩展的方式与人类互动,从而变得更人性化。

  试想以下如果一个数字人具备自我学习的能力会带来什么?这或许将带来我们人类与数字人之间的协作方式,让机器能够与人类共同创造有价值的且相关的内容,而不是利用人工智能来完成特定的任务。而且因为数字人具有和真实人类近似或接近的表达方式,因此也更有利于双方之间建立起更具信任感的关系,这种方式必须对我们真实人类的是一种友好的方式。

  为此,Soul Machines在2019年提出了这一标准:Autonomous Animation,以定义如何将复杂的算法结合起来,并将它们体现在一种对人类友好的形式中,以培育出一个协作环境,而在这个环境中,数字人可以自然地运行和采取行动。

  但是这还不够,因为在Soul Machines的理念中,只有将高质量的CGI与受人类大脑运作启发的计算机架构(即人工智能)相结合,才能获得最佳的体验和互动。我们在前面提到的Human OS才是Soul Machines的核心,它需要数字大脑(Digital Brain)来驱动自主动画(Autonomous Animation)的实现,两者缺一不可,两者又有主次关系。

  在Soul Machines数字人的应用场景中,有一个常见的场景是客服。当人工客服厌倦了重复回答相同的问题的时候,这可能会影响他们的情绪和语气,而数字人可以一直保持愉快,同时提供快速、准确的答案。

  在很多情况下,数字人有一个明显优于真实人类的优势,即数字人是非判断性的。尽管它们具有同理心,它们从一开始就带有同理心,使用户不会感到被评判,当在面对较敏感的话题时,用户与数字人的互动实际上可能会让他们感觉更加舒服。

Powered by Froala Editor