Nvidia 的 Erik Pounds:传统的算法之后还没有理解对话的上下文; 现在有可能

已发表: 2022-11-02

一年多前,我与 Nvidia 的 Bryan Catanzaro 讨论了他们在图形 AI、语音合成和会话/语音 AI 领域开发的一些有趣技术。

Bryan 分享了关于机器学习和深度学习等事物可以影响我们体验周围世界的方式的未来愿景。 虽然人工智能创造艺术、音乐和人类声音等一些东西得到了很多关注,但当我们需要产品或服务方面的帮助时,人工智能已经被用来帮助创造更好的客户体验,还有一些更实际的例子.

算法理解对话的上下文

一年过去了,我很想知道这些领域的进展如何,我有幸通过 LinkedIn Live 与 Nvidia 企业计算和数据科学高级总监 Erik Pounds 就对话和数据科学等方向进行了交谈。自从我上次与 Bryan 交谈后,语音 AI 已经介入。 以下是我们谈话的编辑记录。 单击嵌入式 SoundCloud 播放器以收听完整的对话。

smallbiztrends · Nvidia 的 Erik Pounds:算法还没有理解对话的上下文。 现在这是可能的

Brent Leary:当谈到今天的语音 AI 和会话 AI 时,我们正在处理什么?

Erik Pounds:你想到语音 AI,想到自动语音识别等功能,其中 AI 在后台运行并且可以立即识别你在说什么。 它可以转录所说的内容。 然后,它可以根据该信息实时采取行动。 你可以通过这样做提供很多有用的东西。 想象一下电话对话后端的客户服务代理。 另一方面,我们中的很多人,在消费者方面,我们想要……而我们真正想要的是什么? 嗯,一个,我们喜欢和人说话,另一个是我们想快速得到帮助,对吧?

想象一下在它的后端使用,所以在代理端,想象一下如果我正在和一个试图获得帮助的代理交谈并且我正在问一堆问题,想象一下如果人工智能在后台运行,拉查找基于知识的文章,查找信息,查找有用的工具,并帮助我回答我的问题。

然后,代理将所有这些信息触手可及,以帮助我解决我的问题。 这就像拥有几乎像这样的超级大国坐在您旁边,帮助某人获得丰富的经验并解决他们的挑战,对吗? 当我们考虑人工智能时,尤其是在这种情况下,它并不是用你会与之交谈的机器人代替人类。 这些增量步骤将能够帮助在未来几十年为客户提供服务的企业。

数据是基础,同理心增加了所需的人为因素

Brent Leary:当人们想到人工智能时,他们的定义很狭隘,对它实际影响的看法也很狭隘。 但是当涉及到客户需要帮助时的体验时,感觉不仅仅是人工智能,而且至少感觉就像你在与人交流,至少是一个听起来像人类的东西或有某种东西的人人类同理心。 这与拥有正确的数据一样重要。

Erik Pounds:当然。 数据是所有这些的基础元素。 如果我们转录一个呼叫,它会实时生成数据。 但是,还有其他已经存在的数据,通常位于可以利用的企业内部。 我认为任何企业都可以采取的最佳策略之一就是弄清楚,“好吧。 我已经拥有,我已经拥有的有价值的数据是什么? 我如何利用它来提供更好的客户体验?” 其中一些可能只是一般数据。

例如,每次发生客户交易时,都会发生一次互动,从而产生数据。 你可以从中获得很多关于趋势和模式以及诸如此类的信息。 他们可以帮助未来的客户,对吧? 通常很多这样的调用、交互都会被转录和存储。 我们都听到任何呼叫开始时的那部分,例如,“此呼叫可能会受到监控。

如果你继续,这就是将要发生的事情。” 可以把它想象成众包信息。 您可以真正利用这些信息为您带来最大利益。 所以我认为很多事情都是从你如何利用和利用数据的基础开始的。

连接上下文

Brent Leary:你能谈谈其中的组成部分吗?我们不仅能够拥有出色的自然语言转录和理解能力,还有情感组件,即利用同理心和语音 AI 作为一部分的能力组合。 因为它的一部分是解决挑战或帮助,但另一部分是它是如何发生的,以及人们不仅从纠正事情中得到的感觉,还有纠正事情的方式,他们参与的方式,他们的社区,来回的同理心。 你能谈谈我们在哪里吗?

Erik Pounds:通常当我说一件事,然后你回应,然后我说另一件事时,接下来的句子与第一句话联系在一起。 当您查看传统算法的工作原理时,它们通常不了解该上下文。 他们没有处理或考虑到这一点。 现在这是可能的。 例如,我们最近在上个月的会议上发布了一些演示,NVIDIA GTC,我们发布了一个演示。

这是一个使用我们称为 NVIDIA Tokkio 的 AI 框架的客户服务演示,它准确地展示了它如何在提供逼真的交互、理解我在说什么、我在要求什么以及能够做的方面发挥作用它是一种自然的人类对话流程。 这很关键。 随着我们自动化更多的完整过程,这绝对是至关重要的。 因为就像你说的,我们想与人类互动,对吧? 就像你说的,有人打来电话,他们想听到人类的声音,他们想要一个友好、理解他们、欣赏他们所说的话的人。

如果人工智能构建到那个水平,它就需要能够做到这一点。 否则体验不会很好。 当我们谈论人工智能技术时,我认为这很重要。 当谈到语音 AI 或会话 AI 时,有很多技术细节,比如“好吧。 好吧,你说的单词有多少我听懂了? 在嘈杂的环境中我能听懂你的话吗? 我可以做所有这些事情。” 这就是技术的工作原理。

但真正重要的是,这是一次很棒的经历还是不是一次很棒的经历? 您可以将惊人的技术应用于这一挑战,但仍然无法提供出色的客户体验。 这是最重要的,对吧? 因此,我们采用我们的技术方法,我们可以帮助客户做的最重要的事情之一就是采用人工智能,采用这些预先训练的模型,并能够为他们自己的领域和自己的环境定制它们.

如果你经营一个呼叫中心,大部分讨论都围绕着植物学,我不记得我在前院改变过的植物的名称,对吧? 但如果是这种情况,您需要确保该 AI 理解该领域的某些术语、短语和上下文。 或者,如果它是一家医疗设备公司,您可以想象在该对话中将讨论很多事情,而不是在训练 AI 模型的正常对话中。

所以定制和术语一样重要,对吧? 因此,根据您的客户居住或致电的世界地区,您希望能够理解方言、行话之类的东西,并能够正确处理这些问题。 所以很多这不是......你不能只使用一个股票 AI 模型并将其部署到一个环境中工作,它在任何地方都提供了很好的体验。 定制将非常重要。

不要忽视你面前的数据

布伦特·利里:有哪些事情可能是公司仍在努力解决这个问题的方式?

Erik Pounds:在这次谈话的背景下,就像您提到的那样,您与许多构建这些 CRM 平台的公司有着良好的关系,这些平台被许多不同的企业和组织使用。 通常是企业,他们拥有现有的服务堆栈或技术堆栈,然后他们想做一些新的事情。 有时他们今天所处的位置有一些限制。

所以这通常会增加一些复杂性,因为其中一部分是,“好吧,我可以自己构建这个,并将其插入我现有的平台。” 或者有时您必须回到您的 ISV,提出功能请求,例如,“嘿,我们真的很想这样做。 你有什么想法?”

我认为最重要的是,当您进行这些对话时,了解触手可及的数据。 了解您自己可以做什么,您的 ISV 可以做什么,如果您有一点咨询帮助,您甚至可以做什么。 我认为只要有充分的了解,你就可以向前迈出积极的一步。

大多数企业内部的第一个人工智能项目都习惯于……他们咬牙切齿,对吧? 他们并不总是成功的。 这是一项新技术。 所以我想说尽可能多地做好准备,这样你在第一个项目中就有最大的成功机会现在是非常重要的。

Brent Leary:从 CRM 应用程序的角度来看,特别是如果您是销售人员,他们讨厌使用 CRM。 他们不喜欢放东西。 他们没有注册输入或滑动或单击。 他们真的很想出去建立关系并卖东西。 我的幻想是,如果您可以与您的企业应用程序对话,无论是 CRM 或 ERB 还是您想扔在那里的任何首字母缩写词,如果您可以像我们现在所说的那样与它对话,那不是很酷吗?把你的事情做好,这只是幻想吗? 或者您是否看到有一天我们实际上可以使用我们的应用程序进行这种对话?

Erik Pounds:不,不应该。 尤其是现在,当其中大多数……你提到的时候,“好吧。 在与该客户或潜在客户进行此对话后,我必须返回 Salesforce 并更新此记录。” 而且我们都知道很多时候这些记录没有得到很好的更新,然后企业就没有向前发展所需的智能,对吧? 管道不是最新的。 你无法从中吸取教训。 现在很多这样的对话就像我们正在经历的那样,对吧? 他们是遥远的。 他们不在某栋楼的会议室里。 或者即使他们在某栋大楼的会议室里,也经常有人在远处。 所以有一个系统在监听这个对话。

在这种情况下,只要能够转录该对话并能够为客户经理或任何相关人员做到这一点,那就太好了。 这就是今天所有的能力。 就像这个对话一样,这个对话是被转录的。 您正在使用一些 ASR 功能来转录对话,然后您正在应用一些 NLU 或 NLP 功能来理解我们正在谈论的内容的上下文。 然后你可以很容易地去更新很多这些标准字段。 这都是重复的东西。 活动越重复,应用人工智能就越容易。

这是与思想领袖的一对一访谈系列的一部分。 成绩单已编辑出版。 如果是音频或视频采访,请点击上面的嵌入式播放器,或通过 iTunes 或通过 Stitcher 订阅。