Nvidia 的 Erik Pounds:傳統的算法之後還沒有理解對話的上下文; 現在有可能

已發表: 2022-11-02

一年多前,我與 Nvidia 的 Bryan Catanzaro 討論了他們在圖形 AI、語音合成和會話/語音 AI 領域開發的一些有趣技術。

Bryan 分享了關於機器學習和深度學習等事物可以影響我們體驗周圍世界的方式的未來願景。 雖然人工智能創造藝術、音樂和人類聲音等一些東西得到了很多關注,但當我們需要產品或服務方面的幫助時,人工智能已經被用來幫助創造更好的客戶體驗,還有一些更實際的例子.

算法理解對話的上下文

一年過去了,我很想知道這些領域的進展如何,我有幸通過 LinkedIn Live 與 Nvidia 企業計算和數據科學高級總監 Erik Pounds 就對話和數據科學等方向進行了交談。自從我上次與 Bryan 交談後,語音 AI 已經介入。 以下是我們談話的編輯記錄。 單擊嵌入式 SoundCloud 播放器以收聽完整的對話。

smallbiztrends · Nvidia 的 Erik Pounds:算法還沒有理解對話的上下文。 現在這是可能的

Brent Leary:當談到今天的語音 AI 和會話 AI 時,我們正在處理什麼?

Erik Pounds:你想到語音 AI,想到自動語音識別等功能,其中 AI 在後台運行並且可以立即識別你在說什麼。 它可以轉錄所說的內容。 然後,它可以根據該信息實時採取行動。 你可以通過這樣做提供很多有用的東西。 想像一下電話對話後端的客戶服務代理。 另一方面,我們中的很多人,在消費者方面,我們想要……而我們真正想要的是什麼? 嗯,一個,我們喜歡和人說話,另一個是我們想快速得到幫助,對吧?

想像一下在它的後端使用,所以在代理端,想像一下如果我正在和一個試圖獲得幫助的代理交談並且我正在問一堆問題,想像一下如果人工智能在後台運行,拉查找基於知識的文章,查找信息,查找有用的工具,並幫助我回答我的問題。

然後,代理將所有這些信息觸手可及,以幫助我解決我的問題。 這就像擁有幾乎像這樣的超級大國坐在您旁邊,幫助某人獲得豐富的經驗並解決他們的挑戰,對嗎? 當我們考慮人工智能時,尤其是在這種情況下,它並不是用你會與之交談的機器人代替人類。 這些增量步驟將能夠幫助在未來幾十年為客戶提供服務的企業。

數據是基礎,同理心增加了所需的人為因素

Brent Leary:當人們想到人工智能時,他們的定義很狹隘,對它實際影響的看法也很狹隘。 但是當涉及到客戶需要幫助時的體驗時,感覺不僅僅是人工智能,而且至少感覺就像你在與人交流,至少是一個聽起來像人類的東西或有某種東西的人人類同理心。 這與擁有正確的數據一樣重要。

Erik Pounds:當然。 數據是所有這些的基礎元素。 如果我們轉錄一個呼叫,它會實時生成數據。 但是,還有其他已經存在的數據,通常位於可以利用的企業內部。 我認為任何企業都可以採取的最佳策略之一就是弄清楚,“好吧。 我已經擁有,我已經擁有的有價值的數據是什麼? 我如何利用它來提供更好的客戶體驗?” 其中一些可能只是一般數據。

例如,每次發生客戶交易時,都會發生一次互動,從而產生數據。 你可以從中獲得很多關於趨勢和模式以及諸如此類的信息。 他們可以幫助未來的客戶,對吧? 通常很多這樣的調用、交互都會被轉錄和存儲。 我們都聽到任何呼叫開始時的那部分,例如,“此呼叫可能會受到監控。

如果你繼續,這就是將要發生的事情。” 可以把它想像成眾包信息。 您可以真正利用這些信息為您帶來最大利益。 所以我認為很多事情都是從你如何利用和利用數據的基礎開始的。

連接上下文

Brent Leary:你能談談其中的組成部分嗎?我們不僅能夠擁有出色的自然語言轉錄和理解能力,還有情感組件,即利用同理心和語音 AI 作為一部分的能力組合。 因為它的一部分是解決挑戰或幫助,但另一部分是它是如何發生的,以及人們不僅從糾正事情中得到的感覺,還有糾正事情的方式,他們參與的方式,他們的社區,來回的同理心。 你能談談我們在哪裡嗎?

Erik Pounds:通常當我說一件事,然後你回應,然後我說另一件事時,接下來的句子與第一句話聯繫在一起。 當您查看傳統算法的工作原理時,它們通常不了解該上下文。 他們沒有處理或考慮到這一點。 現在這是可能的。 例如,我們最近在上個月的會議上發布了一些演示,NVIDIA GTC,我們發布了一個演示。

這是一個使用我們稱為 NVIDIA Tokkio 的 AI 框架的客戶服務演示,它準確地展示了它如何在提供逼真的交互、理解我在說什麼、我在要求什麼以及能夠做的方面發揮作用它是一種自然的人類對話流程。 這很關鍵。 隨著我們自動化更多的完整過程,這絕對是至關重要的。 因為就像你說的,我們想與人類互動,對吧? 就像你說的,有人打來電話,他們想听到人類的聲音,他們想要一個友好、理解他們、欣賞他們所說的話的人。

如果人工智能構建到那個水平,它就需要能夠做到這一點。 否則體驗不會很好。 當我們談論人工智能技術時,我認為這很重要。 當談到語音 AI 或會話 AI 時,有很多技術細節,比如“好吧。 好吧,你說的單詞有多少我聽懂了? 在嘈雜的環境中我能聽懂你的話嗎? 我可以做所有這些事情。” 這就是技術的工作原理。

但真正重要的是,這是一次很棒的經歷還是不是一次很棒的經歷? 您可以將驚人的技術應用於這一挑戰,但仍然無法提供出色的客戶體驗。 這是最重要的,對吧? 因此,我們採用我們的技術方法,我們可以幫助客戶做的最重要的事情之一就是採用人工智能,採用這些預先訓練的模型,並能夠為他們自己的領域和自己的環境定制它們.

如果你經營一個呼叫中心,大部分討論都圍繞著植物學,我不記得我在前院改變過的植物的名稱,對吧? 但如果是這種情況,您需要確保該 AI 理解該領域的某些術語、短語和上下文。 或者,如果它是一家醫療設備公司,您可以想像在該對話中將討論很多事情,而不是在訓練 AI 模型的正常對話中。

所以定制和術語一樣重要,對吧? 因此,根據您的客戶居住或致電的世界地區,您希望能夠理解方言、行話之類的東西,並能夠正確處理這些問題。 所以很多這不是......你不能只使用一個股票 AI 模型並將其部署到一個環境中工作,它在任何地方都提供了很好的體驗。 定制將非常重要。

不要忽視你面前的數據

布倫特·利裡:有哪些事情可能是公司仍在努力解決這個問題的方式?

Erik Pounds:在這次談話的背景下,就像您提到的那樣,您與許多構建這些 CRM 平台的公司有著良好的關係,這些平台被許多不同的企業和組織使用。 通常是企業,他們擁有現有的服務堆棧或技術堆棧,然後他們想做一些新的事情。 有時他們今天所處的位置有一些限制。

所以這通常會增加一些複雜性,因為其中一部分是,“好吧,我可以自己構建這個,並將其插入我現有的平台。” 或者有時您必須回到您的 ISV,提出功能請求,例如,“嘿,我們真的很想這樣做。 你有什麼想法?”

我認為最重要的是,當您進行這些對話時,了解觸手可及的數據。 了解您自己可以做什麼,您的 ISV 可以做什麼,如果您有一點諮詢幫助,您甚至可以做什麼。 我認為只要有充分的了解,你就可以向前邁出積極的一步。

大多數企業內部的第一個人工智能項目都習慣於……他們咬牙切齒,對吧? 他們並不總是成功的。 這是一項新技術。 所以我想說盡可能多地做好準備,這樣你在第一個項目中就有最大的成功機會現在是非常重要的。

Brent Leary:從 CRM 應用程序的角度來看,特別是如果您是銷售人員,他們討厭使用 CRM。 他們不喜歡放東西。 他們沒有註冊輸入或滑動或單擊。 他們真的很想出去建立關係並賣東西。 我的幻想是,如果您可以與您的企業應用程序對話,無論是 CRM 或 ERB 還是您想扔在那裡的任何首字母縮寫詞,如果您可以像我們現在所說的那樣與它對話,那不是很酷嗎?把你的事情做好,這只是幻想嗎? 或者您是否看到有一天我們實際上可以使用我們的應用程序進行這種對話?

Erik Pounds:不,不應該。 尤其是現在,當其中大多數……你提到的時候,“好吧。 在與該客戶或潛在客戶進行此對話後,我必須返回 Salesforce 並更新此記錄。” 而且我們都知道很多時候這些記錄沒有得到很好的更新,然後企業就沒有向前發展所需的智能,對吧? 管道不是最新的。 你無法從中吸取教訓。 現在很多這樣的對話就像我們正在經歷的那樣,對吧? 他們是遙遠的。 他們不在某棟樓的會議室裡。 或者即使他們在某棟大樓的會議室裡,也經常有人在遠處。 所以有一個系統在監聽這個對話。

在這種情況下,只要能夠轉錄該對話並能夠為客戶經理或任何相關人員做到這一點,那就太好了。 這就是今天所有的能力。 就像這個對話一樣,這個對話是被轉錄的。 您正在使用一些 ASR 功能來轉錄對話,然後您正在應用一些 NLU 或 NLP 功能來理解我們正在談論的內容的上下文。 然後你可以很容易地去更新很多這些標準字段。 這都是重複的東西。 活動越重複,應用人工智能就越容易。

這是與思想領袖的一對一訪談系列的一部分。 成績單已編輯出版。 如果是音頻或視頻採訪,請點擊上面的嵌入式播放器,或通過 iTunes 或通過 Stitcher 訂閱。