Nvidia の Erik Pounds: 従来、アルゴリズムは会話のコンテキストを理解していませんでした。 それが今できる

公開: 2022-11-02

1 年ちょっと前に、Nvidia の Bryan Catanzaro と、グラフィカル AI、音声合成、会話/音声 AI の分野で開発中の興味深い技術について話しました。

Bryan は、機械学習やディープ ラーニングのようなものが私たちの周りの世界の経験方法に影響を与えることができるという未来のビジョンを共有しました。 アートや音楽、人間の声などを作成する AI のようなものには多くの注目が集まっていますが、製品やサービスでサポートが必要な場合に、より良いカスタマー エクスペリエンスを作成するために AI がすでに使用されている、より実用的な例がいくつかあります。 .

会話の文脈を理解するアルゴリズム

1 年が経ち、これらの分野で物事がどのように進んでいるかを知りたいと思っていました。幸運にも、Nvidia のエンタープライズ コンピューティングおよびデータ サイエンス担当シニア ディレクターである Erik Pounds と LinkedIn Live で話すことができました。ブライアンと最後に話して以来、音声 AI が移動しました。 以下は、私たちの会話の編集された写しです。 埋め込まれた SoundCloud プレーヤーをクリックして、会話全体を聞いてください。

smallbiztrends · Nvidia の Erik Pounds: アルゴリズムは会話の文脈を理解していません。 それが今できる

Brent Leary:今日の音声 AI と会話型 AI に関して、私たちは何を扱っているのでしょうか?

Erik Pounds:音声 AI について考えます。AI がバックグラウンドで実行されている自動音声認識のような機能を思い浮かべて、あなたが話していることをすぐに認識できるようにします。 話している内容を書き写すことができます。 その後、その情報に基づいてリアルタイムで行動できます。 そして、それを行うことで、多くの役立つものを提供できます。 電話での会話のバックエンドにいるカスタマー サービス エージェントを想像してみてください。 一方、消費者側の私たちの多くは、そうしたいと思っています…そして、私たちは本当に何を望んでいるのでしょうか? 1 つは人間と話すのが好きなこと、もう 1 つはすぐに助けを求めたいということですよね。

そのバックエンドでの使用を想像してみてください。つまり、エージェント側で、助けを得ようとしているエージェントと話をしていて、たくさんの質問をしていると想像してください。AI がバックグラウンドで実行されて、ナレッジベースの記事をアップしたり、情報を見つけたり、役立つツールを見つけたりして、私の質問に答えてください。

その後、エージェントはこのすべての情報をすぐに利用できるようにして、問題の解決に役立ててくれます。 誰かが素晴らしい経験をして課題を解決するのを助けるために、この超大国があなたのすぐ隣に座っているようなものですよね? 私たちが AI について考えるとき、特にその文脈では、それは人間をロボットに置き換えることではありません。 文字通り今後数十年にわたって顧客にサービスを提供する企業を支援できる段階的なステップがあります。

データは基本であり、共感は必要な人間的要素を追加します

Brent Leary: AI について考えるとき、人々は AI が実際に何に影響を与えるかについて、この狭い定義と狭い視野を持っています。 しかし、彼らが助けを必要としているときのカスタマー エクスペリエンスに関して言えば、それは AI だけでなく、少なくとも人間とコミュニケーションを取っているような感覚、少なくとも人間のように聞こえるもの、またはある種の人間の共感。 これは、適切なデータを自由に使えるようにすることと同じくらい重要です。

エリック・パウンズ:もちろんです。 データは、これらすべての基本要素です。 通話を書き起こすと、リアルタイムでデータが生成されます。 しかし、すでに存在している他のデータもあり、多くの場合、活用できるビジネス内に保管されています。 そして、どのビジネスでも取りうる最善の戦略の 1 つは、「よし。 私がすでに持っている、すでに持っている貴重なデータは何ですか? そして、それをどのように活用して、より良い顧客体験を提供できるでしょうか?」 一部は単なる一般的なデータである可能性があります。

たとえば、顧客トランザクションが発生するたびに、データを生成するエンゲージメントが発生します。 トレンドやパターンなど、そこから多くの情報を得ることができます。 彼らは将来の顧客を助けることができますよね? 多くの場合、これらの通話ややり取りは転写されて保存されます。 「この通話は監視されている可能性があります。

このまま行けば、こうなる。」 これは、情報をクラウドソーシングするようなものだと考えてください。 その情報を最大限に活用することができます。 その多くは、データをどのように活用し活用するかという基礎から始まると思います。

接続コンテキスト

ブレント・リアリー:この構成要素について少し話していただけますか。ここでは、優れた自然言語の書き起こしと理解だけでなく、感情の構成要素、つまり、音声 AI と共に共感を活用する能力についても話していただけますか?組み合わせ。 それの一部は課題を解決したり助けたりすることですが、他の部分はそれがどのように起こるか、物事を修正するだけでなく、物事が修正された方法、彼らが関与した方法から人々が得る感情です。 、彼らのコミュニティ、行き来する共感。 私たちがどこにいるのかについて少し話してもらえますか?

Erik Pounds:私が何か言った後にあなたが返答すると、次の文が最初の文と結びついていることがよくあります。 従来のアルゴリズムがどのように機能してきたかを見ると、そのコンテキストを理解していないことがよくあります。 彼らはそれを処理していないか、考慮していません。 それが可能になりました。 たとえば、先月開催されたカンファレンス NVIDIA GTC で最近いくつかのデモを公開しました。デモを公開しました。

これは、私たちが NVIDIA Tokkio と呼んでいる AI フレームワークを使用したカスタマー サービスのデモであり、これがどのように機能するかを正確に示しています。それは人間の会話の自然なタイプの流れの中にあります。 そして、それは重要です。 完全なプロセスの自動化が進んでいるため、これは非常に重要です。 おっしゃる通り、人間と触れ合いたいからですよね? あなたが言ったように、誰かが電話をかけてきて、彼らは人間の声を聞きたいと思っています。

AIがそのレベルに構築されている場合、それを実行できる必要があります. そうでなければ、経験は良くありません。 AI技術を語る上で、これは重要なことだと思います。 音声AIや会話型AIとなると、「なるほど。 さて、あなたが言っている言葉の何パーセントを理解できますか? 騒がしい環境であなたの言葉を理解できますか? 私はこれらすべてのことを行うことができます。」 そして、それがテクノロジーの仕組みです。

しかし、本当に重要なことは、それが素晴らしい経験なのか、それとも素晴らしい経験ではないのかということです。 この課題に驚くべきテクノロジーを適用しても、優れたカスタマー エクスペリエンスを提供することはできません。 そして、それが最も重要なことですよね? そのため、私たちはテクノロジーを使用して、お客様を支援できる最も重要なことの 1 つは、AI を使用し、これらの事前トレーニング済みモデルを使用して、独自のドメインと独自の環境に合わせてカスタマイズできるようにするというアプローチを採用しました。 .

植物学に関する議論がほとんどのコールセンターを運営している場合、前庭で変更した植物の名前を思い出せませんよね? しかし、その場合は、この AI が特定の用語やフレーズ、およびそのドメインに関するコンテキストを理解できるようにする必要があります。 あるいは、医療機器会社の場合、その会話では、AI モデルがトレーニングされる通常の会話では議論されないことがたくさんあると想像できます。

カスタマイズは専門用語だけでなく非常に重要ですよね? そのため、顧客が住んでいる、または電話をかけてくる世界の地域に基づいて、方言、専門用語などを理解し、適切に処理できるようにする必要があります。 そのため、これの多くはそうではありません... ストック AI モデルを使用して環境内で機能するように展開するだけでは、どこでも優れたエクスペリエンスを提供できます。 カスタマイズは非常に重要になります。

目の前のデータを見逃さない

ブレント・リアリー:これを前進させるために、企業がまだ頭を悩ませていると思われるものにはどのようなものがありますか?

Erik Pounds:この会話に関連して、あなたが言及したように、多くの異なる企業や組織で使用されるこれらの CRM プラットフォームを構築する多くの企業と良好な関係を築いています。 多くの場合、企業は既存のサービス スタックまたは技術スタックを持っていますが、何か新しいことをしたいと考えています。 彼らが今日いる場所には、いくつかの制限がある場合があります。

そのため、「自分でこれを自分で構築して、既存のプラットフォームにプラグインできる」という部分があるため、複雑さが増すことがよくあります。 または、ISV に戻って機能リクエストを行う必要がある場合もあります。 あなたのアイデアは何ですか?」

最も重要なことは、これらの会話を進めながら、手元にあるデータを理解することです。 自分で何ができるか、ISV ができること、コンサルティングの助けが少しあれば何ができるかを理解してください。 そして、完全に理解するだけで、前向きな一歩を踏み出すことができると思います。

企業内の最初の AI プロジェクトのほとんどは、慣れ親しんでいます。 彼らは常に成功しているわけではありません。 これは新しい技術です。 ですから、最初のプロジェクトで成功する可能性を最大限に高めるために、できる限りの準備をしておくことが今非常に重要です。

Brent Leary: CRM アプリケーションの観点から言えば、特に営業担当者は CRM の使用を嫌います。 彼らは物を入れるのが好きではありません。 彼らは、タイプしたり、スワイプしたり、クリックしたりするためにサインアップしませんでした。 彼らは本当に外に出て関係を築き、物を売りたいと思っています。 私の想像では、CRM であろうと ERB であろうと、頭字語であろうと、今話しているようにエンタープライズ アプリケーションと話せたら素晴らしいと思いませんか?それはただのファンタジーですか? それとも、私たちのアプリで実際にそのような会話ができる日が来ると思いますか?

Erik Pounds:いいえ、そうすべきではありません。 特に最近では、これらのほとんどが…あなたは次のように述べています。 この顧客または見込み客とこの会話をした後、Salesforce に戻ってこのレコードを更新する必要があります。」 そして、これらの記録が十分に更新されていないことが多く、ビジネスが前進するために必要なインテリジェンスを持っていないことはよく知られていますよね? パイプラインが最新ではありません。 そこから学ぶことはできません。 現在、これらの会話の多くは、私たちが行っているようなものですよね? 彼らは離れています。 彼らはどこかの建物の会議室にいません。 または、どこかの建物の会議室にいる場合でも、離れた場所にいる人がいることがよくあります。 そして、この会話を聞いているシステムがあります。

その会話を書き起こし、この場合、アカウント マネージャーまたは関係者のためにそれを行うことができれば、それは素晴らしいことです。 そして、それは今日すべて可能です。 この会話と同じように、この会話は書き起こされます。 ASR関数を使用して会話を書き起こし、NLUまたはNLP関数を適用して、私たちが話している内容のコンテキストを理解しています。 そして、これらの標準フィールドの多くを簡単に更新できます。 そして、これはすべて反復的なものです。 アクティビティの反復が多いほど、AI の適用が容易になるはずです。

これは、ソート リーダーとの一対一のインタビュー シリーズの一部です。 トランスクリプトは公開用に編集されています。 オーディオまたはビデオ インタビューの場合は、上の埋め込みプレーヤーをクリックするか、iTunes または Stitcher 経由で購読してください。