Erik Pounds von Nvidia: Traditionell haben Algorithmen oft den Kontext von Gesprächen nicht verstanden; Das ist jetzt möglich

Veröffentlicht: 2022-11-02

Vor etwas mehr als einem Jahr sprach ich mit Bryan Catanzaro von Nvidia über einige der interessanten Technologien, die sie in den Bereichen grafische KI, Sprachsynthese und Gesprächs-/Sprach-KI entwickeln.

Bryan teilte eine Vision der Zukunft, wie Dinge wie maschinelles Lernen und Deep Learning die Art und Weise beeinflussen könnten, wie wir die Welt um uns herum erleben. Und während einige der Dinge wie KI, die Dinge wie Kunst und Musik erschafft, und menschlich klingende Stimmen viel Aufmerksamkeit erhalten, gibt es einige praktischere Beispiele dafür, wie KI bereits verwendet wird, um bessere Kundenerlebnisse zu schaffen, wenn wir Hilfe bei einem Produkt oder einer Dienstleistung benötigen .

algorithmen-verstehen-den-kontext-von-gesprächen

Nach einem Jahr war ich neugierig zu hören, wie sich die Dinge in diesen Bereichen entwickeln, und ich hatte das Glück, über LinkedIn Live mit Erik Pounds, Sr. Director of Enterprise Computing and Data Science bei Nvidia, über die Richtung von Dingen wie Konversation und Speech AI ist eingezogen, seit ich das letzte Mal mit Bryan gesprochen habe. Nachfolgend finden Sie eine bearbeitete Abschrift unseres Gesprächs. Klicken Sie auf den eingebetteten SoundCloud-Player, um das vollständige Gespräch zu hören.

smallbiztrends · Erik Pounds von Nvidia: Algorithmen haben den Kontext von Gesprächen nicht verstanden. Das ist jetzt möglich

Brent Leary: Womit haben wir es heute zu tun, wenn es um Sprach-KI und Konversations-KI geht?

Erik Pounds: Sie denken an Sprach-KI, denken an Funktionen wie die automatische Spracherkennung, bei der die KI im Hintergrund läuft und sofort erkennen kann, was Sie sagen. Es kann das Gesagte transkribieren. Es kann dann in Echtzeit auf diese Informationen reagieren. Und Sie können dadurch viele hilfreiche Dinge bereitstellen. Stellen Sie sich einen Kundendienstmitarbeiter am Ende eines Telefongesprächs vor. Viele von uns auf der anderen Seite, auf der Verbraucherseite, wollen … Und was wollen wir wirklich? Nun, erstens reden wir gerne mit Menschen und zweitens wollen wir schnell Hilfe bekommen, richtig?

Stellen Sie sich vor, Sie verwenden es am hinteren Ende, also auf der Agentenseite, stellen Sie sich vor, wenn ich mit einem Agenten spreche, der versucht, Hilfe zu bekommen, und ich eine Reihe von Fragen stelle, stellen Sie sich vor, wenn die KI im Hintergrund läuft und zieht Wissensbasierte Artikel zu erstellen, Informationen zu finden, hilfreiche Tools zu finden und mir bei der Beantwortung meiner Frage zu helfen.

Dann hat der Agent all diese Informationen direkt zur Hand, um mir bei der Lösung meines Problems zu helfen. Es ist, als würde fast diese Supermacht direkt neben dir sitzen, um jemandem zu helfen, eine großartige Erfahrung zu machen und seine Herausforderungen zu meistern, richtig? Wenn wir an KI denken, insbesondere in diesem Zusammenhang, geht es nicht darum, den Menschen durch einen Roboter zu ersetzen, mit dem Sie sprechen. Es gibt diese inkrementellen Schritte, die Unternehmen helfen können, die ihren Kunden buchstäblich in den kommenden Jahrzehnten einen Service bieten.

Daten sind grundlegend, Empathie fügt das notwendige menschliche Element hinzu

Brent Leary: Wenn Leute an KI denken, haben sie diese enge Definition und eine enge Vorstellung davon, was sie tatsächlich bewirken kann. Aber wenn es um das Kundenerlebnis geht, wenn sie Hilfe brauchen, fühlt es sich nicht nur wie die KI an, sondern die Kombination aus zumindest dem Gefühl, mit einem Menschen zu kommunizieren, zumindest mit einem menschlich klingenden Ding oder jemandem, der so etwas hat menschliche Empathie. Es ist genauso wichtig wie die richtigen Daten zur Verfügung zu haben.

Erik Pounds: Absolut. Daten sind das grundlegende Element von all dem. Wenn wir einen Anruf transkribieren, entstehen Daten in Echtzeit. Aber es gibt auch andere Daten, die bereits vorhanden sind und oft in einem Unternehmen ruhen, die genutzt werden können. Und ich denke, eine der besten Strategien, die ein Unternehmen ergreifen kann, ist herauszufinden: „In Ordnung. Was sind die wertvollen Daten, die ich bereits habe, die ich bereits besitze? Und wie kann ich das nutzen, um bessere Kundenerlebnisse zu bieten?“ Einige davon können nur allgemeine Daten sein.

Beispielsweise findet jedes Mal, wenn eine Kundentransaktion stattfindet, eine Interaktion statt, die Daten produziert. Daraus können Sie viele Informationen über Trends und Muster und ähnliches gewinnen. Sie könnten zukünftigen Kunden helfen, oder? Oft werden viele dieser Anrufe und Interaktionen transkribiert und gespeichert. Wir alle hören am Anfang eines Anrufs diesen Teil wie: „Dieser Anruf wird möglicherweise überwacht.

Wenn Sie fortfahren, wird Folgendes passieren.“ Stellen Sie sich das fast wie Crowdsourcing-Informationen vor. Sie können diese Informationen wirklich zu Ihrem besten Vorteil nutzen. Ich denke also, dass vieles davon mit der Grundlage dafür beginnt, wie Sie Daten nutzen und nutzen.

Kontext verbinden

Brent Leary: Können Sie ein wenig über die Komponente davon sprechen, bei der wir nicht nur in der Lage sind, eine großartige natürliche Sprachtranskription und ein hervorragendes Verständnis zu erzielen, sondern auch die Gefühlskomponente, die Fähigkeit, Empathie zusammen mit der Sprach-KI als Teil der Kombination. Denn ein Teil davon besteht darin, die Herausforderung zu lösen oder zu helfen, aber der andere Teil ist, wie es passiert und das Gefühl, dass die Leute nicht nur die Sache korrigiert bekommen, sondern auch die Art und Weise, wie die Sache korrigiert wurde, die Art und Weise, wie sie sich engagierten , ihre Gemeinschaft, die Empathie, die hin und her geht. Können Sie ein bisschen darüber sprechen, wo wir damit stehen?

Erik Pounds: Oft, wenn ich etwas sage und Sie dann antworten, dann sage ich etwas anderes, ist der folgende Satz mit dem ersten Satz verbunden. Wenn Sie sich ansehen, wie Algorithmen traditionell funktioniert haben, verstehen sie diesen Kontext oft nicht. Sie verarbeiten das nicht oder berücksichtigen das nicht. Das ist jetzt möglich. Zum Beispiel haben wir erst letzten Monat auf unserer Konferenz, NVIDIA GTC, einige Demos herausgebracht, wir haben eine Demo herausgebracht.

Es ist eine Kundenservice-Demo mit einem KI-Framework namens NVIDIA Tokkio, das genau zeigt, wie dies im Hinblick auf eine lebensechte Interaktion funktioniert, die versteht, was ich sage, was ich verlange, und in der Lage ist, dies zu tun es in einer natürlichen Art des Flusses eines menschlichen Gesprächs. Und das ist kritisch. Da wir den gesamten Prozess immer mehr automatisieren, ist das absolut entscheidend. Denn wie Sie sagten, wir wollen mit Menschen interagieren, richtig? Wie Sie sagten, jemand ruft an, er möchte eine menschliche Stimme hören, er möchte jemanden, der freundlich ist, der ihn versteht, der zu schätzen weiß, was er sagt.

Wenn die KI auf diesem Niveau gebaut ist, muss sie dazu in der Lage sein. Andernfalls wird die Erfahrung nicht gut sein. Ich denke, das ist wichtig, wenn wir über KI-Technologie sprechen. Wenn es um Sprach-KI oder Konversations-KI geht, gibt es viele technische Aspekte wie „In Ordnung. Nun, wie viel Prozent der Wörter, die Sie sagen, verstehe ich? Kann ich Ihre Worte in einer lauten Umgebung verstehen? Ich bin in der Lage, all diese Dinge zu tun.“ Und so funktioniert die Technik.

Aber was wirklich zählt ist, ist es eine großartige Erfahrung oder ist es keine großartige Erfahrung? Sie können erstaunliche Technologie auf diese Herausforderung anwenden und trotzdem kein großartiges Kundenerlebnis bieten. Und das ist das Wichtigste, oder? Wir haben also mit unserer Technologie den Ansatz gewählt, dass eines der wichtigsten Dinge, bei denen wir unseren Kunden helfen können, darin besteht, die KI zu nehmen, diese vortrainierten Modelle zu nehmen und sie für ihre eigene Domäne und ihre eigenen Umgebungen anzupassen .

Wenn Sie ein Callcenter betreiben, in dem sich die meisten Diskussionen um Botanik drehen, kann ich mich nicht an die Namen der Pflanzen erinnern, die ich im Laufe der Zeit in meinem Vorgarten geändert habe, oder? Aber wenn das der Fall ist, müssen Sie sicherstellen, dass diese KI bestimmte Terminologien und Ausdrücke und den Kontext in diesem Bereich versteht. Oder wenn es sich um ein Unternehmen für medizinische Geräte handelt, können Sie sich vorstellen, dass in diesem Gespräch viele Dinge besprochen werden, die nicht in einem normalen Gespräch vorkommen, in dem ein KI-Modell trainiert wird.

Anpassung ist also super wichtig, genauso wie Fachsprache, oder? Basierend auf den Regionen der Welt, in denen Ihre Kunden leben oder aus denen sie anrufen, möchten Sie also in der Lage sein, Dialekte, Fachsprache und dergleichen zu verstehen und damit richtig umzugehen. Vieles davon ist also nicht … Sie können nicht einfach ein Standard-KI-Modell nehmen und es für die Arbeit in einer Umgebung einsetzen, und es bietet überall eine großartige Erfahrung. Die Anpassung wird sehr wichtig sein.

Übersehen Sie nicht die Daten direkt vor Ihnen

Brent Leary: Was sind einige der Dinge, die Unternehmen vielleicht immer noch versuchen, sich zurechtzufinden, um damit voranzukommen?

Erik Pounds: Im Zusammenhang mit diesem Gespräch haben Sie, wie Sie bereits erwähnt haben, gute Beziehungen zu einer Reihe von Unternehmen, die diese CRM-Plattformen entwickeln, die von vielen verschiedenen Unternehmen und Organisationen verwendet werden. Oft haben sie als Unternehmen ihren bestehenden Service-Stack oder Tech-Stack und wollen dann etwas Neues machen. Manchmal gibt es dort, wo sie heute sind, einige Einschränkungen.

Das fügt oft einige Komplexität hinzu, weil ein Teil davon ist: „Nun, ich kann das selbst bauen und es in meine bestehende Plattform stecken.“ Oder manchmal müssen Sie zu Ihrem ISV ​​zurückkehren und eine Feature-Anfrage stellen wie: „Hey, wir wollen das wirklich machen. Was sind deine Ideen?“

Ich denke, am wichtigsten ist, dass Sie die Daten verstehen, die Ihnen zur Verfügung stehen, wenn Sie diese Gespräche in Gang bringen. Verstehen Sie, was Sie selbst tun können, wozu Ihre ISVs in der Lage sind, was Sie möglicherweise sogar tun könnten, wenn Sie nur ein wenig Beratungshilfe hätten. Und ich denke, nur mit einem vollständigen Verständnis können Sie positive Schritte nach vorne machen.

Die meisten ersten KI-Projekte in Unternehmen sind daran gewöhnt … Sie haben sich damit die Zähne ausgebissen, oder? Sie sind nicht immer erfolgreich. Dies ist eine neue Technologie. Daher würde ich sagen, dass es jetzt super wichtig ist, so gut wie möglich vorbereitet zu sein, damit Sie die größten Erfolgschancen bei Ihrem ersten Projekt haben.

Brent Leary: Aus Sicht der CRM-Anwendung hassen sie die Verwendung von CRM, insbesondere wenn Sie ein Verkäufer sind. Sie mögen es nicht, Dinge hineinzulegen. Sie haben sich nicht zum Tippen, Wischen oder Klicken angemeldet. Sie wollen wirklich rausgehen und Beziehungen aufbauen und Dinge verkaufen. Und meine Fantasie ist, wäre es nicht cool, wenn Sie einfach mit Ihrer Unternehmensanwendung sprechen könnten, egal ob CRM oder ERB oder was auch immer Sie für ein Akronym verwenden möchten, wenn Sie einfach so sprechen könnten, wie wir es gerade tun und deine Sachen erledigen, ist das nur Fantasie? Oder sehen Sie einen Tag, an dem wir diese Art von Gesprächen tatsächlich mit unseren Apps führen könnten?

Erik Pounds: Nein, das sollte es nicht sein. Besonders heutzutage, wo die meisten davon … Sie sagten: „Okay. Ich muss zurück zu Salesforce gehen und diesen Datensatz aktualisieren, nachdem ich dieses Gespräch mit diesem Kunden oder Interessenten geführt habe.“ Und wir alle wissen, dass diese Aufzeichnungen oft nicht so gut aktualisiert sind, und dann hat das Unternehmen nicht die Intelligenz, die es braucht, um voranzukommen, richtig? Die Pipeline ist nicht aktuell. Daraus kann man nicht lernen. Viele dieser Gespräche sind jetzt so, wie wir sie führen, richtig? Sie sind abgelegen. Sie sind nicht in einem Konferenzraum in irgendeinem Gebäude. Oder selbst wenn sie sich in einem Konferenzraum in einem Gebäude befinden, gibt es oft jemanden, der entfernt ist. Und so gibt es ein System, das diesem Gespräch zuhört.

Es wäre großartig, dieses Gespräch einfach transkribieren zu können und dies in diesem Fall für den Kundenbetreuer oder jeden anderen Beteiligten tun zu können. Und das ist heute alles möglich. Genau wie dieses Gespräch wird dieses Gespräch transkribiert. Sie verwenden eine ASR-Funktion, um das Gespräch zu transkribieren, und dann wenden Sie eine NLU- oder NLP-Funktion an, um den Kontext dessen zu verstehen, worüber zum Teufel wir sprechen. Und dann könnten Sie ziemlich einfach viele dieser Standardfelder aktualisieren. Und das ist alles sich wiederholendes Zeug. Je repetitiver eine Aktivität ist, desto einfacher sollte es sein, KI anzuwenden.

Dies ist Teil der One-on-One-Interview-Reihe mit Vordenkern. Das Transkript wurde für die Veröffentlichung bearbeitet. Wenn es sich um ein Audio- oder Videointerview handelt, klicken Sie oben auf den eingebetteten Player oder abonnieren Sie es über iTunes oder über Stitcher.