Erik Pounds de Nvidia : les algorithmes traditionnels n'ont toujours pas compris le contexte des conversations ; C'est possible maintenant

Publié: 2022-11-02

Il y a un peu plus d'un an, j'ai parlé avec Bryan Catanzaro de Nvidia de certaines des technologies intéressantes qu'ils développaient dans les domaines de l'IA graphique, de la synthèse vocale et de l'IA conversationnelle/de la parole.

Bryan a partagé une vision de l'avenir de ce que des choses comme l'apprentissage automatique et l'apprentissage en profondeur pourraient faire pour avoir un impact sur la façon dont nous vivons le monde qui nous entoure. Et tandis que certaines choses comme l'IA créant des choses comme l'art et la musique et les voix à consonance humaine attirent beaucoup d'attention, il existe des exemples plus pratiques d'IA déjà utilisés pour aider à créer de meilleures expériences client lorsque nous avons besoin d'aide avec un produit ou un service. .

algorithmes-comprendre-le-contexte-des-conversations

Un an plus tard, j'étais curieux de savoir comment les choses progressaient dans ces domaines, et j'ai eu la chance de parler via LinkedIn Live avec Erik Pounds, directeur principal de l'informatique d'entreprise et de la science des données chez Nvidia, autour de la direction des choses comme la conversation et les IA ont emménagé depuis la dernière fois que j'ai parlé avec Bryan. Vous trouverez ci-dessous une transcription éditée de notre conversation. Cliquez sur le lecteur SoundCloud intégré pour entendre la conversation complète.

smallbiztrends · Erik Pounds de Nvidia : Les algorithmes n'ont pas compris le contexte des conversations. C'est possible maintenant

Brent Leary : À quoi avons-nous affaire aujourd'hui en matière d'IA vocale et d'IA conversationnelle ?

Erik Pounds : Vous pensez à l'IA vocale, pensez à des fonctions comme la reconnaissance vocale automatique où l'IA s'exécute en arrière-plan et peut reconnaître immédiatement ce que vous dites. Il peut retranscrire ce qui se dit. Il peut alors agir en temps réel sur ces informations. Et vous pouvez fournir beaucoup de choses utiles en faisant cela. Imaginez un agent du service client en fin de conversation téléphonique. Beaucoup d'entre nous à l'autre bout, du côté des consommateurs, nous voulons… Et que voulons-nous vraiment ? Eh bien, un, nous aimons parler aux humains, et l'autre est que nous voulons obtenir de l'aide rapidement, n'est-ce pas ?

Imaginez que vous l'utilisiez en arrière-plan, donc du côté de l'agent, imaginez si je parle à un agent essayant d'obtenir de l'aide et que je pose un tas de questions, imaginez si l'IA fonctionne en arrière-plan, tirant des articles basés sur la connaissance, trouver des informations, trouver des outils utiles et m'aider à répondre à ma question.

Ensuite, l'agent a toutes ces informations à portée de main pour m'aider à résoudre mon problème. C'est comme avoir presque comme cette superpuissance assise juste à côté de vous, pour aider quelqu'un à vivre une expérience formidable et à résoudre ses défis, n'est-ce pas ? Lorsque nous pensons à l'IA, en particulier dans ce contexte, il ne s'agit pas de remplacer l'humain par un robot à qui vous parlerez. Il y a ces étapes progressives qui vont pouvoir aider les entreprises qui fournissent un service à leurs clients pendant littéralement des décennies à venir.

Les données sont fondamentales, l'empathie ajoute l'élément humain nécessaire

Brent Leary : Lorsque les gens pensent à l'IA, ils ont cette définition étroite et une vision étroite de ce qu'elle peut réellement avoir d'impact. Mais en ce qui concerne l'expérience client lorsqu'il a besoin d'aide, cela ressemble non seulement à l'IA, mais à la combinaison d'au moins l'impression de communiquer avec un humain, au moins une chose à consonance humaine ou quelqu'un qui a une sorte de empathie humaine. C'est tout aussi important que d'avoir les bonnes données à leur disposition.

Erik Pounds : Absolument. Les données sont l'élément fondamental de tout cela. Si nous transcrivons un appel, cela produit des données en temps réel. Mais il existe également d'autres données qui existent déjà, souvent au repos à l'intérieur d'une entreprise et qui peuvent être exploitées. Et je pense que l'une des meilleures stratégies que toute entreprise puisse adopter est de se dire : « D'accord. Quelles sont les précieuses données que j'ai déjà, que je possède déjà ? Et comment puis-je en tirer parti pour offrir une meilleure expérience client ? » Certaines d'entre elles peuvent être simplement des données générales.

Par exemple, chaque fois qu'une transaction client se produit, un engagement se produit, qui produit des données. Vous pouvez en tirer beaucoup d'informations sur les tendances et les modèles, etc. Ils pourraient aider les futurs clients, non ? Souvent beaucoup de ces appels, interactions sont transcrits et stockés. Nous entendons tous cette partie du début de tout appel comme : « Cet appel peut être surveillé.

Si vous continuez, c'est ce qui va se passer. Considérez cela comme presque comme des informations de crowdsourcing. Vous pouvez vraiment tirer parti de ces informations à votre meilleur avantage. Je pense donc que cela commence en grande partie par la façon dont vous exploitez et utilisez les données.

Contexte de connexion

Brent Leary : Pouvez-vous parler un peu de la composante de cela où nous sommes non seulement en mesure d'avoir une excellente transcription et compréhension du langage naturel, mais aussi la composante sentimentale, la capacité à tirer parti de l'empathie avec l'IA de la parole dans le cadre de la combinaison. Parce qu'une partie consiste à résoudre le défi ou à aider, mais l'autre partie est la façon dont cela se produit et le sentiment que les gens ressentent non seulement en corrigeant la chose, mais la manière dont la chose a été corrigée, la manière dont ils se sont engagés , leur communauté, l'empathie qui va et vient. Pouvez-vous nous dire un peu où nous en sommes?

Erik Pounds : Souvent, quand je dis une chose, et que vous répondez, puis que je dis autre chose, la phrase suivante est liée à la première phrase. Lorsque vous regardez comment les algorithmes ont traditionnellement fonctionné, ils ne comprennent souvent pas ce contexte. Ils ne traitent pas cela ou ne prennent pas cela en considération. C'est possible maintenant. Par exemple, nous avons sorti des démos récemment lors de notre conférence du mois dernier, NVIDIA GTC, nous avons sorti une démo.

Il s'agit d'une démonstration de service client utilisant un cadre d'IA que nous appelons NVIDIA Tokkio qui montre exactement comment cela fonctionne en ce qui concerne la fourniture d'une interaction réaliste, qui comprend ce que je dis, ce que je demande et peut faire dans un type naturel de flux d'une conversation humaine. Et c'est essentiel. Comme nous automatisons davantage le processus complet, c'est absolument essentiel. Parce que comme vous l'avez dit, nous voulons interagir avec les humains, n'est-ce pas ? Comme vous l'avez dit, quelqu'un appelle, il veut entendre une voix humaine, il veut quelqu'un qui soit amical, qui le comprenne, qui apprécie ce qu'il dit.

Si l'IA est construite à ce niveau, elle doit pouvoir le faire. Sinon, l'expérience ne sera pas bonne. Je pense que c'est important quand on parle de technologie d'IA. Quand il s'agit d'IA vocale ou d'IA conversationnelle, il y a beaucoup de détails techniques comme « D'accord. Eh bien, quel pourcentage des mots dites-vous est-ce que je comprends ? Suis-je capable de comprendre vos paroles dans un environnement bruyant ? Je suis capable de faire tout ça. Et c'est comme ça que la technologie fonctionne.

Mais ce qui compte vraiment, c'est est-ce une expérience formidable ou n'est-ce pas une expérience formidable ? Vous pouvez appliquer une technologie incroyable à ce défi sans offrir une excellente expérience client. Et c'est le plus important, non ? Nous avons donc adopté l'approche avec notre technologie selon laquelle l'une des choses les plus importantes que nous pouvons aider nos clients à faire est de prendre l'IA, de prendre ces modèles pré-formés et de pouvoir les personnaliser pour leur propre domaine et leurs propres environnements. .

Si vous dirigez un centre d'appels où la plupart des discussions tournent autour de la botanique, je ne me souviens pas des noms des plantes que j'ai changées à travers les époques de mon jardin, n'est-ce pas ? Mais si tel est le cas, vous devez vous assurer que cette IA comprend certaines terminologies, expressions et contextes autour de ce domaine. Ou s'il s'agit d'une entreprise de dispositifs médicaux, vous pouvez imaginer qu'il y a beaucoup de choses qui seront discutées dans cette conversation qui ne font pas partie d'une conversation normale dans laquelle un modèle d'IA serait formé.

La personnalisation est donc super importante ainsi que le jargon, n'est-ce pas ? Donc, en fonction des régions du monde dans lesquelles vos clients vivent ou appellent, vous voulez être en mesure de comprendre les dialectes, le jargon, des choses comme celle-ci et être capable de gérer cela correctement. Donc, une grande partie de cela n'est pas… Vous ne pouvez pas simplement prendre un modèle d'IA standard et le déployer pour travailler dans un environnement et il offre une excellente expérience partout. La personnalisation va être très importante.

Ne négligez pas les données juste devant vous

Brent Leary: Quelles sont certaines des choses qui expliquent peut-être pourquoi les entreprises essaient encore de comprendre comment aller de l'avant avec cela?

Erik Pounds : Dans le contexte de cette conversation, comme vous l'avez mentionné, vous entretenez de bonnes relations avec un groupe d'entreprises qui construisent ces plates-formes CRM qui sont utilisées par de nombreuses entreprises et organisations différentes. Souvent une entreprise, ils ont leur pile de services ou leur pile technologique existante, puis ils veulent faire quelque chose de nouveau. Parfois, là où ils se trouvent aujourd'hui, il y a des limites.

Donc, cela ajoute souvent des complexités parce qu'une partie de cela est: "Eh bien, je peux créer moi-même cela et le brancher sur ma plate-forme existante." Ou parfois, vous devez retourner à votre ISV, faire une demande de fonctionnalité du type "Hé, nous voulons vraiment faire ça. Quelles sont vos idées ?

Je pense que le plus important, au fur et à mesure que vous engagez ces conversations, comprenez les données qui sont à portée de main. Comprenez ce que vous pouvez faire par vous-même, ce que vos ISV sont capables de faire, ce que vous pourriez même être capable de faire si vous aviez juste un peu d'aide en tant que consultant. Et je pense qu'il suffit d'avoir une compréhension complète, afin que vous puissiez faire des pas positifs vers l'avant.

La plupart des premiers projets d'IA au sein des entreprises sont habitués à… Ils se sont fait les dents avec, n'est-ce pas ? Ils ne réussissent pas toujours. Il s'agit d'une nouvelle technologie. Je dirais donc qu'être préparé le plus possible, pour avoir le plus de chances de succès dans votre premier projet est super important en ce moment.

Brent Leary : Du point de vue de l'application CRM, en particulier si vous êtes un vendeur, ils détestent utiliser le CRM. Ils n'aiment pas mettre des trucs. Ils ne se sont pas inscrits pour taper, balayer ou cliquer. Ils veulent vraiment sortir et établir des relations et vendre des choses. Et mon fantasme est, ne serait-ce pas cool si vous pouviez simplement parler à votre application d'entreprise, que ce soit CRM ou ERB ou n'importe quel acronyme que vous voulez lancer là-bas, si vous pouviez simplement lui parler comme nous parlons en ce moment et faites vos affaires, est-ce juste un fantasme ? Ou voyez-vous un jour où nous pourrions réellement avoir ce genre de conversation avec nos applications ?

Erik Pounds : Non, ça ne devrait pas l'être. Surtout de nos jours, alors que la plupart de ces… Vous avez dit : « D'accord. Je dois retourner dans Salesforce et mettre à jour cet enregistrement après avoir eu cette conversation avec ce client ou prospect. Et nous savons tous que souvent ces dossiers ne sont pas bien mis à jour, et que l'entreprise n'a pas l'intelligence dont elle a besoin pour aller de l'avant, n'est-ce pas ? Le pipeline n'est pas à jour. Vous n'êtes pas en mesure d'apprendre de cela. Beaucoup de ces conversations ressemblent maintenant à celles que nous avons, n'est-ce pas ? Ils sont éloignés. Ils ne sont pas dans une salle de conférence dans un bâtiment. Ou même s'ils sont dans une salle de conférence dans un bâtiment, il y a souvent quelqu'un qui est éloigné. Et donc il y a un système qui écoute cette conversation.

Le simple fait de pouvoir transcrire cette conversation et de pouvoir le faire pour, dans ce cas, le gestionnaire de compte ou quiconque est impliqué serait formidable. Et c'est tout capable aujourd'hui. Tout comme cette conversation, cette conversation est transcrite. Vous utilisez une fonction ASR pour transcrire la conversation, puis vous appliquez une fonction NLU ou NLP pour comprendre le contexte de ce dont nous parlons. Et puis vous pourriez assez facilement mettre à jour un grand nombre de ces champs standard. Et ce sont tous des trucs répétitifs. Plus une activité est répétitive, plus il devrait être facile d'appliquer l'IA.

Cela fait partie de la série d'entretiens individuels avec des leaders d'opinion. La transcription a été éditée pour publication. S'il s'agit d'une interview audio ou vidéo, cliquez sur le lecteur intégré ci-dessus, ou abonnez-vous via iTunes ou via Stitcher.