Erik Pounds de la Nvidia: În mod tradițional, algoritmii nu au înțeles contextul conversațiilor; Asta este posibil acum

Publicat: 2022-11-02

Cu puțin peste un an în urmă, am vorbit cu Bryan Catanzaro de la Nvidia despre unele dintre tehnologia interesantă pe care o dezvoltau în domeniile IA grafică, sinteza vocii și AI conversațional/vorbirii.

Bryan a împărtășit o viziune asupra viitorului a ceea ce lucruri precum învățarea automată și învățarea profundă ar putea face pentru a influența modul în care experimentăm lumea din jurul nostru. Și în timp ce unele dintre lucrurile precum AI care creează lucruri precum artă și muzică și voci cu sunet uman atrag multă atenție, există câteva exemple mai practice de AI care sunt deja folosite pentru a ajuta la crearea unor experiențe mai bune pentru clienți atunci când avem nevoie de ajutor cu un produs sau serviciu .

algoritmi-înțelegerea-contextului-conversațiilor

Cu un an care a trecut, am fost curios să aud cum evoluează lucrurile în aceste domenii și am avut norocul să vorbesc prin LinkedIn Live cu Erik Pounds, directorul senior al Enterprise Computing și Data Science la Nvidia, despre direcția lucrurilor precum conversația și Discurs AI s-a mutat de când am vorbit ultima dată cu Bryan. Mai jos este o transcriere editată a conversației noastre. Faceți clic pe playerul SoundCloud încorporat pentru a asculta conversația completă.

smallbiztrends · Erik Pounds de la Nvidia: algoritmii nu au înțeles contextul conversațiilor. Asta este posibil acum

Brent Leary: Cu ce ​​avem de-a face astăzi când vine vorba de IA pentru vorbire și AI conversațională?

Erik Pounds: Te gândești la IA pentru vorbire, te gândești la funcții precum recunoașterea automată a vorbirii în care AI rulează în fundal și poți recunoaște imediat ceea ce spui. Poate transcrie ceea ce se spune. Apoi poate acționa în timp real asupra acestor informații. Și puteți oferi o mulțime de lucruri utile făcând asta. Imaginați-vă un agent de servicii pentru clienți în partea din spate a unei conversații telefonice. Mulți dintre noi, la celălalt capăt, din partea consumatorilor, vrem să... Și ce ne dorim cu adevărat? Ei bine, unul, ne place să vorbim cu oamenii, iar celălalt este că vrem să primim ajutor rapid, nu?

Imaginați-vă că îl folosiți în partea din spate, așa că din partea agentului, imaginați-vă dacă vorbesc cu un agent care încearcă să obțină ajutor și pun o grămadă de întrebări, imaginați-vă dacă AI rulează în fundal, trăgând să găsesc articole bazate pe cunoștințe, să găsesc informații, să găsesc instrumente utile și să mă ajute să-mi răspund la întrebare.

Atunci agentul are toate aceste informații la îndemână pentru a mă ajuta să-mi rezolv problema. E ca și cum ai avea aproape ca această superputere așezată chiar lângă tine, pentru a ajuta pe cineva să aibă o experiență grozavă și să-și rezolve provocările, nu? Când ne gândim la AI, mai ales în acest context, nu este vorba despre înlocuirea omului cu un robot cu care vei vorbi. Există acești pași incrementali care vor putea ajuta companiile care oferă un serviciu clienților lor pentru literalmente decenii viitoare.

Datele sunt fundamentale, empatia adaugă elementul uman necesar

Brent Leary: Când oamenii se gândesc la AI, au această definiție restrânsă și o viziune restrânsă asupra a ceea ce poate avea de fapt impact. Dar când vine vorba de experiența clienților atunci când au nevoie de ajutor, nu se simte doar AI, ci și cum măcar simți că comunici cu un om, cel puțin cu un lucru care sună uman sau cu cineva care are un fel de empatie umană. Este la fel de important ca să aibă la dispoziție datele potrivite.

Erik Pounds: Absolut. Datele sunt elementul de bază al tuturor acestor lucruri. Dacă transcriem un apel, acesta produce date în timp real. Dar, de asemenea, există și alte date care există deja, adesea stau în repaus în interiorul unei afaceri care pot fi valorificate. Și cred că una dintre cele mai bune strategii pe care le poate lua orice companie este să-și dea seama: „Bine. Care sunt datele valoroase pe care le am deja, pe care le dețin deja? Și cum pot folosi asta pentru a oferi clienților experiențe mai bune?” Unele dintre ele pot fi doar date generale.

De exemplu, de fiecare dată când are loc o tranzacție cu un client, are loc o angajament, care produce date. Puteți obține o mulțime de informații din asta cu privire la tendințe și modele și lucruri de genul acesta. Ar putea ajuta viitorii clienți, nu? Adesea, multe dintre aceste apeluri, interacțiuni sunt transcrise și stocate. Cu toții auzim acea parte a începutului oricărui apel precum „Acest apel poate fi monitorizat.

Dacă continuați, asta se va întâmpla.” Gândiți-vă la asta ca aproape ca informații de crowdsourcing. Poți cu adevărat să folosești acele informații în beneficiul tău cel mai bun. Așa că cred că o mare parte pornește de la baza modului în care utilizați și utilizați datele.

Conectarea contextului

Brent Leary: Puteți vorbi puțin despre componenta acestui lucru în care nu suntem doar capabili să avem o transcriere și înțelegere excelentă a limbajului natural, ci și componenta sentimentelor, abilitatea de a valorifica empatia împreună cu inteligența artificială a vorbirii ca parte a combinaţie. Pentru că o parte este rezolvarea provocării sau ajutarea, dar cealaltă parte este modul în care se întâmplă și sentimentul pe care oamenii îl au nu numai dacă a corectat lucrul, ci și modul în care lucrul a fost corectat, modul în care au fost implicați. , comunitatea lor, empatia mergând înainte și înapoi. Poți să vorbești puțin despre unde suntem cu asta?

Erik Pounds: Adesea, când spun un lucru și apoi răspunzi, apoi spun altceva, următoarea propoziție este legată de prima propoziție. Când te uiți la modul în care au funcționat algoritmii în mod tradițional, adesea ei nu înțeleg acest context. Ei nu procesează asta sau iau în considerare asta. Asta este posibil acum. De exemplu, recent am lansat câteva demonstrații la conferința noastră de luna trecută, NVIDIA GTC, am lansat un demo.

Este o demonstrație de serviciu pentru clienți care folosește un cadru AI pe care îl numim NVIDIA Tokkio, care arată exact cum funcționează acest lucru în ceea ce privește furnizarea unei interacțiuni care este reală, care înțelege ceea ce spun, ce cer și poate face. aceasta într-un tip natural de flux al unei conversații umane. Și asta este critic. Pe măsură ce automatizăm mai mult din procesul complet, acest lucru este absolut critic. Pentru că, așa cum ai spus, vrem să interacționăm cu oamenii, nu? După cum ai spus, cineva sună, vrea să audă o voce umană, vrea pe cineva care să fie prietenos, care să-i înțeleagă, care să aprecieze ceea ce spune.

Dacă AI-ul este construit la acel nivel, trebuie să poată face asta. Altfel, experiența nu va fi bună. Cred că acest lucru este important când vorbim despre tehnologia AI. Când vine vorba de IA pentru vorbire sau AI conversațional, există o mulțime de aspecte tehnice de genul „Bine. Ei bine, ce procent din cuvintele pe care le spui, înțeleg? Sunt capabil să înțeleg cuvintele tale într-un mediu zgomotos? Sunt capabil să fac toate aceste lucruri.” Și așa funcționează tehnologia.

Dar ceea ce contează cu adevărat este, este o experiență grozavă sau nu este o experiență grozavă? Puteți aplica o tehnologie uimitoare la această provocare și tot nu oferiți o experiență excelentă pentru clienți. Și acesta este cel mai important lucru, nu? Așa că am abordat cu tehnologia noastră că unul dintre cele mai importante lucruri pe care le putem ajuta pe clienții noștri să le facă este să ia AI, să luăm aceste modele pregătite în prealabil și să le putem personaliza pentru propriul domeniu și propriile medii. .

Dacă conduci un centru de apeluri în care majoritatea discuțiilor sunt legate de botanică, nu-mi amintesc numele plantelor pe care le-am schimbat în curtea mea din față, nu? Dar dacă acesta este cazul, trebuie să vă asigurați că această inteligență artificială înțelege anumite terminologii și expresii și context în jurul acelui domeniu. Sau dacă este o companie de dispozitive medicale, vă puteți imagina că vor fi discutate în acea conversație o mulțime de lucruri care nu sunt într-o conversație normală în care ar fi antrenat un model AI.

Deci, personalizarea este foarte importantă, precum și limbajul, nu? Deci, pe baza zonelor lumii în care locuiesc clienții tăi sau din care apelează, vrei să poți înțelege dialectele, limbajul, lucruri de genul acesta și să poți gestiona asta în mod corespunzător. Deci, multe dintre acestea nu sunt... Nu puteți pur și simplu să luați un model AI stoc și să-l implementați pentru a funcționa într-un mediu și oferă o experiență grozavă peste tot. Personalizarea va fi foarte importantă.

Nu trece cu vederea datele din fața ta

Brent Leary: Care sunt unele dintre lucrurile care arată cum poate că companiile încă încearcă să-și dea seama în ceea ce privește să avanseze cu asta?

Erik Pounds: În contextul acestei conversații, așa cum ați menționat, aveți o relație bună cu o mulțime de companii care construiesc aceste platforme CRM care sunt utilizate de multe întreprinderi și organizații diferite. Adesea, o întreprindere, are stack-ul lor de servicii sau stiva tehnologică existentă și apoi doresc să facă ceva nou. Uneori, acolo unde se află astăzi are anumite limitări.

Deci, asta adaugă adesea unele complexități, deoarece o parte este: „Ei bine, pot să-l construiesc singur și să îl conectez la platforma mea existentă”. Sau, uneori, trebuie să te întorci la ISV-ul tău, să faci o solicitare de funcții de genul „Hei, chiar vrem să facem asta. Care sunt ideile tale?”

Cred că cel mai important, pe măsură ce porniți acele conversații, înțelegeți datele pe care le aveți la îndemână. Înțelegeți ce puteți face pe cont propriu, ce sunt capabili să facă ISV-urile dvs., ce ați putea chiar să faceți dacă ați avea doar puțin ajutor de consultanță. Și cred că doar având o înțelegere deplină, astfel încât să puteți face pași pozitivi înainte.

Majoritatea primelor proiecte de inteligență artificială din cadrul întreprinderilor sunt obișnuite să... Și-au tăiat dinții cu ele, nu? Nu au întotdeauna succes. Aceasta este o tehnologie nouă. Așa că aș spune că este foarte important să fii pregătit cât mai mult posibil, astfel încât să ai cea mai mare șansă de succes în primul tău proiect.

Brent Leary: Din perspectiva aplicației CRM, în special dacă ești agent de vânzări, ei urăsc să folosească CRM. Nu le place să pună lucruri. Nu s-au înscris pentru a scrie, a glisa sau a face clic. Ei chiar vor să iasă și să construiască relații și să vândă lucruri. Și fantezia mea este că nu ar fi grozav dacă ai putea vorbi doar cu aplicația ta de întreprindere, indiferent dacă este CRM sau ERB sau orice acronim pe care vrei să-l arunci, dacă ai putea vorbi cu ea așa cum vorbim acum. și termină-ți treaba, e doar o fantezie? Sau vedeți o zi în care am putea de fapt să facem astfel de conversații cu aplicațiile noastre?

Erik Pounds: Nu, nu ar trebui să fie. Mai ales în zilele noastre, când majoritatea dintre aceștia... Ai menționat: „Bine. Am revenit la Salesforce și am actualizat această înregistrare după ce am această conversație cu acest client sau prospect.” Și știm cu toții de multe ori aceste înregistrări nu sunt atât de bine actualizate, iar apoi afacerea nu are inteligența necesară pentru a merge mai departe, nu? Conducta nu este la zi. Nu ești în stare să înveți din asta. Multe dintre aceste conversații sunt acum ca și cum am avea, nu? Sunt la distanță. Nu sunt într-o sală de conferințe într-o clădire. Sau chiar dacă se află într-o sală de conferințe dintr-o clădire, adesea există cineva care este la distanță. Și așa există un sistem care ascultă această conversație.

Doar să poți transcrie acea conversație și să poți face asta pentru, în acest caz, managerul de cont sau oricine este implicat ar fi grozav. Și asta este totul capabil astăzi. La fel ca această conversație, această conversație este transcrisă. Folosiți o funcție ASR pentru a transcrie conversația, apoi aplicați o funcție NLU sau NLP pentru a înțelege contextul despre ce naiba vorbim. Și apoi ați putea destul de ușor să actualizați multe dintre acele câmpuri standard. Și toate acestea sunt lucruri repetitive. Cu cât o activitate este mai repetitivă, cu atât ar trebui să fie mai ușor să aplici AI.

Aceasta face parte din seria de interviuri unu-la-unu cu lideri de gândire. Transcrierea a fost editată pentru publicare. Dacă este un interviu audio sau video, dați clic pe playerul încorporat de mai sus sau abonați-vă prin iTunes sau prin Stitcher.