Nvidia의 Erik Pounds: 전통적으로 Aften 알고리즘이 대화의 맥락을 이해하지 못했습니다. 그것은 지금 가능하다

게시 됨: 2022-11-02

1년 조금 전에 저는 Nvidia의 Bryan Catanzaro와 그래픽 AI, 음성 합성 및 대화/음성 AI 분야에서 개발 중인 흥미로운 기술에 대해 이야기했습니다.

Bryan은 기계 학습 및 딥 러닝과 같은 것들이 우리가 주변 세계를 경험하는 방식에 영향을 미칠 수 있다는 미래에 대한 비전을 공유했습니다. 예술과 음악, 사람의 목소리와 같은 것을 만드는 AI와 같은 것들이 많은 주목을 받고 있지만, 제품이나 서비스에 대한 도움이 필요할 때 더 나은 고객 경험을 만드는 데 도움이 되는 AI의 더 실용적인 예가 이미 있습니다. .

대화의 맥락을 이해하는 알고리즘

1년이 지나면서 저는 이 분야에서 어떻게 진행되고 있는지 듣고 싶었고, LinkedIn Live를 통해 Nvidia의 엔터프라이즈 컴퓨팅 및 데이터 과학 수석 이사인 Erik Pounds와 대화형 및 음성 AI는 내가 Bryan과 마지막으로 이야기한 이후로 이사했습니다. 아래는 우리의 대화 내용을 편집한 것입니다. 내장된 SoundCloud 플레이어를 클릭하면 전체 대화를 들을 수 있습니다.

smallbiztrends · Nvidia의 Erik Pounds: 알고리즘은 대화의 맥락을 이해하지 못했습니다. 그게 지금 가능하다

Brent Leary: 오늘날 음성 AI 및 대화형 AI와 관련하여 우리는 무엇을 다루고 있습니까?

Erik Pounds: 음성 AI를 생각하면 AI가 백그라운드에서 실행되고 말하는 것을 즉시 인식할 수 있는 자동 음성 인식과 같은 기능을 생각할 수 있습니다. 말하는 내용을 전사할 수 있습니다. 그런 다음 해당 정보에 대해 실시간으로 조치를 취할 수 있습니다. 그리고 그렇게 함으로써 많은 도움이 되는 것들을 제공할 수 있습니다. 전화 대화의 백 엔드에 있는 고객 서비스 에이전트를 상상해 보십시오. 소비자 측면에서 우리 중 많은 사람들은 다음을 원합니다. 그리고 우리가 진정으로 원하는 것은 무엇입니까? 하나, 우리는 사람과 이야기하는 것을 좋아하고, 다른 하나는 빨리 도움을 받고 싶죠?

백엔드에서 를 사용한다고 상상해 보세요. 그래서 에이전트 측에서 제가 에이전트에게 도움을 요청하고 많은 질문을 하고 있다고 상상해 보세요. AI가 백그라운드에서 실행 중인지, 지식 기반 기사, 정보 찾기, 유용한 도구 찾기, 내 질문에 대한 답변을 도와드립니다.

그러면 상담원은 내 문제를 해결하는 데 도움이 되는 이 모든 정보를 손쉽게 얻을 수 있습니다. 마치 이 초강대국이 바로 옆에 앉아 누군가가 훌륭한 경험을 하고 문제를 해결할 수 있도록 도와주는 것과 같죠? 특히 그런 맥락에서 AI에 대해 생각할 때 인간을 로봇으로 대체하는 것이 아닙니다. 문자 그대로 앞으로 수십 년 동안 고객에게 서비스를 제공하는 기업을 도울 수 있는 이러한 점진적 단계가 있습니다.

데이터는 기본이며 공감은 필요한 인적 요소를 추가합니다.

Brent Leary: 사람들이 AI를 생각할 때, 그들은 이렇게 좁은 정의와 그것이 실제로 영향을 미칠 수 있는 것에 대한 좁은 관점을 가지고 있습니다. 그러나 도움이 필요할 때 고객 경험에 관해서는 AI뿐만 아니라 최소한 인간, 최소한 인간처럼 들리는 사물 또는 일종의 인간의 공감. 적절한 데이터를 마음대로 사용하는 것만큼이나 중요합니다.

에릭 파운드: 물론입니다. 데이터는 이 모든 것의 기본 요소입니다. 통화를 기록하면 실시간으로 데이터가 생성됩니다. 그러나 이미 존재하는 다른 데이터가 있으며 종종 비즈니스 내부에서 활용될 수 있습니다. 모든 기업이 취할 수 있는 최선의 전략 중 하나는 “좋아. 내가 이미 가지고 있고 이미 소유하고 있는 소중한 데이터는 무엇입니까? 그리고 이를 어떻게 활용하여 더 나은 고객 경험을 제공할 수 있습니까?” 그 중 일부는 일반 데이터일 수 있습니다.

예를 들어 고객 거래가 발생할 때마다 데이터를 생성하는 계약이 발생합니다. 트렌드와 패턴 및 이와 같은 것들과 관련하여 많은 정보를 얻을 수 있습니다. 그들은 미래의 고객을 도울 수 있습니다, 맞죠? 종종 이러한 호출과 상호 작용의 대부분은 전사되고 저장됩니다. 우리 모두는 통화 시작 부분에서 "이 통화는 모니터링될 수 있습니다.

진행하면 이렇게 됩니다.” 정보를 크라우드소싱하는 것과 거의 비슷하다고 생각하십시오. 그 정보를 최대한 활용할 수 있습니다. 따라서 많은 부분이 데이터를 활용하고 활용하는 방법의 기초에서 시작한다고 생각합니다.

연결 컨텍스트

Brent Leary: 우리가 훌륭한 자연어 전사 및 이해를 가질 수 있을 뿐만 아니라 감정 구성요소, 음성 AI와 함께 공감을 활용하는 능력의 일부로 이 구성 요소에 대해 조금 말씀해 주시겠습니까? 콤비네이션. 문제의 일부는 문제를 해결하거나 도움을 주기도 하지만 다른 부분은 문제가 해결되는 방식과 사람들이 문제를 바로잡았을 때뿐만 아니라 문제가 해결된 방식, 참여하는 방식에 대한 느낌이기 때문입니다. , 그들의 커뮤니티, 왔다갔다하는 공감. 우리가 어디에 있는지에 대해 조금 이야기할 수 있습니까?

Erik Pounds: 종종 내가 한 가지를 말하고 당신이 대답하면 다음 문장이 첫 번째 문장과 연결되는 다른 것을 말합니다. 전통적으로 알고리즘이 작동하는 방식을 살펴보면 종종 해당 컨텍스트를 이해하지 못합니다. 그들은 그것을 처리하거나 고려하지 않습니다. 그것은 지금 가능합니다. 예를 들어, 우리는 지난 달 NVIDIA GTC 컨퍼런스에서 최근 몇 가지 데모를 발표했습니다. 우리는 데모를 발표했습니다.

우리가 NVIDIA Tokkio라고 부르는 AI 프레임워크를 사용하는 고객 서비스 데모로, 실제와 같은 상호 작용을 제공하는 것과 관련하여 이것이 어떻게 작동하는지 정확히 보여줍니다. 그것은 인간 대화의 자연스러운 유형의 흐름입니다. 그리고 그것은 중요합니다. 전체 프로세스의 더 많은 부분을 자동화함에 따라 이는 절대적으로 중요합니다. 당신이 말했듯이 우리는 인간과 상호 작용하고 싶기 때문입니다. 그렇죠? 당신이 말했듯이, 누군가가 전화를 걸어 인간의 목소리를 듣고 싶어하고, 친절하고, 자신을 이해하고, 자신의 말을 이해해 주는 누군가를 원합니다.

AI가 그 수준으로 구축되면 그렇게 할 수 있어야 합니다. 그렇지 않으면 경험이 좋지 않을 것입니다. AI 기술에 대해 이야기할 때 이것이 중요하다고 생각합니다. 음성 AI 또는 대화형 AI에 관해서는 "좋아요. 글쎄, 당신이 말하는 단어의 몇 퍼센트를 이해합니까? 시끄러운 환경에서 당신의 말을 이해할 수 있습니까? 나는 이 모든 일을 할 수 있다.” 이것이 바로 기술이 작동하는 방식입니다.

그러나 정말로 중요한 것은 그것이 훌륭한 경험인가 아니면 훌륭한 경험이 아닌가 하는 것입니다. 이 문제에 놀라운 기술을 적용했지만 여전히 훌륭한 고객 경험을 제공하지 못할 수 있습니다. 그리고 그게 가장 중요하죠? 그래서 우리는 고객이 할 수 있도록 도울 수 있는 가장 중요한 일 중 하나가 AI를 사용하고 사전 훈련된 모델을 사용하여 고유한 영역과 환경에 맞게 사용자 정의할 수 있도록 우리 기술로 접근 방식을 취했습니다. .

식물학에 대한 논의가 가장 많은 콜센터를 운영하고 계시다면, 제 앞마당에서 변한 식물 이름이 기억나지 않으시죠? 그러나 그런 경우에는 이 AI가 해당 도메인에 대한 특정 용어와 구문 및 컨텍스트를 이해하는지 확인해야 합니다. 또는 의료 기기 회사라면 AI 모델이 훈련되는 일반적인 대화에는 없는 많은 것들이 대화에서 논의될 것이라고 상상할 수 있습니다.

따라서 사용자 정의는 용어뿐만 아니라 매우 중요합니다. 맞습니까? 따라서 고객이 거주하거나 전화를 거는 지역에 따라 방언, 용어 등을 이해하고 적절하게 처리할 수 있기를 원합니다. 따라서 대부분은 그렇지 않습니다. 재고 AI 모델을 사용하여 환경에서 작동하도록 배포할 수 없으며 어디에서나 훌륭한 경험을 제공합니다. 커스터마이징이 매우 중요할 것입니다.

바로 눈앞에 있는 데이터를 간과하지 마십시오.

Brent Leary: 회사가 앞으로 나아가기 위해 여전히 노력하고 있는 방법에는 어떤 것이 있습니까?

Erik Pounds: 이 대화의 맥락에서 당신이 언급한 것처럼 다양한 기업 및 조직에서 사용하는 이러한 CRM 플랫폼을 구축하는 여러 회사와 좋은 관계를 맺고 있습니다. 기업의 경우 기존 서비스 스택이나 기술 스택을 보유하고 있으며 새로운 것을 하고 싶어하는 경우가 많습니다. 때때로 그들이 오늘날의 장소에는 몇 가지 제한 사항이 있습니다.

그 중 일부는 "글쎄, 나는 이것을 스스로 구축하고 기존 플랫폼에 연결할 수 있다."이기 때문에 종종 복잡성을 추가합니다. 또는 때때로 ISV로 돌아가서 다음과 같은 기능을 요청해야 합니다. 당신의 아이디어는 무엇입니까?”

가장 중요한 것은 대화를 진행하면서 손끝에 있는 데이터를 이해하는 것입니다. 스스로 할 수 있는 일, ISV가 할 수 있는 일, 약간의 컨설팅 지원만 있다면 할 수 있는 일을 이해하십시오. 그리고 충분히 이해하는 것만으로도 긍정적인 발걸음을 내딛을 수 있다고 생각합니다.

기업 내부의 대부분의 첫 번째 AI 프로젝트는… 항상 성공적인 것은 아닙니다. 이것은 새로운 기술입니다. 그래서 가능한 한 많이 준비하고 있다고 말하고 싶습니다. 그래서 첫 번째 프로젝트에서 가장 큰 성공 기회를 갖는 것이 지금 매우 중요합니다.

Brent Leary: CRM 애플리케이션 관점에서, 특히 영업 사원이라면 CRM 사용을 싫어합니다. 그들은 물건을 넣는 것을 좋아하지 않습니다. 그들은 입력하거나 스와이프하거나 클릭하기 위해 가입하지 않았습니다. 그들은 정말로 나가서 관계를 구축하고 물건을 팔기를 원합니다. 그리고 제 환상은, CRM이든 ERB이든 어떤 약어이든 상관없이 엔터프라이즈 애플리케이션과 대화할 수 있다면 멋지지 않을까요? 그리고 당신의 일을 끝내십시오, 그것은 단지 환상입니까? 아니면 실제로 앱으로 그런 종류의 대화를 할 수 있는 날이 올까요?

Erik Pounds: 아니, 그러면 안됩니다. 특히 요즘은 대부분이... "알았어. 이 고객 또는 잠재 고객과 이 대화를 나눈 후 Salesforce로 돌아가 이 레코드를 업데이트해야 합니다." 그리고 우리 모두는 이러한 기록이 잘 업데이트되지 않은 경우가 많다는 것을 알고 있습니다. 그러면 비즈니스는 앞으로 나아가는 데 필요한 인텔리전스가 없습니다. 그렇죠? 파이프라인이 최신 상태가 아닙니다. 당신은 그것에서 배울 수 없습니다. 많은 대화가 지금 우리가 하고 있는 것과 같죠? 그들은 멀리 떨어져 있습니다. 그들은 어떤 건물의 회의실에 있지 않습니다. 또는 어떤 건물의 회의실에 있더라도 멀리 떨어져 있는 사람이 있는 경우가 많습니다. 그래서 이 대화를 듣는 시스템이 있습니다.

그 대화를 기록할 수 있고 이 경우 계정 관리자 또는 관련된 모든 사람을 위해 그렇게 할 수 있다는 것만으로도 큰 도움이 될 것입니다. 그리고 그것은 오늘날 모두 가능합니다. 이 대화와 마찬가지로 이 대화가 전사됩니다. ASR 기능을 사용하여 대화를 기록하고 NLU 또는 NLP 기능을 적용하여 우리가 말하는 내용의 컨텍스트를 이해하고 있습니다. 그러면 아주 쉽게 많은 표준 필드를 업데이트할 수 있습니다. 그리고 이것은 모두 반복되는 일입니다. 반복적인 활동이 많을수록 AI 적용이 쉬워야 합니다.

이것은 사상가들과의 일대일 인터뷰 시리즈의 일부입니다. 번역본은 출판을 위해 편집되었습니다. 오디오 또는 비디오 인터뷰인 경우 위의 내장 플레이어를 클릭하거나 iTunes 또는 Stitcher를 통해 구독하십시오.