Nvidia'nın Erik Pound'u: Geleneksel Algoritmalar Konuşmaların Bağlamını Anlamadı; Bu Şimdi Mümkün

Yayınlanan: 2022-11-02

Bir yıldan biraz fazla bir süre önce Nvidia'dan Bryan Catanzaro ile grafik yapay zeka, ses sentezi ve konuşma/konuşma yapay zekası alanlarında geliştirdikleri bazı ilginç teknolojiler hakkında konuştum.

Bryan, makine öğrenimi ve derin öğrenme gibi şeylerin çevremizdeki dünyayı deneyimleme şeklimizi etkilemek için neler yapabileceğine dair bir gelecek vizyonu paylaştı. Yapay zekanın sanat ve müzik gibi şeyler yaratması ve insan sesi gibi şeyler çok dikkat çekerken, bir ürün veya hizmetle ilgili yardıma ihtiyacımız olduğunda daha iyi müşteri deneyimleri oluşturmaya yardımcı olmak için halihazırda kullanılan bazı daha pratik AI örnekleri var. .

algoritmalar-anlama-konuşmaların-bağlamını

Geçen bir yıl boyunca, bu alanlarda işlerin nasıl ilerlediğini merak ediyordum ve Nvidia'da Kurumsal Bilgi İşlem ve Veri Bilimi Kıdemli Direktörü Erik Pounds ile LinkedIn Live aracılığıyla konuşma ve konuşma gibi şeyler hakkında konuşma şansına eriştim. Bryan ile son konuştuğumdan beri konuşma yapay zekası devreye girdi. Aşağıda konuşmamızın düzenlenmiş bir dökümü bulunmaktadır. Konuşmanın tamamını dinlemek için yerleşik SoundCloud oynatıcısına tıklayın.

smallbiztrends · Nvidia'nın Erik Pound'u: Algoritmalar konuşmaların bağlamını anlamadı. Bu artık mümkün

Brent Leary: Bugün konuşma yapay zekası ve konuşma yapay zekası söz konusu olduğunda neyle uğraşıyoruz?

Erik Pounds: Konuşma AI'sını düşünüyorsunuz, AI'nın arka planda çalıştığı ve ne söylediğinizi hemen anlayabildiği otomatik konuşma tanıma gibi işlevleri düşünüyorsunuz. Söylenenleri yazıya geçirebilir. Daha sonra bu bilgiler üzerinde gerçek zamanlı olarak hareket edebilir. Ve bunu yaparak birçok yararlı şey sağlayabilirsiniz. Bir telefon görüşmesinin arka ucunda bir müşteri hizmetleri temsilcisi hayal edin. Diğer tarafta, tüketici tarafında birçoğumuz yapmak istiyoruz… Peki gerçekten ne istiyoruz? Birincisi insanlarla konuşmayı seviyoruz, diğeri ise hemen yardım almak istiyoruz, değil mi?

Arka ucunda kullandığını hayal edin, aracı tarafında, yardım almaya çalışan bir temsilciyle konuştuğumu ve bir sürü soru sorduğumu hayal edin, AI'nın arka planda çalıştığını ve çektiğini hayal edin. bilgi temelli makaleler oluşturun, bilgi bulun, yardımcı araçlar bulun ve sorumu yanıtlamama yardımcı olun.

Ardından temsilci, sorunumu çözmeme yardımcı olmak için tüm bu bilgileri parmaklarının ucunda bulunduruyor. Birinin harika bir deneyim yaşamasına ve zorluklarını çözmesine yardımcı olmak için hemen yanınızda oturan bu süper güce sahip olmak gibi bir şey, değil mi? AI hakkında düşündüğümüzde, özellikle bu bağlamda, insanı konuşacağınız bir robotla değiştirmekle ilgili değil. Önümüzdeki on yıllar boyunca müşterilerine hizmet sunan işletmelere yardımcı olabilecek bu artan adımlar var.

Veriler temeldir, empati gerekli insan unsurunu ekler

Brent Leary: İnsanlar yapay zekayı düşündüklerinde, bu dar tanıma ve gerçekte neyi etkileyebileceğine dair dar bir görüşe sahip oluyorlar. Ancak, yardıma ihtiyaç duyduklarında müşteri deneyimi söz konusu olduğunda, bu sadece yapay zeka değil, en azından bir insanla, en azından kulağa hoş gelen bir şeyle veya bir çeşit sese sahip biriyle iletişim kurduğunuzu hissetmenin birleşimi gibi geliyor. insan empatisi. Ellerinde doğru verilere sahip olmak kadar önemlidir.

Erik Pound: Kesinlikle. Veri, tüm bunların temel unsurudur. Bir çağrıyı yazıya dökersek, bu gerçek zamanlı olarak veri üretir. Ancak, halihazırda var olan ve genellikle bir işletmenin içinde hareketsiz duran ve yararlanılabilecek başka veriler de var. Ve bence herhangi bir işletmenin alabileceği en iyi stratejilerden biri, "Pekala. Zaten sahip olduğum, zaten sahip olduğum değerli veriler nelerdir? Ve daha iyi müşteri deneyimleri sağlamak için bundan nasıl yararlanabilirim?” Bazıları sadece genel veriler olabilir.

Örneğin, bir müşteri işlemi her gerçekleştiğinde, veri üreten bir etkileşim gerçekleşir. Trendler, kalıplar ve bunun gibi şeyler hakkında bundan çok fazla bilgi edinebilirsiniz. Gelecekteki müşterilere yardımcı olabilirler, değil mi? Genellikle bu çağrıların çoğu, etkileşimler kopyalanır ve saklanır. Hepimiz herhangi bir aramanın başlangıcındaki şu kısmı duyarız, "Bu arama izlenebilir.

Devam edersen, olacak olan bu.” Bunu neredeyse kitle kaynaklı bilgiler gibi düşünün. Bu bilgilerden gerçekten en iyi şekilde yararlanabilirsiniz. Bu yüzden bence çoğu, verileri nasıl kullandığınızın ve kullandığınızın temeli ile başlıyor.

Bağlam bağlamı

Brent Leary: Bunun sadece harika doğal dil transkripsiyonuna ve anlayışına sahip olmadığımız bileşeninden biraz bahsedebilir misiniz, aynı zamanda duygu bileşeni, konuşma yapay zekası ile birlikte empatiden yararlanma yeteneğinin bir parçası olarak. kombinasyon. Çünkü bunun bir kısmı meydan okumayı çözmek veya yardım etmektir, ama diğer kısmı bunun nasıl olduğu ve insanların sadece bir şeyi düzeltmekten değil, aynı zamanda o şeyin düzeltilme tarzından, onların meşgul olma tarzından da aldıkları hissidir. , onların topluluğu, empati ileri geri gidiyor. Bunun neresindeyiz biraz bahseder misiniz?

Erik Pounds: Genellikle ben bir şey söylediğimde ve sen cevap verdiğinde, sonra başka bir şey söylediğimde, sonraki cümle ilk cümleye bağlı. Algoritmaların geleneksel olarak nasıl çalıştığına baktığınızda, genellikle bu bağlamı anlamıyorlar. Bunu işlemezler veya dikkate almazlar. Bu artık mümkün. Örneğin, geçtiğimiz ay NVIDIA GTC konferansımızda bazı demolar yayınladık, bir demo yayınladık.

NVIDIA Tokkio olarak adlandırdığımız, bunun gerçekçi bir etkileşim sağlama konusunda tam olarak nasıl çalıştığını gösteren, ne dediğimi, ne istediğimi anlayan ve yapabilen bir AI çerçevesi kullanan bir müşteri hizmetleri demosu. bir insan konuşmasının doğal akışında. Ve bu kritik. Tüm süreci daha fazla otomatikleştirdiğimiz için, bu kesinlikle kritik. Çünkü dediğin gibi insanlarla etkileşime geçmek istiyoruz, değil mi? Dediğiniz gibi, biri arar, bir insan sesi duymak isterler, arkadaş canlısı, onları anlayan, söylediklerini takdir eden birini isterler.

AI bu seviyeye inşa edilmişse, bunu yapabilmesi gerekir. Aksi takdirde, deneyim iyi olmayacak. AI teknolojisi hakkında konuşurken bunun önemli olduğunu düşünüyorum. Konuşma yapay zekası veya konuşma yapay zekası söz konusu olduğunda, "Pekala. Peki, söylediğin kelimelerin yüzde kaçını anladım? Gürültülü bir ortamda sözlerinizi anlayabiliyor muyum? Bütün bu şeyleri yapabilirim. ” Ve teknoloji böyle çalışıyor.

Ama asıl önemli olan, harika bir deneyim mi yoksa harika bir deneyim değil mi? Bu zorluğa harika bir teknoloji uygulayabilir ve yine de harika bir müşteri deneyimi sağlayamazsınız. Ve bu en önemli şey, değil mi? Bu nedenle, teknolojimizle, müşterilerimizin yapmasına yardımcı olabileceğimiz en önemli şeylerden birinin yapay zekayı almak, bu önceden eğitilmiş modelleri almak ve bunları kendi alanları ve kendi ortamları için özelleştirebilmek olduğu yaklaşımını benimsedik. .

Tartışmaların çoğunun botanik olduğu bir çağrı merkezi işletiyorsanız, ön bahçemde zaman içinde değiştirdiğim bitkilerin adlarını hatırlayamıyorum, değil mi? Ancak durum buysa, bu yapay zekanın belirli terminolojileri, ifadeleri ve bu alan etrafındaki bağlamı anladığından emin olmanız gerekir. Veya tıbbi cihazlar şirketiyse, bu konuşmada tartışılacak ve bir AI modelinin eğitileceği normal bir konuşmada olmayan pek çok şey olduğunu hayal edebilirsiniz.

Yani özelleştirme, lingo kadar önemli, değil mi? Bu nedenle, müşterilerinizin yaşadığı veya aradığı dünyanın bölgelerine bağlı olarak, lehçeleri, lingoları, bunun gibi şeyleri anlayabilmek ve bunları düzgün bir şekilde ele alabilmek istersiniz. Yani bunların çoğu… Stok bir yapay zeka modelini alıp onu bir ortamda çalışacak şekilde dağıtamazsınız ve her yerde harika bir deneyim sağlar. Özelleştirme çok önemli olacak.

Önünüzdeki verileri gözden kaçırmayın

Brent Leary: Şirketlerin bu konuda ilerlemek için hala kafalarını toplamaya çalıştıkları şeylerden bazıları nelerdir?

Erik Pounds: Bu konuşma bağlamında, bahsettiğiniz gibi, birçok farklı kurum ve kuruluş tarafından kullanılan bu CRM platformlarını kuran bir grup şirketle iyi bir ilişkiniz var. Genellikle bir kuruluş, mevcut hizmet yığınına veya teknoloji yığınına sahiptir ve ardından yeni bir şey yapmak isterler. Bazen bugün bulundukları yerde bazı sınırlamalar vardır.

Bu yüzden bu genellikle bazı karmaşıklıklar ekler çünkü bunun bir kısmı, "Pekala, bunu kendi başıma kurabilir ve mevcut platformuma ekleyebilirim." Veya bazen ISV'nize geri dönüp, "Hey, bunu gerçekten yapmak istiyoruz. Fikirleriniz neler?”

Bence en önemlisi, bu konuşmaları sürdürürken parmaklarınızın ucundaki verileri anlayın. Kendi başınıza neler yapabileceğinizi, ISV'lerinizin neler yapabileceğini, biraz danışmanlık yardımı alsaydınız muhtemelen neler yapabileceğinizi anlayın. Ve bence sadece tam bir anlayışa sahip olmak, böylece ileriye doğru olumlu adımlar atabilirsiniz.

İşletmelerdeki ilk AI projelerinin çoğu alışkındır… Onlarla dişlerini keserler, değil mi? Her zaman başarılı olmazlar. Bu yeni bir teknoloji. Bu yüzden ilk projenizde en büyük başarı şansına sahip olmanız için mümkün olduğunca hazırlıklı olmanızın şu anda çok önemli olduğunu söyleyebilirim.

Brent Leary: CRM uygulaması açısından, özellikle de bir satış elemanıysanız, CRM kullanmaktan nefret ederler. Bir şeyler koymaktan hoşlanmazlar. Yazmak, kaydırmak veya tıklamak için kaydolmadılar. Gerçekten dışarı çıkıp ilişkiler kurmak ve bir şeyler satmak istiyorlar. Ve benim fantezim, kurumsal uygulamanızla, ister CRM, ister ERB, isterse herhangi bir kısaltma olsun, konuşabilseydiniz, şu anda konuşuyormuşuz gibi konuşabilseydiniz harika olmaz mıydı? ve işini hallet, bu sadece bir fantezi mi? Yoksa uygulamalarımızla gerçekten bu tür bir sohbeti yapabileceğimiz bir gün görüyor musunuz?

Erik Pounds: Hayır, olmamalı. Hele ki bunların çoğunun olduğu günümüzde… “Tamam. Bu müşteriyle veya potansiyel müşteriyle bu görüşmeyi yaptıktan sonra Salesforce'a geri dönmem ve bu kaydı güncellemem gerekiyor." Ve hepimiz çoğu zaman bu kayıtların o kadar iyi güncellenmediğini biliyoruz ve o zaman işletme ilerlemek için ihtiyaç duyduğu zekaya sahip değil, değil mi? Boru hattı güncel değil. Bundan ders çıkaramazsınız. Bu konuşmaların çoğu şimdi yaptığımız gibi, değil mi? Onlar uzak. Bir binadaki konferans odasında değiller. Veya bir binadaki konferans odasında olsalar bile, genellikle uzakta olan birileri vardır. Ve böylece bu konuşmayı dinleyen bir sistem var.

Sadece bu konuşmayı yazıya dökebilmek ve bunu bu durumda hesap yöneticisi veya dahil olan her kimse için yapabilmek harika olurdu. Ve bugün hepsi bu kadar yetenekli. Tıpkı bu konuşma gibi, bu konuşma da yazıya geçirilir. Konuşmayı yazıya dökmek için bir ASR işlevi kullanıyorsunuz, sonra neden bahsettiğimizin bağlamını anlamak için bazı NLU veya NLP işlevleri uyguluyorsunuz. Ve sonra bu standart alanların çoğunu kolayca gidip güncelleyebilirsiniz. Ve bunların hepsi tekrar eden şeyler. Bir aktivite ne kadar tekrarlanırsa, yapay zekayı uygulamak o kadar kolay olmalıdır.

Bu, düşünce liderleriyle Bire Bir Röportaj serisinin bir parçasıdır. Transkript yayın için düzenlenmiştir. Sesli veya görüntülü bir röportajsa, yukarıdaki gömülü oynatıcıya tıklayın veya iTunes veya Stitcher aracılığıyla abone olun.