Erik Pounds da Nvidia: Algoritmos Tradicionalmente Não Compreendem o Contexto das Conversas; Isso é possível agora

Publicados: 2022-11-02

Há pouco mais de um ano, conversei com Bryan Catanzaro da Nvidia sobre algumas das tecnologias interessantes que eles estavam desenvolvendo nas áreas de IA gráfica, síntese de voz e IA de conversação/fala.

Bryan compartilhou uma visão do futuro do que coisas como aprendizado de máquina e aprendizado profundo podem fazer para impactar a maneira como experimentamos o mundo ao nosso redor. E enquanto algumas coisas como IA criando coisas como arte e música e vozes humanas recebem muita atenção, há alguns exemplos mais práticos de IA já sendo usados ​​para ajudar a criar melhores experiências para o cliente quando precisamos de ajuda com um produto ou serviço .

algoritmos-entendimento-o-contexto-das-conversas

Com um ano se passando, eu estava curioso para saber como as coisas estão progredindo nessas áreas, e tive a sorte de falar via LinkedIn Live com Erik Pounds, diretor sênior de computação empresarial e ciência de dados da Nvidia, sobre a direção de coisas como conversação e discurso AI mudou-se desde a última vez que falei com Bryan. Abaixo está uma transcrição editada da nossa conversa. Clique no player incorporado do SoundCloud para ouvir a conversa completa.

smallbiztrends · Erik Pounds da Nvidia: Algoritmos não entenderam o contexto das conversas. Isso é possível agora

Brent Leary: Com o que estamos lidando quando se trata de IA de fala e IA de conversação hoje?

Erik Pounds: Você pensa em IA de fala, pensa em funções como reconhecimento automático de fala, onde a IA está sendo executada em segundo plano e pode reconhecer imediatamente o que você está dizendo. Ele pode transcrever o que está sendo dito. Ele pode então agir em tempo real sobre essas informações. E você pode fornecer muitas coisas úteis fazendo isso. Imagine um agente de atendimento ao cliente no back-end de uma conversa telefônica. Muitos de nós, do outro lado, do lado do consumidor, queremos… E o que realmente queremos? Bem, um, nós gostamos de conversar com humanos, e o outro é que queremos obter ajuda rapidamente, certo?

Imagine usar no back-end dele, então no lado do agente, imagine se eu estiver falando com um agente tentando obter ajuda e estou fazendo um monte de perguntas, imagine se a IA estiver sendo executada em segundo plano, puxando artigos baseados em conhecimento, encontrar informações, encontrar ferramentas úteis e me ajudar a responder minha pergunta.

Então o agente tem todas essas informações na ponta dos dedos para me ajudar a resolver meu problema. É como ter quase esse superpoder sentado ao seu lado, para ajudar alguém a ter uma ótima experiência e resolver seus desafios, certo? Quando pensamos em IA, especialmente nesse contexto, não se trata de substituir o humano por um robô com o qual você conversará. Existem essas etapas incrementais que serão capazes de ajudar as empresas que prestam um serviço a seus clientes por literalmente décadas vindouras.

Os dados são fundamentais, a empatia adiciona o elemento humano necessário

Brent Leary: Quando as pessoas pensam em IA, elas têm essa definição restrita e uma visão restrita do que ela pode realmente impactar. Mas quando se trata da experiência do cliente quando eles precisam de ajuda, parece não apenas a IA, mas a combinação de pelo menos sentir que você está se comunicando com um humano, pelo menos uma coisa que soa humana ou alguém que tem algum tipo de empatia humana. É tão importante quanto ter os dados certos à sua disposição.

Erik Pounds: Com certeza. Os dados são o elemento fundamental de tudo isso. Se transcrevemos uma chamada, isso produz dados em tempo real. Mas também há outros dados que já existem, muitas vezes parados dentro de um negócio que pode ser aproveitado. E acho que uma das melhores estratégias que qualquer empresa pode adotar é descobrir: “Tudo bem. Quais são os dados valiosos que já possuo, que já possuo? E como posso aproveitar isso para fornecer melhores experiências ao cliente?” Alguns deles podem ser apenas dados gerais.

Por exemplo, toda vez que uma transação do cliente ocorre, ocorre um engajamento que produz dados. Você pode obter muitas informações com relação a tendências e padrões e coisas assim. Eles poderiam ajudar futuros clientes, certo? Muitas vezes, muitas dessas chamadas, interações são transcritas e armazenadas. Todos nós ouvimos aquela parte do início de qualquer chamada como: “Esta chamada pode ser monitorada.

Se você continuar, é isso que vai acontecer.” Pense nisso como quase como informações de crowdsourcing. Você pode realmente aproveitar essas informações para seu melhor benefício. Então, acho que muito disso começa com a base de como você aproveita e utiliza os dados.

Contexto de conexão

Brent Leary: Você pode falar um pouco sobre o componente disso em que não podemos apenas ter uma ótima transcrição e compreensão de linguagem natural, mas também o componente de sentimento, a capacidade de alavancar a empatia junto com a IA de fala como parte do combinação. Porque parte disso é resolver o desafio ou ajudar, mas a outra parte é como isso acontece e a sensação que as pessoas têm não apenas de corrigir a coisa, mas da maneira como a coisa foi corrigida, a maneira como elas se envolveram , sua comunidade, a empatia indo e voltando. Você pode falar um pouco sobre onde estamos com isso?

Erik Pounds: Muitas vezes, quando eu digo uma coisa e você responde, então eu digo outra coisa, a frase seguinte está ligada à primeira frase. Quando você observa como os algoritmos tradicionalmente funcionam, eles geralmente não entendem esse contexto. Eles não estão processando isso ou levando isso em consideração. Isso é possível agora. Por exemplo, lançamos algumas demos recentemente em nossa conferência no mês passado, NVIDIA GTC, lançamos uma demo.

É uma demonstração de atendimento ao cliente usando uma estrutura de IA que chamamos de NVIDIA Tokkio que mostra exatamente como isso funciona no que diz respeito a fornecer uma interação realista, que entende o que estou dizendo, o que estou pedindo e é capaz de fazer em um tipo natural de fluxo de uma conversa humana. E isso é crítico. À medida que automatizamos mais do processo completo, isso é absolutamente crítico. Porque como você disse, queremos interagir com humanos, certo? Como você disse, alguém liga, quer ouvir uma voz humana, quer alguém que seja amigável, que os entenda, que aprecie o que eles estão dizendo.

Se a IA for construída para esse nível, ela precisa ser capaz de fazer isso. Caso contrário, a experiência não será boa. Acho que isso é importante quando estamos falando de tecnologia de IA. Quando se trata de IA de fala ou IA de conversação, há muitos detalhes técnicos como: “Tudo bem. Bem, que porcentagem das palavras que você está dizendo eu entendo? Sou capaz de entender suas palavras em um ambiente barulhento? Eu sou capaz de fazer todas essas coisas.” E é assim que a tecnologia funciona.

Mas o que realmente importa é, é uma grande experiência ou não é uma grande experiência? Você pode aplicar uma tecnologia incrível a esse desafio e ainda assim não proporcionar uma ótima experiência ao cliente. E isso é o mais importante, certo? Portanto, adotamos a abordagem com nossa tecnologia de que uma das coisas mais importantes que podemos ajudar nossos clientes a fazer é usar a IA, usar esses modelos pré-treinados e personalizá-los para seu próprio domínio e seus próprios ambientes .

Se você está administrando um call center onde a maioria das discussões são sobre botânica, não consigo lembrar os nomes das plantas que mudei ao longo dos tempos do meu jardim da frente, certo? Mas se for esse o caso, você precisa garantir que essa IA entenda certas terminologias, frases e contexto em torno desse domínio. Ou se for uma empresa de dispositivos médicos, você pode imaginar que há muitas coisas que serão discutidas nessa conversa que não estão em uma conversa normal na qual um modelo de IA seria treinado.

Então a customização é super importante assim como a linguagem, certo? Então, com base nas áreas do mundo em que seus clientes vivem ou ligam, você quer ser capaz de entender dialetos, jargão, coisas assim e ser capaz de lidar com isso corretamente. Portanto, muito disso não é… Você não pode simplesmente pegar um modelo de IA de estoque e implantá-lo para funcionar em um ambiente e ele fornecer uma ótima experiência em todos os lugares. A customização será muito importante.

Não negligencie os dados bem na sua frente

Brent Leary: Quais são algumas das coisas que talvez as empresas ainda estejam tentando entender em termos de avançar com isso?

Erik Pounds: No contexto desta conversa, como você mencionou, você tem um bom relacionamento com várias empresas que constroem essas plataformas de CRM que são usadas por muitas empresas e organizações diferentes. Muitas vezes, uma empresa, eles têm sua pilha de serviços ou pilha de tecnologia existente e, em seguida, desejam fazer algo novo. Às vezes, onde eles estão hoje tem algumas limitações.

Então, isso geralmente adiciona algumas complexidades porque parte disso é: “Bem, eu posso construir isso sozinho e conectá-lo à minha plataforma existente”. Ou às vezes você precisa voltar ao seu ISV, fazer uma solicitação de recurso como: “Ei, nós realmente queremos fazer isso. Quais são suas ideias?”

Acho que o mais importante é que, à medida que você inicia essas conversas, entenda os dados que estão ao seu alcance. Entenda o que você pode fazer sozinho, o que seus ISVs são capazes de fazer, o que você poderia fazer se tivesse um pouco de ajuda de consultoria. E acho que basta ter um entendimento completo, para que você possa dar passos positivos à frente.

A maioria dos primeiros projetos de IA dentro das empresas está acostumada a… Eles se acostumaram com eles, certo? Nem sempre são bem-sucedidos. Esta é uma nova tecnologia. Então eu diria que estar preparado o máximo possível, para que você tenha a maior chance de sucesso no seu primeiro projeto é super importante nesse momento.

Brent Leary: Do ponto de vista do aplicativo de CRM, principalmente se você for um vendedor, eles odeiam usar o CRM. Eles não gostam de colocar coisas. Eles não se inscreveram para digitar, deslizar ou clicar. Eles realmente querem sair e construir relacionamentos e vender coisas. E minha fantasia é, não seria legal se você pudesse falar com seu aplicativo corporativo, seja CRM ou ERB ou qualquer sigla que você queira lançar, se você pudesse falar com ele como estamos falando agora e fazer suas coisas, isso é apenas mera fantasia? Ou você vê um dia em que realmente poderíamos fazer esse tipo de conversa com nossos aplicativos?

Erik Pounds: Não, não deveria ser. Especialmente hoje em dia quando a maioria destes… Você mencionou como, “Ok. Preciso voltar ao Salesforce e atualizar este registro depois de conversar com esse cliente ou cliente em potencial.” E todos nós sabemos que muitas vezes esses registros não estão tão bem atualizados, e aí o negócio não tem a inteligência que precisa para seguir em frente, certo? O pipeline não está atualizado. Você não é capaz de aprender com isso. Muitas dessas conversas agora são como se estivéssemos tendo, certo? Eles são remotos. Eles não estão em uma sala de conferências em algum prédio. Ou mesmo se eles estiverem em uma sala de conferência em algum prédio, muitas vezes há alguém que está remoto. E assim há um sistema ouvindo essa conversa.

Apenas poder transcrever essa conversa e poder fazer isso para, neste caso, o gerente de contas ou quem estiver envolvido seria ótimo. E isso é tudo capaz hoje. Assim como esta conversa, esta conversa é transcrita. Você está usando alguma função ASR para transcrever a conversa, então você está aplicando alguma função NLU ou NLP para entender o contexto do que diabos estamos falando. E então você poderia facilmente atualizar muitos desses campos padrão. E tudo isso é coisa repetitiva. Quanto mais repetitiva for uma atividade, mais fácil deve ser a aplicação da IA.

Isso faz parte da série de entrevistas individuais com líderes de pensamento. A transcrição foi editada para publicação. Se for uma entrevista em áudio ou vídeo, clique no player incorporado acima ou assine via iTunes ou via Stitcher.