Erik Pounds de Nvidia: Tradicionalmente, los algoritmos a menudo no han entendido el contexto de las conversaciones; Eso es posible ahora

Publicado: 2022-11-02

Hace poco más de un año hablé con Bryan Catanzaro de Nvidia sobre algunas de las tecnologías interesantes que estaban desarrollando en las áreas de IA gráfica, síntesis de voz e IA conversacional/hablada.

Bryan compartió una visión del futuro de lo que cosas como el aprendizaje automático y el aprendizaje profundo podrían hacer para impactar la forma en que experimentamos el mundo que nos rodea. Y aunque algunas de las cosas como la IA que crea cosas como el arte y la música y las voces que suenan humanas reciben mucha atención, hay algunos ejemplos más prácticos de IA que ya se están utilizando para ayudar a crear mejores experiencias para los clientes cuando necesitamos ayuda con un producto o servicio. .

algoritmos-entendiendo-el-contexto-de-las-conversaciones

Con el paso de un año, tenía curiosidad por saber cómo progresan las cosas en estas áreas, y tuve la suerte de hablar a través de LinkedIn Live con Erik Pounds, director sénior de Computación empresarial y ciencia de datos en Nvidia, sobre la dirección cosas como conversacional y Discurso AI me he mudado desde la última vez que hablé con Bryan. A continuación se muestra una transcripción editada de nuestra conversación. Haga clic en el reproductor de SoundCloud incorporado para escuchar la conversación completa.

smallbiztrends · Erik Pounds de Nvidia: Los algoritmos no han entendido el contexto de las conversaciones. Eso es posible ahora

Brent Leary: ¿A qué nos enfrentamos en lo que respecta a la IA del habla y la IA conversacional en la actualidad?

Erik Pounds: Piensa en la IA de voz, piensa en funciones como el reconocimiento automático de voz donde la IA se ejecuta en segundo plano y puede reconocer de inmediato lo que estás diciendo. Puede transcribir lo que se dice. Luego puede actuar en tiempo real sobre esa información. Y puede proporcionar muchas cosas útiles al hacer eso. Imagine un agente de servicio al cliente al final de una conversación telefónica. Muchos de nosotros en el otro extremo, en el lado del consumidor, queremos... ¿Y qué es lo que realmente queremos? Bueno, uno, nos gusta hablar con humanos, y el otro es que queremos obtener ayuda rápidamente, ¿verdad?

Imagínese usarlo en la parte trasera, así que en el lado del agente, imagine si estoy hablando con un agente tratando de obtener ayuda y le hago un montón de preguntas, imagine si la IA se ejecuta en segundo plano, tirando subir artículos basados ​​en el conocimiento, encontrar información, encontrar herramientas útiles y ayudarme a responder mi pregunta.

Entonces el agente tiene toda esta información al alcance de su mano para ayudarme a resolver mi problema. Es como tener casi como este superpoder sentado a tu lado, para ayudar a alguien a tener una gran experiencia y resolver sus desafíos, ¿verdad? Cuando pensamos en la IA, especialmente en ese contexto, no se trata de reemplazar al humano con un robot con el que hablarás. Hay estos pasos incrementales que podrán ayudar a las empresas que brindan un servicio a sus clientes literalmente durante las próximas décadas.

Los datos son fundamentales, la empatía agrega el elemento humano necesario

Brent Leary: Cuando las personas piensan en la IA, tienen esta definición limitada y una visión limitada de lo que realmente puede impactar. Pero cuando se trata de la experiencia del cliente cuando necesita ayuda, se siente no solo como la IA, sino como la combinación de al menos sentir que te estás comunicando con un humano, al menos una cosa que suena humana o alguien que tiene algún tipo de empatía humana. Es tan importante como tener los datos correctos a su disposición.

Erik Libras: Absolutamente. Los datos son el elemento fundamental de todo esto. Si transcribimos una llamada, eso produce datos en tiempo real. Pero también, hay otros datos que ya existen, a menudo reposando dentro de un negocio que se puede aprovechar. Y creo que una de las mejores estrategias que cualquier empresa puede tomar es averiguar: “Está bien. ¿Cuáles son los datos valiosos que ya tengo, que ya poseo? ¿Y cómo puedo aprovechar eso para brindar mejores experiencias a los clientes?”. Algunos de ellos pueden ser solo datos generales.

Por ejemplo, cada vez que ocurre una transacción con un cliente, ocurre un compromiso que produce datos. Puede obtener mucha información de eso con respecto a tendencias y patrones y cosas como esta. Podrían ayudar a futuros clientes, ¿verdad? A menudo, muchas de estas llamadas e interacciones se transcriben y almacenan. Todos escuchamos esa parte del comienzo de cualquier llamada como, “Esta llamada puede ser monitoreada.

Si continúas, esto es lo que sucederá”. Piense en eso casi como información de crowdsourcing. Realmente puede aprovechar esa información para su mejor beneficio. Así que creo que mucho comienza con la base de cómo aprovechas y utilizas los datos.

Contexto de conexión

Brent Leary: ¿Puede hablar un poco sobre el componente de esto en el que no solo podemos tener una excelente transcripción y comprensión del lenguaje natural, sino también el componente de sentimiento, la capacidad de aprovechar la empatía junto con la inteligencia artificial del habla como parte de la combinación. Porque una parte es resolver el desafío o ayudar, pero la otra parte es cómo sucede y la sensación que tiene la gente no solo de corregir la cosa, sino de la manera en que se corrigió la cosa, la manera en que se comprometieron. , su comunidad, la empatía que va y viene. ¿Puedes hablar un poco sobre dónde estamos con eso?

Erik Pounds: A menudo, cuando digo una cosa, y luego respondes, luego digo otra cosa, la siguiente oración está vinculada a la primera oración. Cuando observa cómo han funcionado tradicionalmente los algoritmos, a menudo no entienden ese contexto. No están procesando eso ni tomándolo en consideración. Eso es posible ahora. Por ejemplo, lanzamos algunas demostraciones recientemente en nuestra conferencia el mes pasado, NVIDIA GTC, lanzamos una demostración.

Es una demostración de servicio al cliente que usa un marco de IA que llamamos NVIDIA Tokkio que muestra exactamente cómo funciona esto con respecto a proporcionar una interacción realista, que entiende lo que estoy diciendo, lo que estoy pidiendo y ser capaz de hacer. en un tipo natural de flujo de una conversación humana. Y eso es crítico. A medida que automatizamos más del proceso completo, eso es absolutamente crítico. Porque como dijiste, queremos interactuar con humanos, ¿verdad? Como dijiste, alguien llama, quiere escuchar una voz humana, quiere a alguien que sea amigable, que los entienda, que aprecie lo que están diciendo.

Si la IA está construida a ese nivel, debe poder hacer eso. De lo contrario, la experiencia no va a ser buena. Creo que esto es importante cuando hablamos de tecnología de IA. Cuando se trata de IA de voz o IA conversacional, hay muchos tecnicismos como, “Está bien. Bueno, ¿qué porcentaje de las palabras que dices entiendo? ¿Soy capaz de entender sus palabras en un ambiente ruidoso? Soy capaz de hacer todas estas cosas”. Y así es como funciona la tecnología.

Pero lo que realmente importa es, ¿es una gran experiencia o no es una gran experiencia? Puede aplicar una tecnología asombrosa a este desafío y aun así no brindar una excelente experiencia al cliente. Y eso es lo más importante, ¿no? Así que hemos adoptado el enfoque con nuestra tecnología de que una de las cosas más importantes que podemos ayudar a nuestros clientes es tomar la IA, tomar estos modelos preentrenados y poder personalizarlos para su propio dominio y sus propios entornos. .

Si está ejecutando un centro de llamadas donde la mayoría de las discusiones son sobre botánica, no puedo recordar los nombres de las plantas que he cambiado a lo largo de mi jardín, ¿verdad? Pero si ese es el caso, debe asegurarse de que esta IA comprenda ciertas terminologías y frases y el contexto en torno a ese dominio. O si se trata de una empresa de dispositivos médicos, puede imaginar que se discutirán muchas cosas en esa conversación que no se encuentran en una conversación normal en la que se entrenaría a un modelo de IA.

Entonces, la personalización es muy importante, así como la jerga, ¿verdad? Entonces, según las áreas del mundo en las que viven sus clientes o desde las que llaman, desea poder comprender los dialectos, la jerga, cosas como esta y poder manejar eso correctamente. Así que mucho de esto no es... No se puede simplemente tomar un modelo de IA estándar e implementarlo para que funcione en un entorno y brinde una gran experiencia en todas partes. La personalización va a ser muy importante.

No pase por alto los datos justo en frente de usted

Brent Leary: ¿Cuáles son algunas de las cosas por las que quizás las empresas todavía están tratando de entender en términos de avanzar con esto?

Erik Pounds: En el contexto de esta conversación, como mencionaste, tienes una buena relación con un grupo de empresas que construyen estas plataformas de CRM que utilizan muchas empresas y organizaciones diferentes. A menudo, una empresa tiene su pila de servicios o pila de tecnología existente, y luego quiere hacer algo nuevo. A veces donde están hoy tiene algunas limitaciones.

Eso a menudo agrega algunas complejidades porque parte de esto es: "Bueno, puedo construir esto por mi cuenta y conectarlo a mi plataforma existente". O, a veces, tienes que volver a tu ISV, hacer una solicitud de función como, “Oye, realmente queremos hacer esto. ¿Cuáles son tus ideas?

Creo que lo más importante, a medida que inicia esas conversaciones, es comprender los datos que están al alcance de su mano. Comprenda lo que puede hacer por su cuenta, lo que sus ISV son capaces de hacer, lo que incluso podría hacer si tuviera un poco de ayuda de consultoría. Y creo que solo tener una comprensión completa, para que pueda dar pasos positivos hacia adelante.

La mayoría de los primeros proyectos de IA dentro de las empresas están acostumbrados a... Se cortan los dientes con ellos, ¿verdad? No siempre tienen éxito. Esta es una nueva tecnología. Entonces, diría que estar lo más preparado posible, para que tengas la mayor probabilidad de éxito en tu primer proyecto, es muy importante en este momento.

Brent Leary: Desde la perspectiva de una aplicación de CRM, particularmente si es un vendedor, odian usar CRM. No les gusta poner cosas. No se registraron para escribir, deslizar o hacer clic. Ellos realmente quieren salir y construir relaciones y vender cosas. Y mi fantasía es, ¿no sería genial si pudiera hablarle a su aplicación empresarial, ya sea CRM o ERB o cualquier acrónimo que quiera lanzar, si pudiera hablarle como si estuviéramos hablando en este momento? y haz tus cosas, ¿es eso solo una mera fantasía? ¿O ves un día en el que realmente podamos tener ese tipo de conversación con nuestras aplicaciones?

Erik Pounds: No, no debería serlo. Especialmente hoy en día cuando la mayoría de estos... Mencionaste como, "Está bien. Tengo que volver a Salesforce y actualizar este registro después de tener esta conversación con este cliente o cliente potencial”. Y todos sabemos que muchas veces estos registros no están tan bien actualizados, y entonces el negocio no tiene la inteligencia que necesita para avanzar, ¿verdad? La canalización no está actualizada. No eres capaz de aprender de eso. Muchas de estas conversaciones ahora son como las que estamos teniendo, ¿verdad? Son remotos. No están en una sala de conferencias en algún edificio. O incluso si están en una sala de conferencias en algún edificio, a menudo hay alguien que está a distancia. Y entonces hay un sistema que escucha esta conversación.

Solo poder transcribir esa conversación y poder hacer eso para, en este caso, el gerente de cuenta o quien esté involucrado sería genial. Y eso es todo capaz hoy. Al igual que esta conversación, esta conversación se transcribe. Está utilizando alguna función ASR para transcribir la conversación, luego está aplicando alguna función NLU o NLP para comprender el contexto de qué diablos estamos hablando. Y luego podría fácilmente ir y actualizar muchos de esos campos estándar. Y todo esto son cosas repetitivas. Cuanto más repetitiva sea una actividad, más fácil debería ser aplicar la IA.

Esto es parte de la serie de entrevistas uno a uno con líderes de opinión. La transcripción ha sido editada para su publicación. Si se trata de una entrevista de audio o video, haga clic en el reproductor integrado de arriba o suscríbase a través de iTunes o Stitcher.