La gente también busca, ¿o siempre? Cómo Google podría usar un modelo generativo entrenado para generar variantes de consulta para funciones de búsqueda como PASF, PAA y más [Patente]

Publicado: 2023-06-27
Correo electrónico
Google usa un modelo generativo para generar variantes de consulta para que la gente también busque y la gente también pregunte

Estaba revisando algunas patentes de Google el otro día y apareció una interesante que fue otorgada y publicada el 30 de mayo de 2023. Se titulaba "Generación de variantes de consulta usando un modelo generativo entrenado" y definitivamente despertó mi curiosidad. Originalmente se presentó en 2018, pero se concedió a fines de mayo. Y dado que siempre estoy interesado en funciones SERP importantes como People Also Ask (PAA) y People Also Search For (PASF), tuve que investigar.

Además, esto es algo sobre lo que le habría preguntado al brillante Bill Slawski en el pasado. Desafortunadamente, Bill ya no está con nosotros. Revisar la patente me hizo darme cuenta de cuánto extraño las publicaciones de Bill sobre patentes y poder enviarle preguntas sobre su análisis por DM. Perder a Bill fue definitivamente una gran pérdida para nuestra industria. De todos modos, sin Bill para cavar en la forma en que siempre lo hacía, decidí empezar a cavar yo mismo. Y me alegro de haberlo hecho. Fue súper interesante.

Aprovechando los modelos generativos usando redes neuronales para funciones SERP
A continuación, cubriré cómo la patente describe el uso de un modelo generativo entrenado para generar variantes de consulta para funciones SERP como "Las personas también buscan", "Las personas también preguntan" y quizás más. La patente menciona "La gente también busca", pero no es exagerado creer que el proceso también podría usarse para PAA. Lo cubro en mi análisis a continuación.

Fue fascinante aprender más sobre lo que Google está haciendo en este frente (al menos en base a la patente). Al igual que con cualquier patente, no sabemos si Google ya implementó esto, o si lo hará, pero seguro que tenía sentido según lo que estaba leyendo.

Además, y esto me pareció fascinante, la patente explicaba cómo Google podría incluso generar variantes de consulta para consultas novedosas (completamente nuevas) y consultas de cola larga donde aún no hay muchos datos disponibles. Y con el 15% de todas las consultas nunca antes vistas por Google, tendría sentido utilizar un enfoque como el de generar variantes de consulta. Cubriré más sobre esto pronto.

Puntos clave de la patente:
Creo que la mejor manera de cubrir la patente es mencionar algunos de los aspectos más destacados. A continuación, cubriré varios puntos clave de la patente, que espero que también les resulten interesantes.

Generación de variantes de consulta mediante un modelo generativo entrenado
Estados Unidos 11663201 B2
Fecha de concesión: 30 de mayo de 2023
Fecha de presentación: 27 de abril de 2018
Nombre del cesionario: Google LLC

Diagrama de una patente de Google sobre el uso de un modelo generativo para generar variantes de consulta para PASF y PAA

1. Las variantes de consulta se pueden generar en tiempo de ejecución utilizando un modelo generativo entrenado basado en tokens de las consultas originales y funciones de entrada adicionales. Cubriré más sobre las funciones de entrada adicionales pronto.

2. El sistema puede generar variantes de consulta incluso cuando el modelo no está entrenado en esa consulta. Por lo tanto, puede generar variantes para consultas novedosas (completamente nuevas) o lo que Google llama consultas de "cola" donde aún no hay muchos datos. Encontré eso muy interesante, especialmente porque Google dice que el 15% de las consultas nunca se habían visto antes. Por lo tanto, el modelo generativo puede predecir qué variantes de consulta generar incluso para consultas de bajo umbral mediante el uso de una red neuronal (con capas de memoria).

El modelo generativo de Google funciona para consultas novedosas y consultas de cola larga.

3. El modelo generativo se puede entrenar en función de los envíos de consultas anteriores de los usuarios. Pero la patente también explica que los datos de entrenamiento de la variante de consulta también pueden basarse en pares de consultas que tienen clics en los mismos documentos. Eso tiene sentido y muestra cómo la participación del usuario puede ser un factor en lo que genera el modelo.

El modelo generativo de Google se entrenó en pares de consultas que tienen clics en el mismo documento.

4. La patente también explica que el modelo se puede entrenar como un modelo multitarea para permitir la generación de múltiples tipos de variantes de consulta. Por lo tanto, es un sistema sofisticado que puede generar diferentes tipos de variantes de consulta, incluidas consultas de seguimiento, consultas de generalización, consultas de canonicalización, consultas de traducción de idiomas, consultas de vinculación y más.

El modelo generativo de Google se puede entrenar como un modelo multitarea para generar múltiples tipos de variantes de consulta.

5. Una vez que se generan las variantes de consulta, el modelo las puntúa. El sistema proporciona puntajes de respuesta para cada variante. Y el sistema puede calificar esas variantes comprobando las respuestas a esas variantes de consulta. Eso puede ayudar al sistema a detectar variantes de consulta "potencialmente falsas". Muy interesante…

Variantes de consulta de puntuación del modelo generativo de Google para determinar la calidad.

6. La patente continúa explicando que el sistema puede devolver respuestas además de solo consultar variantes. Por ejemplo, el sistema puede devolver un resultado de búsqueda (¿PAA alguien?), una entidad de gráfico de conocimiento, una respuesta nula (sin respuesta) o incluso un mensaje de aclaración (con aclaración de la entrada de la interfaz de usuario). Eso podría ser en forma de chips de desambiguación que vemos cuando Google busca ayuda de los usuarios cuando intenta comprender lo que el usuario está buscando. De nuevo, interesante.

La patente de Google explica que el sistema puede devolver respuestas además de solo consultar variantes.

7. La patente continúa explicando que el modelo puede tomar más que solo tokens de la consulta, incluidas "características de entrada adicionales". Esas características de entrada podrían incluir la ubicación, una tarea que le interese al usuario o que realice (como cocinar, reparar un automóvil, planificar un viaje, etc.). También puede tener en cuenta el clima y más. Y la tarea podría basarse en entradas de calendario almacenadas para el usuario, mensajes de chat u otras comunicaciones, consultas anteriores enviadas por el usuario, etc. Por lo tanto, las variantes de consulta podrían basarse en la personalización o el contexto actual.

La patente de Google explica que el modelo puede tomar más que solo tokens de la consulta, incluidas "características de entrada adicionales".

8. El modelo también puede generar variantes de una consulta y anuncios u otro contenido . Entonces, el modelo no solo puede generar variantes de consulta, sino que también puede generar (o tal vez recuperar) anuncios u otro contenido que se puede mostrar en los SERP. Creo que tengo que volver a esa sección otra vez, pero eso fue interesante... :)

El modelo generativo de Google puede generar variantes de una consulta y anuncios u otro contenido.

9. La patente también explica que puede haber una serie de modelos generativos basados ​​en diferentes atributos o tareas. Por lo tanto, puede haber modelos específicos para diversas tareas, como comprar, viajar a un lugar, etc.

La patente de Google explica que puede haber una serie de modelos generativos basados ​​en diferentes atributos o tareas.

Resumen: la generación de variantes para PASF y PAA puede ser más complicada y matizada de lo que algunos piensan.
Espero que analizar un poco esta patente lo haya ayudado a comprender cómo Google podría usar un modelo generativo entrenado para generar variantes de consulta u otro contenido que se puede mostrar en varias funciones SERP. Y esto puede suceder para consultas novedosas (nuevas) y consultas de cola larga donde aún no hay muchos datos. Además, podría haber múltiples modelos en uso que se centren en una disciplina específica. Y los resultados también se pueden personalizar (según características de entrada adicionales).

Por lo tanto, la próxima vez que vea "La gente también busca" o "La gente también pregunta" en las SERP, sepa que se podría haber utilizado un modelo generativo para proporcionar esas variantes de consulta. Y si es personalizado, entonces tal vez esas consultas sean específicas para su caso. Nuevamente, los sistemas de Google son mucho más sofisticados de lo que algunas personas piensan.

GG