Die Leute suchen auch nach, oder tun sie das immer? Wie Google ein trainiertes generatives Modell verwenden könnte, um Abfragevarianten für Suchfunktionen wie PASF, PAA und mehr zu generieren [Patent]
Veröffentlicht: 2023-06-27
Ich habe mir neulich einige Patente von Google angesehen und bin auf ein interessantes Patent gestoßen, das am 30. Mai 2023 erteilt und veröffentlicht wurde. Es trug den Titel „Generieren von Abfragevarianten mithilfe eines trainierten generativen Modells“ und hat definitiv meine Neugier geweckt. Der Antrag wurde ursprünglich im Jahr 2018 eingereicht, aber Ende Mai bewilligt. Und da ich immer an wichtigen SERP-Funktionen wie „People Also Ask“ (PAA) und „People Also Search For“ (PASF) interessiert bin, musste ich mich einarbeiten.
Darüber hinaus hätte ich in der Vergangenheit auch den brillanten Bill Slawski angeschrieben. Leider ist Bill nicht mehr bei uns. Als ich das Patent durchging, wurde mir klar, wie sehr ich Bills Beiträge über Patente und die Möglichkeit, ihm Fragen zu seiner Analyse per DM zu schicken, vermisse. Der Verlust von Bill war definitiv ein gewaltiger Verlust für unsere Branche. Wie dem auch sei, ohne dass Bill sich auf die Art und Weise vertiefen konnte, wie er es immer tun würde, beschloss ich, selbst damit anzufangen. Und ich bin froh, dass ich es getan habe. Es war superinteressant.
Nutzung generativer Modelle mithilfe neuronaler Netze für SERP-Funktionen
Im Folgenden beschreibe ich, wie das Patent die Verwendung eines trainierten generativen Modells beschreibt, um Abfragevarianten für SERP-Funktionen wie „Personen suchen auch nach“, „Personen fragen auch“ und vielleicht mehr zu generieren. Das Patent erwähnt „People Also Search For“, aber es ist nicht übertrieben zu glauben, dass das Verfahren auch für PAA verwendet werden könnte. Darauf gehe ich in meiner Analyse weiter unten ein.
Es war faszinierend, mehr darüber zu erfahren, was Google in diesem Bereich tut (zumindest basierend auf dem Patent). Wie bei jedem Patent wissen wir nicht, ob Google dies bereits implementiert hat oder ob sie es tun werden, aber basierend auf dem, was ich gelesen habe, ergab es auf jeden Fall Sinn.
Darüber hinaus, und das fand ich faszinierend, erklärte das Patent, wie Google sogar Abfragevarianten für neuartige Abfragen (ganz neu) und Long-Tail-Abfragen generieren könnte, bei denen noch nicht viele Daten verfügbar sind. Und da 15 % aller Suchanfragen noch nie zuvor von Google gesehen wurden, wäre es sinnvoll, einen Ansatz wie bei der Generierung von Suchanfragenvarianten zu verwenden. Ich werde bald mehr darüber berichten.
Kernpunkte des Patents:
Ich denke, der beste Weg, das Patent abzudecken, besteht darin, einige der Highlights aufzulisten. Im Folgenden werde ich auf einige wichtige Punkte des Patents eingehen, die hoffentlich auch für Sie interessant sind.
Generieren von Abfragevarianten mithilfe eines trainierten generativen Modells
US 11663201 B2
Datum der Erteilung: 30. Mai 2023
Anmeldedatum: 27. April 2018
Name des Bevollmächtigten: Google LLC

1. Abfragevarianten können zur Laufzeit generiert werden, indem ein trainiertes generatives Modell verwendet wird, das auf Tokens aus den ursprünglichen Abfragen und zusätzlichen Eingabefunktionen basiert. Ich werde bald mehr über die zusätzlichen Eingabefunktionen berichten.
2. Das System kann Abfragevarianten generieren, auch wenn das Modell nicht auf diese Abfrage trainiert ist. So können Varianten für neuartige Abfragen (ganz neu) oder sogenannte „Tail“-Anfragen von Google generiert werden, bei denen noch nicht viele Daten vorhanden sind. Das fand ich sehr interessant, vor allem weil Google sagt, dass 15 % der Suchanfragen noch nie zuvor gesehen wurden. So kann das generative Modell mithilfe eines neuronalen Netzwerks (mit Speicherschichten) vorhersagen, welche Abfragevarianten auch für Abfragen mit niedrigem Schwellenwert generiert werden sollen.

3. Das generative Modell kann auf der Grundlage früherer Benutzerabfragen trainiert werden. Das Patent erklärt aber auch, dass die Trainingsdaten der Abfragevarianten auch auf Abfragepaaren basieren können, die Klicks auf dieselben Dokumente haben. Das macht Sinn und zeigt, wie das Engagement der Benutzer einen Einfluss auf die Generierung des Modells haben kann.

4. Das Patent erklärt auch, dass das Modell als Multitask-Modell trainiert werden kann, um die Generierung mehrerer Arten von Abfragevarianten zu ermöglichen. Es handelt sich also um ein hochentwickeltes System, das verschiedene Arten von Abfragevarianten generieren kann, darunter Folgeabfragen, Generalisierungsabfragen, Kanonisierungsabfragen, Sprachübersetzungsabfragen, Folgeabfragen und mehr.


5. Nachdem die Abfragevarianten generiert wurden, werden sie vom Modell bewertet. Das System stellt Antwortwerte für jede Variante bereit. Und das System kann diese Varianten bewerten, indem es nach Antworten auf diese Abfragevarianten sucht. Dies kann dem System helfen, „potenziell gefälschte“ Abfragevarianten zu erkennen. Sehr interessant…

6. Das Patent erklärt weiter, dass das System neben reinen Abfragevarianten auch Antworten zurückgeben kann. Beispielsweise kann das System ein Suchergebnis (PAA irgendjemand?), eine Knowledge-Graph-Entität, eine Null-Antwort (keine Antwort) oder sogar eine Aufforderung zur Klärung (mit klärender Benutzeroberflächeneingabe) zurückgeben. Dies könnte in Form von Begriffsklärungschips geschehen, die wir sehen, wenn Google um Hilfe von Nutzern bittet, um zu verstehen, wonach der Nutzer sucht. Wieder interessant.

7. Das Patent erklärt weiter, dass das Modell mehr als nur Token aus der Abfrage übernehmen kann, einschließlich „zusätzlicher Eingabefunktionen“. Zu diesen Eingabefunktionen können der Standort oder eine Aufgabe gehören, an der der Benutzer interessiert ist oder die er ausführt (z. B. Kochen, Autoreparatur, Reiseplanung usw.). Es kann auch das Wetter und mehr berücksichtigen. Und die Aufgabe könnte auf gespeicherten Kalendereinträgen des Benutzers, Chat-Nachrichten oder anderen Mitteilungen, früheren vom Benutzer gestellten Abfragen usw. basieren. Die Abfragevarianten könnten also auf Personalisierung oder aktuellem Kontext basieren.

8. Das Modell kann auch Varianten einer Anfrage und Anzeigen oder andere Inhalte generieren. Das Modell kann also nicht nur Abfragevarianten generieren, sondern auch Anzeigen oder andere Inhalte generieren (oder möglicherweise abrufen), die in den SERPs angezeigt werden können. Ich denke, ich muss diesen Abschnitt noch einmal durchgehen, aber das war interessant ... :)

9. Das Patent erklärt auch, dass es eine Reihe generativer Modelle geben kann, die auf unterschiedlichen Attributen oder Aufgaben basieren. So kann es spezifische Modelle für verschiedene Aufgaben wie Einkaufen, Reisen zu einem Ort usw. geben.

Zusammenfassung: Die Generierung von Varianten für PASF und PAA kann komplizierter und nuancierter sein, als manche denken.
Ich hoffe, dass die Aufschlüsselung dieses Patents Ihnen dabei geholfen hat zu verstehen, wie Google ein trainiertes generatives Modell verwenden kann, um Abfragevarianten oder andere Inhalte zu generieren, die in verschiedenen SERP-Funktionen angezeigt werden können. Dies kann bei neuartigen (neuen) Abfragen und Long-Tail-Abfragen passieren, bei denen noch nicht viele Daten vorhanden sind. Darüber hinaus könnten mehrere Modelle zum Einsatz kommen, die sich auf eine bestimmte Disziplin konzentrieren. Und die Ergebnisse können auch personalisiert werden (basierend auf zusätzlichen Eingabefunktionen).
Wenn Sie also das nächste Mal „Personen suchen auch nach“ oder „Personen fragen auch“ in den SERPs sehen, wissen Sie, dass möglicherweise ein generatives Modell verwendet wurde, um diese Abfragevarianten bereitzustellen. Und wenn sie personalisiert sind, dann sind diese Fragen möglicherweise spezifisch für Ihren Fall. Auch hier sind die Systeme von Google viel ausgefeilter, als manche Leute denken.
GG