Oamenii caută și ei sau caută întotdeauna? Cum ar putea folosi Google un model generativ instruit pentru a genera variante de interogare pentru funcții de căutare cum ar fi PASF, PAA și altele [brevet]

Publicat: 2023-06-27

E-mail

Google folosește un model generativ pentru a genera variante de interogare pentru oamenii care caută și oamenii întreabă

Verificam câteva brevete de la Google zilele trecute și am scos la iveală unul interesant care a fost acordat și publicat pe 30 mai 2023. Era intitulat „Generarea variantelor de interogare folosind un model generativ antrenat” și mi-a stârnit cu siguranță curiozitatea. A fost depusă inițial în 2018, dar a fost acordată la sfârșitul lunii mai. Și din moment ce sunt întotdeauna interesat de funcții importante ale SERP, cum ar fi People Also Ask (PAA) și People Also Search For (PASF), a trebuit să caut.

De asemenea, acesta este ceva despre care l-aș fi pus ping pe genialul Bill Slawski în trecut. Din păcate, Bill nu mai este cu noi. Parcurgând brevetul m-a făcut să realizez cât de mult îmi lipsesc postările lui Bill despre brevete și că pot să-i trimit întrebări despre analiza lui. Pierderea lui Bill a fost cu siguranță o pierdere masivă pentru industria noastră. Oricum, fără ca Bill să sape așa cum ar fi făcut-o întotdeauna, am decis să încep să sape în mine. Și mă bucur că am făcut-o. A fost super-interesant.

Utilizarea modelelor generative folosind rețele neuronale pentru caracteristicile SERP
Mai jos voi acoperi modul în care brevetul descrie utilizarea unui model generativ antrenat pentru a genera variante de interogare pentru caracteristicile SERP, cum ar fi „People Also Search For”, „People Also Ask” și poate multe altele. Brevetul menționează „People Also Search For”, dar nu este exagerat să credem că procesul ar putea fi folosit și pentru PAA. Am acoperit asta în analiza mea de mai jos.

A fost fascinant să aflu mai multe despre ceea ce face Google pe acest front (cel puțin pe baza brevetului). Ca și în cazul oricărui brevet, nu știm dacă Google a implementat acest lucru încă sau dacă o va face, dar cu siguranță a avut sens pe baza a ceea ce citeam.

În plus, și mi s-a părut fascinant acest lucru, brevetul a explicat modul în care Google ar putea chiar să genereze variante de interogare pentru interogări noi (noute) și interogări cu coadă lungă unde nu există încă multe date disponibile. Și având în vedere că 15% din toate interogările nu au mai fost văzute de Google înainte, ar fi logic să folosiți o abordare precum pentru generarea de variante de interogare. Voi acoperi mai multe despre asta în curând.

Puncte cheie ale brevetului:
Cred că cel mai bun mod de a acoperi brevetul este să scoți în evidență unele dintre cele mai importante. Mai jos, voi acoperi câteva puncte cheie din brevet, pe care sper să le găsiți și dvs. interesante.

Generarea variantelor de interogare folosind un model generativ antrenat
US 11663201 B2
Data acordării: 30 mai 2023
Data depunerii: 27 aprilie 2018
Numele cesionarului: Google LLC

Diagramă dintr-un brevet Google despre utilizarea unui model generativ pentru a genera variante de interogare pentru PASF și PAA

1. Variantele de interogare pot fi generate în timpul execuției utilizând un model generativ antrenat bazat pe token-uri din interogările originale și caracteristici suplimentare de intrare. Voi acoperi mai multe despre funcțiile suplimentare de intrare în curând.

2. Sistemul poate genera variante de interogare chiar și atunci când modelul nu este antrenat pentru acea interogare. Deci, poate genera variante pentru interogări noi (nouț) sau ceea ce Google numește interogări „coadă” în cazul în care nu există încă o mulțime de date. Mi s-a părut foarte interesant, mai ales că Google spune că 15% dintre interogări nu au mai fost văzute până acum. Deci, modelul generativ poate prezice ce variante de interogare să genereze chiar și pentru interogările cu prag scăzut, folosind o rețea neuronală (cu straturi de memorie).

Modelul generativ Google care funcționează pentru interogări noi și interogări cu coadă lungă.

3. Modelul generativ poate fi antrenat pe baza trimiterilor de interogări anterioare de către utilizatori. Dar brevetul explică, de asemenea, că datele de instruire ale variantei de interogare se pot baza și pe perechi de interogări care au clicuri pe aceleași documente. Acest lucru are sens și arată cum implicarea utilizatorilor poate juca un factor în ceea ce este generat de model.

Modelul generativ Google instruit pe perechi de interogări care au clicuri pe același document.

4. Brevetul explică, de asemenea, că modelul poate fi antrenat ca model multitask pentru a permite generarea de mai multe tipuri de variante de interogare. Deci, este un sistem sofisticat care poate genera diferite tipuri de variante de interogare, inclusiv interogări ulterioare, interogări de generalizare, interogări de canonizare, interogări de traducere a limbii, interogări de implicare și multe altele.

Modelul generativ Google poate fi antrenat ca model multitask pentru a genera mai multe tipuri de variante de interogare.

5. După ce variantele de interogare sunt generate, acestea sunt punctate de model. Sistemul oferă scoruri de răspuns pentru fiecare variantă. Și sistemul poate nota acele variante verificând răspunsurile la acele variante de interogare. Acest lucru poate ajuta sistemul să detecteze variantele de interogare „potențial false”. Foarte interesant…

Modelul generativ Google a punctat variantele de interogare pentru a determina calitatea.

6. Brevetul continuă să explice că sistemul poate returna răspunsuri în plus față de doar variante de interogare. De exemplu, sistemul poate returna un rezultat al căutării (PAA oricine?), o entitate grafică de cunoștințe, un răspuns nul (fără răspuns) sau chiar o solicitare de clarificare (cu introducere de clarificare a interfeței de utilizator). Acest lucru ar putea fi sub forma unor cipuri de dezambiguizare pe care le vedem atunci când Google caută ajutor de la utilizatori atunci când încearcă să înțeleagă ce caută utilizatorul. Din nou, interesant.

Brevetul Google explică că sistemul poate returna răspunsuri în plus față de doar variante de interogare.

7. Brevetul explică în continuare că modelul poate lua mai mult decât doar jetoane din interogare, inclusiv „funcții suplimentare de intrare”. Aceste caracteristici de intrare ar putea include locația, o sarcină pe care utilizatorul este interesat sau pe care o realizează (cum ar fi gătitul, repararea unei mașini, planificarea călătoriei etc.). Se poate lua în considerare și vremea și multe altele. Iar sarcina s-ar putea baza pe intrări de calendar stocate pentru utilizator, mesaje de chat sau alte comunicări, interogări anterioare trimise de utilizator etc. Deci variantele de interogare ar putea fi bazate pe personalizare sau contextul actual.

Brevetul Google explică că modelul poate lua mai mult decât doar jetoane din interogare, inclusiv „funcții suplimentare de introducere”.

8. Modelul poate genera și variante ale unei interogări și reclame sau alt conținut . Deci modelul nu poate genera doar variante de interogare, dar poate genera (sau poate prelua) reclame sau alt conținut care poate fi afișat în SERP-uri. Cred că trebuie să revin din nou prin acea secțiune, dar a fost interesant... :)

Modelul generativ Google poate genera variante ale unei interogări și reclame sau alt conținut.

9. Brevetul explică, de asemenea, că pot exista o serie de modele generative bazate pe diferite atribute sau sarcini. Deci pot exista modele specifice pentru diverse sarcini, cum ar fi cumpărăturile, călătoria într-o locație etc.

Brevetul Google explică faptul că pot exista o serie de modele generative bazate pe diferite atribute sau sarcini.

Rezumat: Generarea de variante pentru PASF și PAA poate fi mai complicată și mai nuanțată decât cred unii.
Sper că defalcarea acestui brevet v-a ajutat să înțelegeți cum ar putea Google să folosească un model generativ antrenat pentru a genera variante de interogare sau alt conținut care poate fi afișat în diferite funcții SERP. Și acest lucru se poate întâmpla pentru interogări noi (noi) și interogări cu coadă lungă, unde încă nu există multe date. În plus, ar putea fi utilizate mai multe modele care se concentrează pe o anumită disciplină. Iar rezultatele pot fi, de asemenea, personalizate (pe baza funcțiilor de intrare suplimentare).

Deci, data viitoare când vedeți „Oamenii caută și ei” sau „Oamenii întreabă și ei” în SERP-uri, știți că un model generativ ar fi putut fi folosit pentru a furniza acele variante de interogare. Și dacă sunt personalizate, atunci poate că acele interogări sunt specifice cazului tău. Din nou, sistemele Google sunt mult mai sofisticate decât cred unii oameni.

GG