Le persone cercano anche o lo fanno sempre? In che modo Google potrebbe utilizzare un modello generativo addestrato per generare varianti di query per funzionalità di ricerca come PASF, PAA e altro ancora [Brevetto]
Pubblicato: 2023-06-27 L'altro giorno stavo controllando alcuni brevetti di Google e ne è emerso uno interessante che è stato concesso e pubblicato il 30 maggio 2023. Si intitolava "Generazione di varianti di query utilizzando un modello generativo addestrato" e ha sicuramente stuzzicato la mia curiosità. È stato originariamente depositato nel 2018, ma è stato concesso a fine maggio. E poiché sono sempre interessato a importanti funzionalità SERP come People Also Ask (PAA) e People Also Search For (PASF), ho dovuto approfondire.
Inoltre, questo è qualcosa di cui avrei parlato con il brillante Bill Slawski in passato. Sfortunatamente, Bill non è più con noi. Passare attraverso il brevetto mi ha fatto capire quanto mi mancano i post di Bill sui brevetti e potergli fare domande sulla sua analisi. La perdita di Bill è stata sicuramente una perdita enorme per il nostro settore. Ad ogni modo, senza che Bill scavasse come avrebbe sempre fatto, ho deciso di iniziare a scavare dentro me stesso. E sono contento di averlo fatto. È stato super interessante.
Sfruttare i modelli generativi utilizzando le reti neurali per le funzionalità SERP
Di seguito tratterò come il brevetto descrive l'utilizzo di un modello generativo addestrato per generare varianti di query per funzionalità SERP come "Le persone cercano anche", "Le persone chiedono anche" e forse altro. Il brevetto menziona "Le persone cercano anche", ma non è una forzatura credere che il processo possa essere utilizzato anche per PAA. Lo copro nella mia analisi di seguito.
È stato affascinante saperne di più su ciò che Google sta facendo su questo fronte (almeno sulla base del brevetto). Come con qualsiasi brevetto, non sappiamo se Google lo abbia già implementato o se lo farà, ma aveva sicuramente senso in base a ciò che stavo leggendo.
Inoltre, e l'ho trovato affascinante, il brevetto spiegava come Google potesse persino generare varianti di query per nuove query (nuove di zecca) e query a coda lunga in cui non sono ancora disponibili molti dati. E con il 15% di tutte le query mai viste prima da Google, avrebbe senso utilizzare un approccio come per generare varianti di query. Tratterò di più su questo presto.
Punti chiave del brevetto:
Penso che il modo migliore per coprire il brevetto sia elencare alcuni punti salienti. Di seguito, tratterò diversi punti chiave del brevetto, che spero troviate anche interessanti.
Generazione di varianti di query utilizzando un modello generativo addestrato
USA 11663201 B2
Data di concessione: 30 maggio 2023
Data deposito: 27 aprile 2018
Nome dell'assegnatario: Google LLC
1. Le varianti di query possono essere generate in fase di esecuzione utilizzando un modello generativo addestrato basato su token delle query originali e funzionalità di input aggiuntive. Tratterò presto ulteriori informazioni sulle funzionalità di input aggiuntive.
2. Il sistema può generare varianti di query anche quando il modello non viene addestrato su tale query. Quindi può generare varianti per nuove query (nuove di zecca) o ciò che Google chiama query "tail" dove non ci sono ancora molti dati. L'ho trovato molto interessante, soprattutto perché Google afferma che il 15% delle query non è mai stato visto prima. Pertanto, il modello generativo può prevedere quali varianti di query generare anche per query a bassa soglia utilizzando una rete neurale (con livelli di memoria).
3. Il modello generativo può essere addestrato in base all'invio di query precedenti da parte degli utenti. Ma il brevetto spiega anche che i dati di addestramento della variante della query possono anche essere basati su coppie di query che hanno clic sugli stessi documenti. Ciò ha senso e mostra come il coinvolgimento degli utenti può svolgere un ruolo in ciò che viene generato dal modello.
4. Il brevetto spiega inoltre che il modello può essere addestrato come modello multitasking per consentire la generazione di più tipi di varianti di query. Si tratta quindi di un sistema sofisticato in grado di generare diversi tipi di varianti di query, tra cui query di follow-up, query di generalizzazione, query di canonicalizzazione, query di traduzione linguistica, query di implicazione e altro ancora.
5. Dopo che le varianti di query sono state generate, vengono valutate dal modello. Il sistema fornisce punteggi di risposta per ciascuna variante. E il sistema può classificare quelle varianti controllando le risposte a quelle varianti di query. Ciò può aiutare il sistema a rilevare varianti di query "potenzialmente false". Molto interessante…
6. Il brevetto prosegue spiegando che il sistema può restituire risposte oltre alle sole varianti di interrogazione. Ad esempio, il sistema può restituire un risultato di ricerca (PAA chiunque?), un'entità del grafico della conoscenza, una risposta nulla (nessuna risposta) o persino una richiesta di chiarimento (con input chiarificatore dell'interfaccia utente). Ciò potrebbe essere sotto forma di chip di disambiguazione che vediamo quando Google cerca aiuto dagli utenti quando cerca di capire cosa sta cercando l'utente. Di nuovo, interessante.
7. Il brevetto prosegue spiegando che il modello può prendere più di semplici token dalla query, incluse "funzionalità di input aggiuntive". Tali funzionalità di input potrebbero includere la posizione, un'attività a cui l'utente è interessato o che esegue (come cucinare, riparare un'auto, pianificare un viaggio, ecc.). Può anche tenere conto del tempo e altro. E l'attività potrebbe essere basata su voci di calendario memorizzate per l'utente, messaggi di chat o altre comunicazioni, query passate inviate dall'utente, ecc. Quindi le varianti di query potrebbero essere basate sulla personalizzazione o sul contesto attuale.
8. Il modello può anche generare varianti di una query e pubblicità o altri contenuti . Quindi il modello non solo può generare varianti di query, ma può generare (o forse recuperare) annunci o altri contenuti che possono essere visualizzati nelle SERP. Penso di dover ripercorrere di nuovo quella sezione, ma è stato interessante... :)
9. Il brevetto spiega inoltre che possono esistere numerosi modelli generativi basati su attributi o compiti diversi. Quindi possono esserci modelli specifici per varie attività come lo shopping, il viaggio verso un luogo, ecc.
Riepilogo: la generazione di varianti per PASF e PAA può essere più complicata e sfumata di quanto alcuni pensino.
Spero che l'abbattimento di questo brevetto ti abbia aiutato a capire come Google potrebbe utilizzare un modello generativo addestrato per generare varianti di query o altri contenuti che possono essere visualizzati in varie funzionalità SERP. E questo può accadere per nuove query (nuove) e query a coda lunga in cui non ci sono ancora molti dati. Inoltre, potrebbero essere utilizzati più modelli incentrati su una disciplina specifica. E anche i risultati possono essere personalizzati (basati su funzionalità di input aggiuntive).
Quindi, la prossima volta che visualizzerai "Le persone cercano anche" o "Le persone chiedono anche" nelle SERP, sappi che potrebbe essere stato utilizzato un modello generativo per fornire quelle varianti di query. E se personalizzate, allora forse quelle domande sono specifiche per il tuo caso. Ancora una volta, i sistemi di Google sono molto più sofisticati di quanto alcuni pensino.
GG