Ludzie też szukają, czy zawsze? Jak Google może wykorzystać wyszkolony model generatywny do generowania wariantów zapytań dla funkcji wyszukiwania, takich jak PASF, PAA i inne [Patent]

Opublikowany: 2023-06-27
E-mail
Google używa modelu generatywnego do generowania wariantów zapytań dla osób, które również wyszukują i które również pytają

Pewnego dnia sprawdzałem niektóre patenty z Google i ujawniłem interesujący patent, który został przyznany i opublikowany 30 maja 2023 r. Nosił tytuł „Generowanie wariantów zapytania przy użyciu wytrenowanego modelu generatywnego” i zdecydowanie wzbudził moją ciekawość. Pierwotnie został złożony w 2018 r., ale został przyznany pod koniec maja. A ponieważ zawsze interesują mnie ważne funkcje SERP, takie jak People Also Ask (PAA) i People Also Search For (PASF), musiałem zagłębić się w temat.

Poza tym jest to coś, o co w przeszłości zwróciłbym się do genialnego Billa Sławskiego. Niestety Billa już z nami nie ma. Przeglądanie patentu uświadomiło mi, jak bardzo brakuje mi postów Billa o patentach i możliwości zadawania mu pytań dotyczących jego analizy. Utrata Billa była zdecydowanie ogromną stratą dla naszej branży. W każdym razie, bez Billa, który mógłby kopać w sposób, w jaki zawsze to robił, postanowiłem zacząć kopać w sobie. I cieszę się, że to zrobiłem. To było bardzo interesujące.

Wykorzystanie modeli generatywnych z wykorzystaniem sieci neuronowych do funkcji SERP
Poniżej omówię, w jaki sposób patent opisuje użycie wyszkolonego modelu generatywnego do generowania wariantów zapytań dla funkcji SERP, takich jak „Ludzie też szukają”, „Ludzie też pytają” i może więcej. W patencie jest mowa o „Ludzie też szukają”, ale nietrudno uwierzyć, że ten proces można zastosować również w przypadku PAA. Omawiam to w mojej analizie poniżej.

Fascynujące było dowiedzieć się więcej o tym, co Google robi na tym froncie (przynajmniej w oparciu o patent). Podobnie jak w przypadku każdego patentu, nie wiemy, czy Google już to wdrożyło i czy to zrobi, ale z pewnością miało to sens na podstawie tego, co czytałem.

Ponadto, co wydało mi się fascynujące, w patencie wyjaśniono, w jaki sposób Google może nawet generować warianty zapytań dla nowatorskich zapytań (całkowicie nowych) i zapytań z długim ogonem, w których nie ma jeszcze zbyt wielu danych. A przy 15% wszystkich zapytań, których Google nigdy wcześniej nie widziało, sensowne byłoby zastosowanie podejścia takiego jak generowanie wariantów zapytań. Wkrótce opiszę więcej na ten temat.

Kluczowe punkty z patentu:
Myślę, że najlepszym sposobem na pokrycie patentu jest wypunktowanie niektórych najważniejszych elementów. Poniżej omówię kilka kluczowych punktów z patentu, które, mam nadzieję, również okażą się interesujące.

Generowanie wariantów zapytania przy użyciu wytrenowanego modelu generatywnego
US 11663201 B2
Data przyznania: 30 maja 2023 r
Data złożenia: 27 kwietnia 2018 r
Nazwa cesjonariusza: Google LLC

Diagram z patentu Google dotyczący używania modelu generatywnego do generowania wariantów zapytań dla PASF i PAA

1. Warianty zapytań mogą być generowane w czasie wykonywania przy użyciu wytrenowanego modelu generatywnego opartego na tokenach z oryginalnych zapytań i dodatkowych funkcji wejściowych. Wkrótce omówię więcej o dodatkowych funkcjach wprowadzania.

2. System może generować warianty zapytań nawet wtedy, gdy model nie jest szkolony na tym zapytaniu. Może więc generować warianty dla nowych zapytań (zupełnie nowych) lub tego, co Google nazywa zapytaniami „ogonowymi”, w przypadku których nie ma jeszcze wielu danych. Uznałem to za bardzo interesujące, zwłaszcza że Google twierdzi, że 15% zapytań nigdy wcześniej nie było widzianych. Tak więc model generatywny może przewidzieć, które warianty zapytań wygenerować, nawet w przypadku zapytań o niskim progu, używając sieci neuronowej (z warstwami pamięci).

Model generatywny Google działający w przypadku nowych zapytań i zapytań z długim ogonem.

3. Model generatywny można trenować na podstawie przesłanych wcześniej zapytań przez użytkowników. Ale patent wyjaśnia również, że dane treningowe wariantu zapytania mogą być również oparte na parach zapytań, które mają kliknięcia tych samych dokumentów. Ma to sens i pokazuje, jak zaangażowanie użytkownika może odgrywać rolę w tym, co jest generowane przez model.

Model generatywny Google trenował na parach zapytań, które mają kliknięcia tego samego dokumentu.

4. Patent wyjaśnia również, że model można wytrenować jako model wielozadaniowy , aby umożliwić generowanie wielu typów wariantów zapytań. Jest to więc wyrafinowany system, który może generować różne typy wariantów zapytań, w tym zapytania uzupełniające, zapytania uogólniające, zapytania kanoniczne, zapytania dotyczące tłumaczenia językowego, zapytania wynikające z implikacji i inne.

Model generatywny Google można wyszkolić jako model wielozadaniowy do generowania wielu typów wariantów zapytań.

5. Po wygenerowaniu wariantów zapytania są one oceniane przez model. System zapewnia ocenę odpowiedzi dla każdego wariantu. System może oceniać te warianty, sprawdzając odpowiedzi na te warianty zapytania. Może to pomóc systemowi wykryć „potencjalnie fałszywe” warianty zapytań. Bardzo interesujące…

Model generatywny Google oceniający warianty zapytań w celu określenia jakości.

6. Patent wyjaśnia dalej, że system może zwracać odpowiedzi oprócz samych wariantów zapytania. Na przykład, system może zwrócić wynik wyszukiwania (PAA ktoś?), element wykresu wiedzy, pustą odpowiedź (brak odpowiedzi), a nawet monit o wyjaśnienie (z wyjaśnieniem danych wejściowych interfejsu użytkownika). Może to być w formie chipów ujednoznaczniających, które widzimy, gdy Google szuka pomocy od użytkowników, próbując zrozumieć, czego szuka użytkownik. Znów interesujące.

Patent Google wyjaśnia, że ​​system może zwracać odpowiedzi oprócz samych wariantów zapytania.

7. Patent wyjaśnia dalej, że model może wziąć więcej niż tylko tokeny z zapytania, w tym „dodatkowe funkcje wejściowe”. Te funkcje wejściowe mogą obejmować lokalizację, zadanie, które użytkownik jest zainteresowany lub które wykonuje (takie jak gotowanie, naprawa samochodu, planowanie podróży itp.). Może również uwzględniać pogodę i nie tylko. A zadanie może opierać się na zapisanych wpisach kalendarza dla użytkownika, wiadomościach czatu lub innej komunikacji, wcześniejszych zapytaniach przesłanych przez użytkownika itp. Warianty zapytań mogą więc opierać się na personalizacji lub bieżącym kontekście.

Patent Google wyjaśnia, że ​​model może wziąć więcej niż tylko tokeny z zapytania, w tym „dodatkowe funkcje wejściowe”.

8. Model może również generować warianty zapytania oraz reklamy lub inne treści . Tak więc model może nie tylko generować warianty zapytań, ale może generować (a może pobierać) reklamy lub inne treści, które mogą być wyświetlane w SERP. Chyba muszę jeszcze raz przejrzeć ten rozdział, ale to było ciekawe… :)

Model generatywny Google może generować warianty zapytania i reklamy lub inne treści.

9. Patent wyjaśnia również, że może istnieć wiele modeli generatywnych opartych na różnych atrybutach lub zadaniach. Mogą więc istnieć konkretne modele do różnych zadań, takich jak zakupy, podróż do miejsca itp.

Patent Google wyjaśnia, że ​​może istnieć wiele modeli generatywnych opartych na różnych atrybutach lub zadaniach.

Podsumowanie: Generowanie wariantów dla PASF i PAA może być bardziej skomplikowane i bardziej złożone niż niektórym się wydaje.
Mam nadzieję, że omówienie tego patentu pomogło ci trochę zrozumieć, w jaki sposób Google może wykorzystywać wyszkolony model generatywny do generowania wariantów zapytań lub innych treści, które można wyświetlać w różnych funkcjach SERP. Może się to zdarzyć w przypadku nowych zapytań (nowych) i zapytań z długim ogonem, w przypadku których nie ma jeszcze zbyt wielu danych. Ponadto może być używanych wiele modeli, które koncentrują się na określonej dyscyplinie. Wyniki można również spersonalizować (na podstawie dodatkowych funkcji wejściowych).

Więc następnym razem, gdy zobaczysz „Ludzie też szukają” lub „Ludzie też pytają” w SERP, wiedz, że do dostarczenia tych wariantów zapytań mógł zostać użyty model generatywny. A jeśli są spersonalizowane, być może te zapytania są specyficzne dla Twojej sprawy. Ponownie, systemy Google są znacznie bardziej wyrafinowane, niż niektórym się wydaje.

GG