Orang Juga Mencari, Atau Apakah Mereka Selalu? Bagaimana Google Mungkin Menggunakan Model Generatif Terlatih Untuk Menghasilkan Varian Kueri Untuk Fitur Pencarian Seperti PASF, PAA, dan lainnya [Paten]
Diterbitkan: 2023-06-27 Saya sedang memeriksa beberapa paten dari Google beberapa hari yang lalu dan menemukan yang menarik yang diberikan dan diterbitkan pada 30 Mei 2023. Itu berjudul "Membuat Varian Kueri Menggunakan Model Generatif Terlatih" dan itu pasti membangkitkan rasa ingin tahu saya. Itu awalnya diajukan pada 2018, tetapi diberikan pada akhir Mei. Dan karena saya selalu tertarik dengan fitur-fitur penting SERP seperti People Also Ask (PAA) dan People Also Search For (PASF), saya harus mempelajarinya.
Juga, ini adalah sesuatu yang akan saya lakukan pada Bill Slawski yang brilian di masa lalu. Sayangnya, Bill sudah tidak bersama kita lagi. Melalui paten membuat saya menyadari betapa saya merindukan postingan Bill tentang paten dan dapat mengirimkan pertanyaan kepadanya tentang analisisnya melalui DM. Kehilangan Bill jelas merupakan kerugian besar bagi industri kami. Bagaimanapun, tanpa Bill untuk menggali seperti biasanya, saya memutuskan untuk mulai menggali sendiri. Dan saya senang saya melakukannya. Itu sangat menarik.
Memanfaatkan Model Generatif Menggunakan Neural Networks Untuk Fitur SERP
Di bawah ini saya akan membahas bagaimana paten menjelaskan penggunaan model generatif terlatih untuk menghasilkan varian kueri untuk fitur SERP seperti "Orang Juga Menelusuri", "Orang Juga Bertanya", dan mungkin lebih. Paten menyebutkan "Orang Juga Mencari", tetapi tidak berlebihan untuk percaya bahwa proses tersebut dapat digunakan untuk PAA juga. Saya membahasnya dalam analisis saya di bawah ini.
Sangat menarik untuk mempelajari lebih lanjut tentang apa yang dilakukan Google di bagian depan ini (setidaknya berdasarkan paten). Seperti halnya paten apa pun, kami tidak tahu apakah Google telah menerapkan ini, atau apakah mereka akan melakukannya, tetapi itu masuk akal berdasarkan apa yang saya baca.
Selain itu, dan menurut saya ini menarik, paten tersebut menjelaskan bagaimana Google bahkan dapat menghasilkan varian kueri untuk kueri baru (baru), dan kueri ekor panjang di mana belum banyak data yang tersedia. Dan dengan 15% dari semua kueri yang belum pernah dilihat oleh Google sebelumnya, masuk akal untuk menggunakan pendekatan seperti untuk menghasilkan varian kueri. Saya akan membahas lebih lanjut tentang ini segera.
Poin-poin penting dari paten:
Saya pikir cara terbaik untuk menutupi paten adalah dengan menonjolkan beberapa hal penting. Di bawah ini, saya akan membahas beberapa poin penting dari paten, yang saya harap Anda juga tertarik.
Menghasilkan Varian Kueri Menggunakan Model Generatif Terlatih
KAMI 11663201 B2
Tanggal Diberikan: 30 Mei 2023
Tanggal Diajukan: 27 April 2018
Nama Penerima Tugas: Google LLC
1. Varian kueri dapat dibuat saat run-time menggunakan model generatif terlatih berdasarkan token dari kueri asli dan fitur masukan tambahan. Saya akan membahas lebih lanjut tentang fitur input tambahan segera.
2. Sistem dapat menghasilkan varian kueri meskipun model tidak dilatih pada kueri tersebut. Sehingga dapat menghasilkan varian untuk kueri baru (baru) atau yang disebut Google sebagai kueri "ekor" di mana datanya belum banyak. Saya menemukan itu sangat menarik, terutama karena Google mengatakan 15% kueri belum pernah dilihat sebelumnya. Jadi model generatif dapat memprediksi varian kueri mana yang dihasilkan bahkan untuk kueri ambang batas rendah dengan menggunakan jaringan saraf (dengan lapisan memori).
3. Model generatif dapat dilatih berdasarkan pengajuan kueri sebelumnya oleh pengguna. Namun paten tersebut juga menjelaskan bahwa data pelatihan varian kueri juga dapat didasarkan pada pasangan kueri yang memiliki klik pada dokumen yang sama. Itu masuk akal dan menunjukkan bagaimana keterlibatan pengguna dapat berperan dalam apa yang dihasilkan oleh model.
4. Paten tersebut juga menjelaskan bahwa model tersebut dapat dilatih sebagai model multitask untuk memungkinkan pembuatan berbagai jenis varian kueri. Jadi ini adalah sistem canggih yang dapat menghasilkan berbagai jenis varian kueri, termasuk kueri tindak lanjut, kueri generalisasi, kueri kanonikalisasi, kueri terjemahan bahasa, kueri keterlibatan, dan banyak lagi.
5. Setelah varian kueri dibuat, varian tersebut diberi skor berdasarkan model. Sistem memberikan skor respons untuk setiap varian. Dan sistem dapat menilai varian tersebut dengan memeriksa jawaban atas varian kueri tersebut. Itu dapat membantu sistem mendeteksi varian kueri yang "berpotensi palsu". Sangat menarik…
6. Paten selanjutnya menjelaskan bahwa sistem dapat mengembalikan jawaban selain hanya varian kueri. Misalnya, sistem dapat menampilkan hasil pencarian (PAA, siapa saja?), entitas grafik pengetahuan, respons nol (tidak ada jawaban), atau bahkan prompt untuk klarifikasi (dengan mengklarifikasi input antarmuka pengguna). Itu bisa berupa chip disambiguasi yang kita lihat saat Google mencari bantuan dari pengguna saat mencoba memahami apa yang dicari pengguna. Sekali lagi, menarik.
7. Paten selanjutnya menjelaskan bahwa model dapat mengambil lebih dari sekadar token dari kueri, termasuk "fitur input tambahan". Fitur input tersebut dapat mencakup lokasi, tugas yang diminati atau dilakukan pengguna (seperti memasak, memperbaiki mobil, merencanakan perjalanan, dll.). Itu juga dapat memperhitungkan cuaca dan banyak lagi. Dan tugas tersebut dapat didasarkan pada entri kalender yang disimpan untuk pengguna, pesan obrolan atau komunikasi lainnya, kueri sebelumnya yang dikirimkan oleh pengguna, dll. Jadi varian kueri dapat didasarkan pada personalisasi atau konteks saat ini.
8. Model juga dapat menghasilkan varian kueri dan iklan atau konten lainnya . Jadi model tersebut tidak hanya dapat menghasilkan varian kueri, tetapi juga dapat menghasilkan (atau mungkin mengambil) iklan atau konten lain yang dapat ditampilkan di SERPs. Saya pikir saya harus kembali ke bagian itu lagi, tapi itu menarik… :)
9. Paten juga menjelaskan bahwa mungkin ada sejumlah model generatif berdasarkan atribut atau tugas yang berbeda. Jadi bisa ada model khusus untuk berbagai tugas seperti berbelanja, bepergian ke suatu lokasi, dll.
Rangkuman: Menghasilkan varian untuk PASF dan PAA bisa lebih rumit dan bernuansa daripada yang dipikirkan beberapa orang.
Saya harap memecah paten ini sedikit membantu Anda memahami bagaimana Google dapat menggunakan model generatif terlatih untuk menghasilkan varian kueri, atau konten lain, yang dapat ditampilkan di berbagai fitur SERP. Dan ini bisa terjadi untuk kueri novel (baru) dan kueri long-tail yang belum memiliki banyak data. Selain itu, mungkin ada beberapa model yang digunakan yang berfokus pada disiplin tertentu. Dan hasilnya juga bisa dipersonalisasi (berdasarkan fitur masukan tambahan).
Jadi, lain kali Anda melihat "Orang Juga Menelusuri" atau "Orang Juga Bertanya" di SERP, ketahuilah bahwa model generatif mungkin telah digunakan untuk menyediakan varian kueri tersebut. Dan jika dipersonalisasi, mungkin kueri tersebut khusus untuk kasus Anda. Sekali lagi, sistem Google jauh lebih canggih dari yang dipikirkan sebagian orang.
GG