人们也在搜索,或者他们总是在搜索? Google 如何使用经过训练的生成模型为 PASF、PAA 等搜索功能生成查询变体 [专利]
已发表: 2023-06-27 前几天,我在查看 Google 的一些专利,发现了一项有趣的专利,该专利于 2023 年 5 月 30 日获得授权并发布。它的标题是“使用经过训练的生成模型生成查询变体”,它确实激起了我的好奇心。 它最初于 2018 年提交,但于 5 月下旬获得批准。 由于我一直对重要的 SERP 功能(例如 People Also Ask (PAA) 和 People Also Search For (PASF))感兴趣,所以我必须深入研究。
而且,这也是我过去会向才华横溢的比尔·斯拉夫斯基(Bill Slawski)询问的事情。 不幸的是,比尔已经不在我们身边了。 浏览该专利让我意识到我是多么怀念比尔关于专利的帖子,以及能够向他提出有关他的分析的问题。 失去比尔对于我们行业来说绝对是一个巨大的损失。 不管怎样,没有比尔像往常一样挖掘,我决定开始挖掘自己。 我很高兴我做到了。 非常有趣。
利用神经网络的生成模型来实现 SERP 功能
下面我将介绍该专利如何使用训练有素的生成模型来生成 SERP 功能的查询变体,例如“People Also Search For”、“People Also Ask”等。 该专利提到“人们也在搜索”,但不难相信该过程也可以用于 PAA。 我在下面的分析中对此进行了介绍。
了解更多关于谷歌在这方面所做的事情(至少基于专利)是很有趣的。 与任何专利一样,我们不知道谷歌是否已经实施了这一点,或者他们是否会实施,但根据我所读到的内容,它确实有意义。
此外,我发现这一点很有趣,该专利解释了谷歌如何为新颖的查询(全新的)和尚没有太多可用数据的长尾查询生成查询变体。 由于 Google 以前从未见过 15% 的查询,因此使用生成查询变体等方法是有意义的。 我很快就会介绍更多相关内容。
该专利的要点:
我认为介绍该专利的最佳方式是列出一些亮点。 下面,我将介绍该专利的几个要点,希望您也会感兴趣。
使用经过训练的生成模型生成查询变体
美国 11663201 B2
授予日期:2023年5月30日
提交日期:2018 年 4 月 27 日
受让人名称:Google LLC
1. 可以利用基于原始查询的标记和附加输入特征的经过训练的生成模型在运行时生成查询变体。 我很快就会介绍更多关于附加输入功能的内容。
2. 即使模型未针对该查询进行训练,系统也可以生成查询变体。 因此,它可以为新颖的查询(全新的)或谷歌所谓的“尾部”查询(其中还没有大量数据)生成变体。 我发现这非常有趣,特别是因为 Google 表示 15% 的查询以前从未见过。 因此,即使对于低阈值查询,生成模型也可以通过使用神经网络(带有内存层)来预测生成哪些查询变体。
3. 可以根据用户提交的先前查询来训练生成模型。 但该专利还解释说,查询变体训练数据也可以基于点击相同文档的查询对。 这是有道理的,并表明用户参与度如何影响模型生成的内容。
4. 该专利还解释说,该模型可以被训练为多任务模型,以生成多种类型的查询变体。 所以它是一个复杂的系统,可以生成不同类型的查询变体,包括后续查询、泛化查询、规范化查询、语言翻译查询、蕴含查询等等。
5. 生成查询变体后,模型会对它们进行评分。 系统提供每个变体的响应分数。 系统可以通过检查这些查询变体的答案来对这些变体进行评分。 这可以帮助系统检测“可能是假的”查询变体。 很有意思…
6. 该专利接着解释说,除了查询变体之外,系统还可以返回答案。 例如,系统可以返回搜索结果(PAA 任何人?)、知识图实体、空响应(无答案),甚至是澄清提示(澄清用户界面输入)。 这可能是以消歧芯片的形式出现的,当谷歌在试图了解用户正在寻找什么时寻求用户的帮助时,我们会看到这种形式。 再次,有趣。
7. 该专利接着解释说,该模型不仅可以从查询中获取标记,还包括“附加输入特征”。 这些输入特征可以包括位置、用户感兴趣或执行的任务(例如烹饪、修理汽车、旅行计划等)。 它还可以考虑天气等因素。 该任务可以基于用户存储的日历条目、聊天消息或其他通信、用户提交的过去的查询等。因此,查询变体可以基于个性化或当前上下文。
8.该模型还可以生成查询和广告或其他内容的变体。 因此,该模型不仅可以生成查询变体,还可以生成(或可能检索)广告或可在 SERP 中显示的其他内容。 我想我必须再次回顾该部分,但这很有趣......:)
9. 该专利还解释说,可以有多种基于不同属性或任务的生成模型。 因此,可以有针对购物、前往某个地点等各种任务的特定模型。
摘要: 生成 PASF 和 PAA 的变体可能比某些人想象的更加复杂和细致。
我希望对这项专利的详细分析可以帮助您了解 Google 如何使用训练有素的生成模型来生成可以在各种 SERP 功能中显示的查询变体或其他内容。 对于尚没有太多数据的新颖查询(新)和长尾查询,可能会发生这种情况。 此外,可能会使用专注于特定学科的多个模型。 结果也可以个性化(基于额外的输入特征)。
因此,下次您在 SERP 中查看“People Also Search For”或“People Also Ask”时,请知道生成模型可能已用于提供这些查询变体。 如果是个性化的,那么这些查询可能是针对您的情况的。 同样,谷歌的系统比一些人想象的要复杂得多。
GG