Джарвис Райзинг — Как Google может генерировать модель машинного обучения «на лету», чтобы предсказывать ответы, когда поиск не может, и как он может индексировать эти модели, чтобы предсказывать ответы на будущие запросы [патент]
Опубликовано: 2023-07-13 Проанализировав патент Google, связанный с PAA и PASF, я начал просматривать другие недавно выданные патенты. И вскоре я обнаружил еще один очень интересный вопрос об использовании моделей машинного обучения. Патент, который я только что проанализировал, фокусируется на использовании и/или создании модели машинного обучения в ответ на запрос (когда Google нужно предсказать ответ, поскольку стандартные результаты поиска не могут предоставить адекватный ответ). Многократное прочтение патента показало, насколько сложными могут быть системы Google, когда им нужно предоставить качественный ответ (или прогноз) для пользователей.
Как и в случае с любым патентом, мы никогда не знаем, действительно ли Google реализовал то, что покрывается патентом, но это всегда возможно. И если бы это было реализовано, Google мог бы не только использовать обученную модель машинного обучения, чтобы помочь предсказать ответ на запрос, но и мог бы индексировать эти модели машинного обучения, связывать их с различными объектами, веб-страницами и т. д., а затем извлекать и использовать эти модели для последующего связанного поиска. Подумайте, насколько мощным и масштабируемым это может быть для Google.
Кроме того, в патенте поясняется, что Google может возвращать интерактивный интерфейс модели машинного обучения в результаты поиска, что позволяет пользователям добавлять параметры, которые можно использовать для создания прогноза для запросов, когда результатов поиска недостаточно. Эта часть патента заставила меня задуматься о сообщении, которое Google развернул в поисковой выдаче в апреле 2020 года, когда по запросу не возвращаются качественные результаты поиска. Текущая реализация не предоставляет форму для взаимодействия пользователей, но в какой-то момент она определенно может это сделать. И, возможно, этот интерфейс можно будет использовать для большего количества запросов в будущем, а не только для более неясных, которые он показывает сейчас. Я расскажу об этом больше в пунктах ниже.
Ключевые моменты из патента:
Подобно моему последнему сообщению, посвященному недавнему патенту Google, я думаю, что лучший способ осветить детали — предоставить маркеры ключевых моментов.
Создание и/или использование модели машинного обучения в ответ на поисковый запрос
США 11645277 B2
Дата предоставления: 9 мая 2023 г.
Дата подачи: 12 декабря 2017 г.
Имя правопреемника: Google LLC
1. Патент Google объясняет, что если ответ не может быть определен с уверенностью, и пользователь отправляет запрос, который носит прогнозный характер, для создания прогноза можно использовать обученную модель машинного обучения.
2. Например, Google может сначала генерировать результаты поиска на основе запроса, но если результаты недостаточно качественные, можно использовать модель машинного обучения, чтобы предоставить более надежный прогнозируемый ответ. Таким образом, система может предоставлять прогнозируемые ответы на основе модели машинного обучения, когда ответ не может быть подтвержден Google.
3. Кроме того, модель машинного обучения может генерироваться «на лету», и Google может хранить обученные модели машинного обучения в поисковом индексе. Да, Google может индексировать модели машинного обучения, которые были только что обучены давать прогнозы на основе определенных типов запросов. Я расскажу больше об этом в ближайшее время.
4. В патенте приведен пример на основе запроса «Сколько врачей будет в Китае в 2050 году?» Если авторитетный ответ не может быть предоставлен через стандартные результаты поиска, то запрос может быть передан обученной модели машинного обучения для создания прогноза.
5. Далее в патенте объясняется, что система может использовать другие годы, такие как 2010, 2015, 2020 и т. д., и использовать их для создания прогноза (через модель машинного обучения, обученную на этих параметрах).
6. В патенте объясняется, что обученные модели машинного обучения могут быть проиндексированы по одному или нескольким элементам контента из «ресурсов, используемых для обучения модели». А для будущих запросов, когда система определяет параметры, связанные с моделью машинного обучения (например, если последующий пользователь задает связанный вопрос, например «Сколько врачей будет в Китае в 2040 году ?»), модель машинного обучения может использоваться для создания прогноза.
7. Далее в патенте объясняется, что модели машинного обучения могут храниться с одним или несколькими элементами контента, такими как объекты в графе знаний, имена таблиц, имена столбцов, имена веб-страниц и многое другое. Кроме того, слова, связанные с запросом, такие как «Китай» и «врачи», могут использоваться моделью машинного обучения для создания прогноза.
8. Далее в патенте объясняется, что система может предоставить пользователям интерактивный интерфейс для выбора параметров, которые можно передать в модель машинного обучения. Это может быть текстовое поле, раскрывающееся меню и т. д. Кроме того, ответ может включать сообщение, представленное пользователю, о том, что ответ является прогнозом, основанным на обученной модели машинного обучения. Поэтому Google хочет убедиться, что пользователи понимают, что это прогноз, основанный на модели машинного обучения, а не ответы, предоставленные на основе данных, которые он проиндексировал.
9. Затем обученная модель может быть проверена, чтобы гарантировать, что прогнозы имеют по крайней мере «пороговое качество». Все, что ниже определенного порога, может быть подавлено и не предоставлено пользователю. В этом случае вместо него могут отображаться стандартные результаты поиска.
10. Помимо общедоступных результатов поиска, в патенте объясняется, что система может использоваться в частной базе данных, чтобы помочь компаниям прогнозировать определенные результаты. В патенте поясняется, что он «частный для группы пользователей, корпорации и/или других ограниченных групп». Например, сотрудник парка развлечений может спросить: «Сколько снежных конусов мы продадим завтра?» Затем система может запросить частную базу данных, чтобы понять продажи за предыдущие дни, информацию о погоде, данные о посещаемости и т. д., чтобы предсказать ответ для сотрудника.
11. В патенте объясняется, что в какой-то момент система может предоставлять push-уведомления от «автоматического помощника». И просто думая вслух, мне интересно, может ли это быть от помощника, похожего на Джарвиса, как я объяснил в своем посте о Code Red от Google, который вызвал тысячи Code Reds у издателей.
12. С точки зрения задержки в патенте объясняется, что после того, как пользователь отправит запрос, может возникнуть задержка. Когда это происходит, стандартные результаты поиска могут сначала отображаться вместе с сообщением о том, что «хорошие» результаты недоступны для запроса и что для создания прогноза используется модель машинного обучения. В таких ситуациях система может отправить этот прогноз пользователю позже или предоставить гиперссылку, по которой пользователи могут щелкнуть, чтобы просмотреть результаты машинного обучения.
13. Кроме того, в патенте говорится, что в некоторых ситуациях пользователь должен будет подтвердить подсказку, чтобы процесс продолжился. Например, система может предоставить сообщение о том, что «Хороший ответ недоступен. Хочешь, я предскажу тебе ответ?» Тогда модель машинного обучения будет обучаться только в том случае, если в ответ на приглашение будет получен положительный ввод данных от пользователя. Как я объяснял ранее, я вижу связь с сообщением «Нет подходящих совпадений для вашего поиска», которое появилось в апреле 2020 года. Мне интересно, можно ли расширить эту модель для использования в будущем…
Резюме: Google может прогнозировать качественные ответы мощным и сверхэффективным способом с помощью (индексированных) моделей машинного обучения.
Хотя мы не знаем, используется ли какой-либо конкретный патент, мощность и эффективность этого процесса имеют большое значение для Google. От создания моделей машинного обучения «на лету» до индексации этих моделей для будущего использования и использования интерактивного интерфейса с push-уведомлениями Google, похоже, готовит почву для такого помощника, как Джарвис. Итак, в следующий раз, когда вы попросите Google предсказать ответ, подумайте об этом патенте. И в какой-то момент вам может быть просто предложено предоставить дополнительную информацию (пока Джарвис не сможет сделать все это за наносекунду). :)
ГАРАНТИРОВАННАЯ ПОБЕДА