사람들은 또한 검색합니까, 아니면 항상 검색합니까? Google이 학습된 생성 모델을 사용하여 PASF, PAA 등과 같은 검색 기능에 대한 쿼리 변형을 생성하는 방법 [특허]

게시 됨: 2023-06-27
이메일
Google은 생성 모델을 사용하여 사람들이 검색하고 사람들이 묻는 검색어 변형을 생성합니다.

얼마 전 Google에서 일부 특허를 확인하다가 2023년 5월 30일에 승인되어 게시된 흥미로운 특허를 발견했습니다. 제목은 "학습된 생성 모델을 사용하여 쿼리 변형 생성"이었고 확실히 제 호기심을 자극했습니다. 원래 2018년에 신청했지만 5월 말에 승인되었습니다. 그리고 PAA(People Also Ask) 및 PASF(People Also Search For)와 같은 중요한 SERP 기능에 항상 관심이 있었기 때문에 파고들어야 했습니다.

또한 이것은 내가 과거에 훌륭한 Bill Slawski에게 핑을 했을 것입니다. 안타깝게도 Bill은 더 이상 우리와 함께 있지 않습니다. 특허를 검토하면서 특허에 대한 Bill의 게시물과 그의 분석에 대한 질문을 그에게 DM으로 보낼 수 있는 것이 얼마나 그리운지 깨달았습니다. Bill을 잃는 것은 확실히 우리 업계에 막대한 손실이었습니다. 어쨌든 빌이 늘 하던 방식대로 파헤칠 수 없게 되자 나는 내 자신을 파헤치기로 했다. 그리고 그렇게 해서 기쁩니다. 매우 흥미로 웠습니다.

SERP 기능을 위해 신경망을 사용하는 생성 모델 활용
아래에서는 특허가 "People Also Search For", "People Also Ask" 등과 같은 SERP 기능에 대한 쿼리 변형을 생성하기 위해 훈련된 생성 모델을 사용하는 방법을 설명합니다. 특허에는 "People Also Search For"가 언급되어 있지만 이 프로세스가 PAA에도 사용될 수 있다고 믿는 것은 무리가 아닙니다. 아래 분석에서 그 내용을 다룹니다.

(적어도 특허를 기반으로) Google이 이 분야에서 무엇을 하고 있는지 자세히 알 수 있어 흥미로웠습니다. 다른 특허와 마찬가지로 Google이 이를 아직 구현했는지, 구현할지 여부는 알 수 없지만 내가 읽은 내용을 기반으로 확실히 이해가 되었습니다.

또한 이 특허는 Google이 새로운 쿼리(완전히 새로운) 및 아직 사용 가능한 데이터가 많지 않은 롱테일 쿼리에 대한 쿼리 변형을 생성할 수 있는 방법을 설명하는 흥미로운 점을 발견했습니다. 그리고 모든 검색어의 15%는 이전에 Google에서 본 적이 없으므로 검색어 변형 생성과 같은 접근 방식을 사용하는 것이 좋습니다. 이에 대해 곧 자세히 다루겠습니다.

특허의 요점:
특허를 커버하는 가장 좋은 방법은 몇 가지 하이라이트를 표시하는 것입니다. 아래에서 특허의 몇 가지 핵심 사항을 다룰 것입니다.

학습된 생성 모델을 사용하여 쿼리 변형 생성
미국 11663201 B2
부여일자: 2023년 5월 30일
제출일: 2018년 4월 27일
양수인 이름: Google LLC

생성 모델을 사용하여 PASF 및 PAA에 대한 쿼리 변형을 생성하는 방법에 대한 Google 특허의 다이어그램

1. 원본 쿼리 및 추가 입력 기능의 토큰을 기반으로 훈련된 생성 모델을 활용하여 런타임에 쿼리 변형을 생성할 수 있습니다. 추가 입력 기능에 대한 자세한 내용은 곧 다루겠습니다.

2. 모델이 해당 쿼리에 대해 훈련되지 않은 경우에도 시스템에서 쿼리 변형을 생성할 수 있습니다. 따라서 새로운 쿼리(완전히 새로운) 또는 아직 데이터가 많지 않은 Google에서 "꼬리" 쿼리라고 부르는 변형을 생성할 수 있습니다. 특히 Google에서 검색어의 15%가 이전에 본 적이 없다고 말했기 때문에 매우 흥미로웠습니다. 따라서 생성 모델은 신경망(메모리 레이어 포함)을 사용하여 낮은 임계값 쿼리에 대해서도 생성할 쿼리 변형을 예측할 수 있습니다.

참신한 쿼리와 롱테일 쿼리를 위해 작동하는 Google의 생성 모델입니다.

3. 생성 모델은 사용자가 제출한 이전 쿼리를 기반으로 훈련할 수 있습니다. 그러나 특허는 또한 쿼리 변형 학습 데이터가 동일한 문서를 클릭하는 쿼리 쌍을 기반으로 할 수도 있다고 설명합니다. 그것은 의미가 있으며 사용자 참여가 모델에 의해 생성되는 요소에서 어떤 역할을 할 수 있는지 보여줍니다.

동일한 문서를 클릭하는 쿼리 쌍에 대해 훈련된 Google의 생성 모델입니다.

4. 특허는 또한 모델이 여러 유형 의 쿼리 변형 생성을 가능하게 하는 멀티태스킹 모델 로 훈련될 수 있다고 설명합니다. 따라서 후속 쿼리, 일반화 쿼리, 정규화 쿼리, 언어 번역 쿼리, 함의 쿼리 등 다양한 유형의 쿼리 변형을 생성할 수 있는 정교한 시스템입니다.

Google의 생성 모델은 여러 유형의 쿼리 변형을 생성하는 멀티태스킹 모델로 훈련될 수 있습니다.

5. 쿼리 변형이 생성되면 모델에서 점수를 매깁니다. 시스템은 각 변형에 대한 응답 점수를 제공합니다. 그리고 시스템은 해당 쿼리 변형에 대한 답변을 확인하여 해당 변형을 평가할 수 있습니다. 이는 시스템이 "잠재적으로 가짜" 쿼리 변형을 감지하는 데 도움이 될 수 있습니다. 매우 흥미로운…

품질을 결정하기 위한 Google의 생성 모델 점수 쿼리 변형입니다.

6. 특허는 계속해서 시스템이 쿼리 변형 외에도 답변을 반환할 수 있다고 설명합니다. 예를 들어 시스템은 검색 결과(PAA 누구?), 지식 그래프 엔터티, null 응답(응답 없음) 또는 설명을 위한 프롬프트(명확한 사용자 인터페이스 입력 포함)를 반환할 수 있습니다. 이는 사용자가 찾고 있는 것을 이해하려고 할 때 Google이 사용자의 도움을 찾을 때 표시되는 명확성 칩의 형태일 수 있습니다. 다시 한 번 흥미 롭습니다.

Google의 특허는 시스템이 쿼리 변형 외에도 답변을 반환할 수 있다고 설명합니다.

7. 특허는 계속해서 모델이 "추가 입력 기능"을 포함하여 쿼리에서 토큰 이상을 가져올 수 있다고 설명합니다. 이러한 입력 기능에는 위치, 사용자가 관심이 있거나 수행하는 작업(예: 요리, 자동차 수리, 여행 계획 등)이 포함될 수 있습니다. 또한 날씨 등을 고려할 수 있습니다. 작업은 사용자의 저장된 일정 항목, 채팅 메시지 또는 기타 통신, 사용자가 제출한 과거 쿼리 등을 기반으로 할 수 있습니다. 따라서 쿼리 변형은 개인화 또는 현재 컨텍스트를 기반으로 할 수 있습니다.

Google의 특허는 모델이 "추가 입력 기능"을 포함하여 쿼리에서 단순한 토큰 이상을 취할 수 있다고 설명합니다.

8. 이 모델은 쿼리 및 광고 또는 기타 콘텐츠 의 변형을 생성할 수도 있습니다. 따라서 모델은 쿼리 변형을 생성할 수 있을 뿐만 아니라 SERP에 표시될 수 있는 광고 또는 기타 콘텐츠를 생성(또는 검색)할 수 있습니다. 그 부분을 다시 짚고 넘어가야 할 것 같은데, 재미있었어요... :)

Google의 생성 모델은 쿼리 및 광고 또는 기타 콘텐츠의 변형을 생성할 수 있습니다.

9. 특허는 또한 다른 속성 또는 작업을 기반으로 하는 많은 생성 모델이 있을 수 있다고 설명합니다. 따라서 쇼핑, 장소 이동 등과 같은 다양한 작업을 위한 특정 모델이 있을 수 있습니다.

Google의 특허는 다양한 속성 또는 작업을 기반으로 여러 생성 모델이 있을 수 있다고 설명합니다.

요약: PASF 및 PAA에 대한 변형을 생성하는 것은 일부 사람들이 생각하는 것보다 더 복잡하고 미묘할 수 있습니다.
이 특허를 분석하면 Google이 학습된 생성 모델을 사용하여 다양한 SERP 기능에 표시될 수 있는 쿼리 변형 또는 기타 콘텐츠를 생성하는 방법을 이해하는 데 도움이 되었기를 바랍니다. 이는 아직 데이터가 많지 않은 신규 쿼리(신규) 및 롱테일 쿼리에서 발생할 수 있습니다. 또한 특정 분야에 초점을 맞춘 여러 모델이 사용될 수 있습니다. 또한 결과는 개인화될 수도 있습니다(추가 입력 기능을 기반으로 함).

따라서 다음에 SERP에서 "People Also Search For" 또는 "People Also Ask"를 볼 때 이러한 쿼리 변형을 제공하기 위해 생성 모델이 사용되었을 수 있음을 알 수 있습니다. 그리고 개인화된 경우 이러한 쿼리는 귀하의 사례에 따라 다를 수 있습니다. 다시 말하지만 Google 시스템은 일부 사람들이 생각하는 것보다 훨씬 더 정교합니다.

GG