Google Search Console と SEO 用の動的 XML サイトマップを作成する方法

公開: 2017-03-24
(最終更新日: 2021 年 3 月 26 日)

この時点で、「XML サイト マップ」は、多くのマーケティング担当者や、SEO について一般的な知識を持つ中小企業の経営者でさえ、少なくとも認識しているものです。 しかし、クライアントの Google Search Console アカウントにログインすると、XML サイトマップが送信されていなかったり、送信されていないエラーやページが多数表示されたりすることは依然としてよくあります。 この投稿では、サイトマップを生成して Google Search Console に送信し、サイトに合わせてスケーリングするためのヒントをいくつか紹介します。

XML サイトマップとは何ですか?

慣れていない人のために説明すると、サイトマップは基本的に、Web サイトのすべての URL のリストです。 Google Search Console (以前の Google Webmaster Tools) を介して XML サイトマップを Google に送信すると、検索エンジンが Web サイトのすべてのコンテンツを検出してインデックスに登録するのに役立ちます。 結果として、このステップは SEO の取り組みにプラスの効果をもたらします。なぜなら、Google のインデックス内のコンテンツが増えるほど、より多くの検索バーティカルに浸透し、より多くの検索クエリに表示される機会が増えるからです。

XML サイトマップは、診断しようとしているサイトの潜在的な SEO 問題を理解するのにも役立ちます。

Google サイト マップの作成を支援するために、動的 XML サイト マップを作成して Web サイトのコンテンツのインデックス登録を増やす方法に関する詳細な手順を作成しました。 サイト マップの手順の最後に、XML サイト マップ ジェネレーターまたはサイト マップ ビルダーが必要な場合や、Google にサイト マップを送信する方法について質問がある場合に役立つリソースがいくつか含まれています。

動的 XML サイト マップの作成方法に関する説明

  1. 「開始 URL」オプションには、サイトの完全な URL を使用します。 クローラは、開始ディレクトリ内の URL のみを探索します。つまり、開始 URL が「http://www.example.com/path/index.html」の場合、「http://www.example.com/path/sub/ page.html」索引付けされますが、「http://www.example.com/other/index.html」は索引付けされません
  2. 「サイトマップの保存先」 – Web サイトの「public_html/」フォルダー内のファイル名です。 このファイルは、スクリプトによって書き込み可能である必要があります。 それを確認するには、このファイルを作成し、その権限を 0666 に設定します。
  3. 「最終変更」フィールドには「サーバーの応答」を使用することをお勧めします。 この場合、静的ページのエントリには実際の最終更新時刻が入力され、動的ページのエントリには現在の時刻が使用されます。
  4. 「解析しない」入力フィールドには、スペースで区切られたファイル タイプが含まれます。 これらのファイルサイトマップに追加されますが、帯域幅を節約するためにフェッチされません。これらは html ファイルではなく、リンクが埋め込まれていないためです。 これらのファイルが Google によってインデックス化されていることを確認してください。そうしないとサイトマップに追加しても意味がありません。
  5. 「URL を解析しない」は、上記のオプションと連携して、サイトマップ生成の速度を上げます。 サイトの一部のページに他のページへの一意のリンクが含まれていないことが確実な場合は、ジェネレーターにそれらを取得しないように指示できます。
    たとえば、サイトに「viewarticle.php?..」のような URL を持つ「記事を表示」ページがある場合、これらのページ内のすべてのリンクはすでに「上位レベル」(記事のリスト) ドキュメントも:

    • viewarticle.php?id=

    ここに何を書けばよいかわからない場合は、このフィールドを空のままにしてください。 これらのページは引き続きサイトマップに含まれていることに注意してください。

  6. 「拡張子を除外」 - これらのファイルはクロールされず、サイトマップに含まれません。
  7. Web サイトの一部をサイトマップに含めないようにするには、[URL を除外] 設定を使用します。指定された文字列を含むすべての URL がスキップされます。
    たとえば、「www.domain.com/folder/」内のすべてのページを除外するには、次の行を追加します。
    – フォルダ/

    サイトに、列で並べ替えることができるリストを含むページがあり、URL が「list.php?sort=column2」のようになっている場合は、次の行を追加して重複するコンテンツを除外します。
    –並べ替え=

    とにかく、このボックスを空のままにしておくと、すべてのページが一覧表示されます。

  8. 「URL のみを含める」設定は、「URL を除外する」の反対です。 空でない場合、入力された部分文字列に一致する URL のみがサイトマップに含まれます。
  9. 「個別属性」設定では、ページごとの最終更新時刻、頻度、および優先度に特定の値を設定できます。 これを使用するには、特定の頻度と優先度の属性を次の形式で定義します: “url substring,lastupdate YYYY-mm-dd,frequency,priority” .

    例: page.php?product=,2005-11-14, month,0.9

  10. Web サイトに無制限のループ リンクなどのエラーが発生した場合に、ページ数が無限にならないように、インデックスに登録するページ数を制限することをお勧めします。
  11. スクリプトの最大実行時間を制限するには、[最大実行時間] フィールド (秒単位) を定義します。
  12. 「セッションの再開」機能を使用できるようにするには、「スクリプトの状態を保存する」フィールドを定義します。 この値は、クローラーのプロセス状態を保存する間隔を意味するため、スクリプトが中断された場合でも、最後に保存されたポイントからプロセスを続行できます。 節約を無効にするには、この値を「0」に設定します。
  13. サイトマップ ジェネレーターによるサーバーの負荷を軽減するために、サイトへの N 個の (構成済み) リクエストごとに X 秒間 (構成済み)、「スリープ」遅延を追加できます。 サイトを遅滞なくクロールするには、値を空白 (「0」) のままにします。
  14. Google は、50,000 ページを超えるサイトマップ ファイルをサポートしていません。 そのため、スクリプトは大規模サイトの「サイトマップ インデックス」の作成をサポートしています。 したがって、1 つのサイトマップ インデックス ファイルと、それぞれ 50,000 ページの複数のサイトマップ ファイルが作成されます。

    たとえば、Web サイトには約 140,000 ページあります。 XML サイトマップ ジェネレーターは、次のファイルを作成します。

    • 「sitemap.xml」 – 他のファイルへのリンクを含むサイトマップ インデックス ファイル (ファイル名は、「サイトマップの保存先」フィールドに入力した内容によって異なります)
    • 「sitemap1.xml」 – サイトマップ ファイル (1 ~ 50,000 の URL)
    • 「sitemap2.xml」 – サイトマップ ファイル (50,001 から 100,000 までの URL)
    • 「sitemap3.xml」 – サイトマップ ファイル (100,001 から 140,000 までの URL)

    Web サイトが大きい場合は、これらのファイルがすべて書き込み可能であることを確認してください。

  15. Create HTML Sitemap 」オプションを有効にして、ジェネレーターが訪問者用のサイトマップを作成できるようにします。 また、サイトマップが保存される「HTML サイトマップ ファイル名」も定義する必要があります。 「HTML サイトマップのページあたりのリンク数」オプションを定義することで、HTML サイトマップを複数のファイルに分割することができます。

    ファイル名は次のようなものです。

    • 「sitemap.html」 – すべてのリンクが 1 つのファイルに収まる場合
      また
    • 「sitemap1.html」 – サイト マップ ファイル、ページ 1
    • 「sitemap2.html」 – サイト マップ ファイル、ページ 2

    上記のポイントと同じです。これらのファイルがすべて書き込み可能であることを確認してください。 サイト マップ ページのレイアウトは、 pages/mods/sitemap_tpl.htmlファイルで Web サイトに合わせて変更できます。

    HTML サイトマップのスタイルシートを変更するだけでなく、フォーマット方法を変更することもできます。 基本的なテンプレート コマンドは次のとおりです。

    • <TLOOP XX>…</TLOOP> – コードの繰り返しシーケンスを定義します (ページ番号やサイトマップ リンクなど)
    • <TIF XX>…</TIF> – 特定の用語が満たされた場合にのみ挿入される条件ステートメントを定義します
    • <TVAR XX> – 指定された変数の値を挿入します

    使用例については、sitemap_tpl.html ファイルを参照してください。

  16. サイトマップ ファイルの GZip 圧縮を有効にして、ディスク容量と帯域幅を節約します。 この場合、「.gz」がサイトマップ ファイル名に追加されます (「sitemap.xml.gz」など)。
  17. 「サイトマップ URL」は、「サイトマップの保存先」フィールドに入力したファイルと同じですが、URL 形式になっています。 サイトマップのアドレスを Google に通知する必要があります。
  18. 「Ping Google」チェックボックスを有効にすると、サイトマップが変更されるたびにスクリプトが Google に通知します。 このようにして、サイトの最新情報を常に Google に知らせることができます。
  19. ジェネレータ ページへのアクセスを制限する場合は、ここでログインとパスワードを設定します。

XML サイトマップ ジェネレーターのリソース

以下は、Google 向けの XML サイト マップを作成するための優れたリソースです。XML サイト マップとは何かをさらに理解するのに役立つ記事のライブラリ、サイト マップの例、およびサイト マップを送信するときに発生する可能性のある問題の解決方法を示します。 SEO目的でGoogleに。 また、無料のサイト マップ ツールと作成者のリストもあります。

サイトマップ 学習図書館

  • サイトマップについて
  • サイト マップの作成
  • サイト マップの管理
  • 複数の Web サイトのサイト マップの作成
  • 画像サイトマップ
  • 動画サイトマップ

無料のサイトマップ生成ツール

  • Google サイトマップを作成するための無料ツール