如何為 Google Search Console 和 SEO 構建動態 XML 站點地圖
已發表: 2017-03-24在這一點上,“XML 站點地圖”是許多營銷人員甚至對 SEO 有一般了解的小企業主至少都知道的東西。 但是,當我登錄到客戶端 Google Search Console 帳戶時,仍然很常見地看到沒有提交 XML 站點地圖,或者有許多錯誤和/或未提交的頁面。 在這篇文章中,我們將介紹一些生成站點地圖並將其提交到 Google Search Console 的技巧,該站點地圖將隨您的站點一起擴展。
什麼是 XML 站點地圖?
對於那些不熟悉的人來說,首先要了解的是:站點地圖基本上是您網站所有 URL 的列表。 通過 Google Search Console(以前的 Google 網站管理員工具)向 Google 提交 XML 站點地圖有助於搜索引擎發現您網站的所有內容並為其編制索引。 因此,此步驟對您的 SEO 工作產生積極影響,因為 Google 索引中的內容越多,您進入更多搜索垂直領域的機會就越多,從而出現在更多搜索查詢中。
XML 站點地圖還可以幫助您了解您要診斷的站點上潛在的 SEO 問題。
為了幫助您製作 Google 站點地圖,我們創建了一套詳細的說明,介紹如何製作動態 XML 站點地圖以增加您網站內容的索引。 在站點地圖說明的末尾,如果您需要 XML 站點地圖生成器或站點地圖生成器並且對如何將站點地圖提交給 Google 有疑問,我們提供了一些有用的資源。
關於如何構建動態 XML 站點地圖的說明
- 使用您網站的完整網址作為“起始網址”選項。 爬蟲只探索起始目錄中的 URL,即當起始 URL 是“http://www.example.com/path/index.html”時,“http://www.example.com/path/sub/ page.html”將被編入索引,但“http://www.example.com/other/index.html”將不會。
- “將站點地圖保存到”——是您網站“public_html/”文件夾中的文件名。 該文件應該可由腳本寫入。 為確保它是,請創建此文件並將其權限設置為 0666。
- 建議在“上次修改”字段中使用“服務器的響應”。 在這種情況下,靜態頁面的條目將填充它們真正的最後修改時間,而動態頁面則使用當前時間。
- “不解析”輸入字段包含文件類型,以空格分隔。 這些文件將添加到站點地圖,但不會獲取以節省帶寬,因為它們不是 html 文件並且沒有嵌入鏈接。 請確保這些文件已被 Google 索引,否則將它們添加到站點地圖是沒有意義的!
- “不解析 URL”與上面的選項一起使用可以提高站點地圖生成的速度。 如果您確定您網站上的某些頁面不包含指向其他頁面的唯一鏈接,您可以告訴生成器不要獲取它們。
例如,如果您的網站有“查看文章”頁面,其 URL 類似於“viewarticle.php?..”,您可能希望將它們添加到此處,因為很可能這些頁面內的所有鏈接都已列在“更高級別”(例如文章列表)文件以及:- viewarticle.php?id=
如果您不確定在這裡寫什麼,請將此字段留空。 請注意,這些頁面仍包含在站點地圖中。
- “排除擴展名”——這些文件不會被抓取,也不會包含在站點地圖中。
- 要禁止您的網站部分包含在站點地圖中,請使用“排除 URL”設置:將跳過所有包含指定字符串的 URL。
例如,要排除“www.domain.com/folder/”中的所有頁面,請添加以下行:
- 文件夾/如果您的站點包含可以按列重新排序的列表的頁面,並且 URL 看起來像“list.php?sort=column2”,請添加此行以排除重複內容:
–排序=無論如何,您可以將此框留空以列出所有頁面。
- “僅包含 URL”設置與“排除 URL”相反。 當它不為空時,只有與輸入的子字符串匹配的 url 才會包含在站點地圖中。
- “個別屬性”設置允許您為每頁的最後修改時間、頻率和優先級設置特定值。 要使用它,請按以下格式定義特定的頻率和優先級屬性:“url substring,lastupdate YYYY-mm-dd,frequency,priority”。
示例:page.php?product=,2005-11-14, monthly,0.9
- 您可能希望限制要索引的頁面數量,以確保如果您的網站出現無限循環鏈接等錯誤,索引不會無休止。
- 要限制腳本的最長運行時間,請定義“最長執行時間”字段(以秒為單位)。
- 要有可能使用“恢復會話”功能,請定義“保存腳本狀態”字段。 該值表示保存爬蟲進程狀態的時間間隔,因此如果腳本被中斷,您可以從上次保存的點繼續該過程。 將此值設置為“0”以禁用節省。
- 為了減少站點地圖生成器對您的服務器造成的負載,您可以在每次向您的站點發出 N(已配置)請求後添加“睡眠”延遲 X 秒(已配置)。 保留空白(“0”)值以立即抓取網站。
- Google 不支持頁面超過 50,000 的站點地圖文件。 這就是腳本支持為大型站點創建“站點地圖索引”的原因。 因此,它將創建一個站點地圖索引文件和多個站點地圖文件,每個文件有 50,000 頁。
例如,您的網站有大約 140,000 個頁面。 XML 站點地圖生成器將創建這些文件:
- “sitemap.xml”——包含指向其他文件的鏈接的站點地圖索引文件(文件名取決於您在“將站點地圖保存到”字段中輸入的內容)
- “sitemap1.xml”——站點地圖文件(URLs 從 1 到 50,000)
- “sitemap2.xml”——站點地圖文件(URL 從 50,001 到 100,000)
- “sitemap3.xml”——站點地圖文件(URL 從 100,001 到 140,000)
如果您的網站很大,請確保所有這些文件都是可寫的。
- 啟用“創建 HTML 站點地圖”選項,讓生成器為您的訪問者創建站點地圖。 您還應該定義存儲站點地圖的“HTML 站點地圖文件名”。 通過定義“HTML 站點地圖中每頁的鏈接數”選項,可以將 html 站點地圖拆分為多個文件。
文件名如下所示:
- “sitemap.html”——以防所有鏈接都放在一個文件中
或者 - “sitemap1.html”——站點地圖文件,第 1 頁
- “sitemap2.html”——站點地圖文件,第 2 頁
- ETC
同上一點:請確保所有這些文件都是可寫的。 可以在pages/mods/sitemap_tpl.html文件中修改站點地圖頁面佈局以適合您的網站。
除了修改 html 站點地圖的樣式表外,您還可以更改其格式化方式。 基本的模板命令是:
- <TLOOP XX>…</TLOOP> – 定義重複的代碼序列(如頁碼或站點地圖鏈接)
- <TIF XX>…</TIF> – 定義僅在滿足特定條件時插入的條件語句
- <TVAR XX> – 插入指定變量的值
使用示例請參考 sitemap_tpl.html 文件。
- “sitemap.html”——以防所有鏈接都放在一個文件中
- 啟用站點地圖文件的 GZip 壓縮以節省磁盤空間和帶寬。 在這種情況下,“.gz”將被添加到站點地圖文件名中(如“sitemap.xml.gz”)。
- “站點地圖 URL”與在“將站點地圖保存到”字段中輸入的文件相同,但採用 URL 形式。 需要將站點地圖地址告知谷歌。
- 啟用“Ping Google”複選框,讓腳本在每次站點地圖更改時通知 Google。 通過這種方式,您將始終讓谷歌了解您網站上的最新信息。
- 如果您想限制對生成器頁面的訪問,請在此處設置登錄名和密碼。
XML 站點地圖生成器資源
以下是為 Google 製作 XML 站點地圖的一些重要資源,包括一個有用的文章庫,可幫助您進一步了解什麼是 XML 站點地圖,提供站點地圖示例以及如何解決提交站點地圖時可能出現的潛在問題出於 SEO 目的向 Google 提供。 此外,還有一個免費站點地圖工具和創建者列表。
站點地圖 學習圖書館
- 所有關於站點地圖
- 創建站點地圖
- 管理站點地圖
- 為多個網站創建站點地圖
- 圖片站點地圖
- 視頻站點地圖
免費站點地圖生成器工具
- 製作 Google 站點地圖的免費工具