创建和提交XML站点地图Hartă site:基础和最佳实践

Publicat: 2023-03-22
创建和提交XML站点地图

Navigare rapidă

  • 一、如何创建站点地图
    • 方法 1:使用插件创建站点地图
    • 方法 2:使用Sitemap生成器自动创建站点地图
    • 方法 3:手动创建站点地图
  • 二、站点地图最佳实践与做法
    • 1. 使用标准的XML格式
    • 2. 确保您的XML站点地图保持最新
    • 3. 遵循URL数量和文件大小的限制
    • 4. 按内容类型分割站点地图
    • 5. 设置合适的更新频率和优先级
    • 6. 避免包含无关或重复的URL
    • 7. 考虑只将高质量页面放在站点地图中
    • 8. 注意多语言网站的XML文件写法
    • 9. 将站点地图添加到 robots.txt 文件
    • 10. 使用绝对URL
    • 11. 站点地图文件编码
    • 12. 站点地图文件位置
  • 三、将您的站点地图提交给谷歌/Bing/Yandex/Yahoo
    • 1. 将Sitemap提交给Google
    • (1)通过 Google Search Console 提交 XML 站点地图
    • (2)使用 robots.txt 文件提交 XML 站点地图
    • (3)发送 HTTP GET 请求以“ping”谷歌
    • 2. 将Sitemap提交给Bing
    • 3. 将Sitemap提交给Yandex
  • 结语

一、如何创建站点地图

您可以手动创建站点地图或使用自动生成站点地图的工具 —— 这取决于您的的网站类型。在详细了解创建网站地图的不同方法之前,您可能需要进行一个重要步骤——理清您的网站内容与结构。

方法 1:使用插件创建站点地图

如果您的网站使用 WordPress、Wix、Squarespace或任何其他CMS,您将可以使用插件创建站点地图。例如,对于 WordPress,您可以使用流行的Yoast SEO 插件来创建站点地图。而对于 Wix 和 Squarespace,您也无需担心。他们会自动创建和更新您的网站站点地图。

方法 2:使用Sitemap生成器自动创建站点地图

如果您的网站不是CMS系统搭建的,您也可以使用一些Sitemap生成器帮助您自动创建网站的站点地图。在之前的文章中,我介绍了10款超赞的Sitemap网站地图生成器。您可以前去挑选适合您的一款。

在这里,我选取Screaming Frog进行举例说明如何用Sitemap生成器创建站点地图。以下,我将向您介绍如何使用Screaming Frog SEO Spider 生成 XML 站点地图。

第 1 步 – 使用Screaming Frog抓取您的网站

在 工具 栏 中 输入 您 网站 的 域名 地址 , 然后 按 „开始”。 根据 您 网站 的 大小 , 这 可能 需要 一些 时间 , 因为 每 个 页面 都 需要 被 发现 和 抓取 抓取。 因为 每 个 页面 都 需要 被 发现 和 和 抓取。 因为 每 每 个 页面 都 需要 被 发现 和 和 抓取。

第 2 步 – 删除任何不需要的 URL

抓取完成后,查看完整的 URL 列表并查找您不想包含在站点地图中的任何内容。如果您有要排除的 URL,请右键单击这些 URL 并选择“删除”。如果您按住 Shift 或 Ctrl按钮(在 Windows 上),您可以选择多个URL进行批量删除。

第 3 步 – 打开站点地图菜单

打开 工具 栏 上 的 站点 地图 菜单 并 选择 选择 „Xml 站点 地图”。 您 将 打开 一 个 包含 多 个 选项 的 菜单。 默认 选项 是 在 站点 地图 中 仅 包含 包含 为 200 的 url , 但 您 可以 选择 包含 带有 带有 noindx标签的页面、分页页面或带有 301 重定向的页面。

其他子菜单 — Ultima modificare、Prioritate、Frecvența modificării、Imagini、Hreflang — 让您可以选择编辑 <changefreq>、<priority> 和 <lastmod> 滠炨瀭炫滇滖炫瀉择编辑

第 4 步 – 保存站点地图

完成编辑后,单击“下一步”按钮,将打开“保存”菜单。默认文件类型为XML。

第 5 步 – 上传您的站点地图

现在您有了新的站点地图,您需要将其上传到您的网站。

由于 每 个 网站 的 cms 都 会 有所 不同 , 我 无法 就 执行 此 操作 的 最佳 方式 提供 建议。 如 有 需要 , 您 可以 咨询 您 网站 的 开发 人员。。

方法 3:手动创建站点地图

在部分情况下,您不得不手动创建站点地图。

要 从 头 开始 手动 构建 站点 地图 , 您 需要 具备 一定 程度 的 技术 知识 , 这 是 所有 列出 的 创建 站点 地图 的 方法 中 难度 最 高 的 的 以上 ; 可能 是 前面 2 种 的 方法 的 的 的 的 以上 ; 如果 您 您 的网站 是 个 大型 网站 , 增加 的 难度 更 有 可能 达到 ​​百 倍 以上。 作为 回报 , 您 将 获得 对 站点 地图 的 完全 可 定制性 及 可控性 , 使 其 成为 所有 方法 中 最 具 扩展性 的。 , 使 其 成为 所有 方法 中 中 最 扩展性 的 的。 使 其 成为 所有 所有 方法 中 最 具 扩展性 的。 , 使 其 成为 所有 方法 中 中 最 扩展性 的 的。 ”

现在,我们来看看手动创建站点地图的基本步骤。

第1步:打开文本编辑器

如记事本(Notepad)或其他任何支持纯文本编辑的软件。

第2步:编写XML标签

在文本编辑器中,开始编写XML站点地图的基本结构。首先,添加XML版本伌恦版本伌恤版本伌本结构基本结构

第3步:添加站点地图协议

接下来,添加站点地图协议,用以告诉搜索引擎这是一个站点地图文件地图文件。文件。

第4步:添加URL信息

在 <Urlset> 标签 内部 , 添加 网站 上 每 每 个 页面 的 url 信息。 对于 每 个 页面 , 都 需要 使用 <url> 标签 , 并 在 其中 添加 相应 的 的 <loc> 、 <stmod> 、 <Cangefreq> 和 <Prioritate >标签。例如:

第5步:保存文件:

完成上述步骤后,将文件保存为.xml格式,例如:sitemap.xml。

第6步:验证您的站点地图

完成创建 sitemap.xml 文件后,您应该对其进行验证以确保代码中没有错误。

您可以使用使用Google Search Console或Bing Webmaster Tools验证您的Sitemap是否存在错误。您还可以在线站点地图验证工具。例如,XML Sitemaps Validator是流行的站点地图验证工具。只需输入您的站点地图URL或上传站点地图文件,这些工具将检查其格式并报告任何错误或警告。

第7步:上传站点地图

将生成的站点地图文件上传到网站的根目录下,确保搜索引擎可以访问。

一般情况下,我们会将站点地图放在网站的根目录下(即http://www.example.com/sitemap.xml)。文件位置很重要,因为提交的 URL 必须以与站点地图相同的路径http://example.com/catalog/sitemap.xml com/images 开头的网址。又或者如果站点地图位于 http://www.example.com/sitemap.xml,则它不能包如果站点地图位于 http://www.example.com/sitemap.xml,则它不能包它不能包含来自 http://subdomain.ex.

二、站点地图最佳实践与做法

使用XML站点地图的最佳实践可以确保搜索引擎更好地抓取和索引您的索引您的索引您的索引您的索引您的索引您的索引您的网瘫以的网绥以确保搜索引擎更好地抓取和索

1. 使用标准的XML格式

遵循W3C的XML标准,确保站点地图的格式正确。这样搜索引擎才能正确觙炞【确觙枹确觙枹。

2. 确保您的XML站点地图保持最新

确保您的XML站点地图提供您网站的最新内容。每当删除一个页面时,它也应该从您的XML站点地图中删除。对于经常更新的内容,确保站点地图及时更新。如果您使用可选的lastmod标签,请确保在页面更改时更新时间戳。

Sitemap

要让XML站点地图自动更新,您可以选择以下方法之一:

(1)使用内容管理系统(CMS)的插件或扩展:许多内容管理系统(如WordPress、Drupal、Joomla等)提供自动生成并更新站点地图的插件或扩展。安装并配置这些插件后,您的站点地图将随着网站内容的更改而自动更新。

例如,在WordPress中,您可以安装“Yoast SEO”等插件来自动生成并更新站点地图。

(2)使用自定义脚本:如果您没有使用CMS,可以编写自定义脚本(如Python、PHP等)来自动生成站点地图。这些脚本可根据您的网站内容自动创建站点地图,并在内容发生变化时 自动 更新 站点 地图。 将 此 脚本 设置 为 为 定时 任务 (如 使用 Linux 的 CRON WOB 或 Windows 的 任务 计划 程序) , 以便 定期 运行 并 更新 站点 地图 地图。。。。。。。。。。。。

(3)使用第三方站点地图生成工具:有些在线服务或软件可以帮助您自动生成并更新站点地图。这些工具会定期抓取您的网站,并根据检测到的更改自动更新站点地图。例如,Screaming Frog SEO Spider和XML-Sitemaps.com等工具可以自动生成站点地图。尽管如此,自动更新功能可以能可蘴成站点地图。尽管如此,自动更新工具可以自动生成站点地图。尽管如此,自动更新工具可以自动生成站点地图。

3. 遵循URL数量和文件大小的限制

单个站点地图文件中的URL数量不得超过50,000个,文件大小不得超过50MB(未压缩)。如果超出这些限制,请将站点地图拆分成多个文件并使用站点地图索引文件进行管理。

现在我们来解释一下什么是站点地图索引文件。

让我们看一个例子:

在 这个 站点 地图 索引 文件 中 , 我们 有 三 个 站点 地图 文件 (sitemap1.xml 、 sitemap2.xml 和 sitemap3.xml)。 站点 地图 索引 文件 包括 以下 元素 :

  • <sitemap> :此标签将索引文件中的每个站点地图条目包裹起来。
  • <loc> :站点地图文件的URL。请用您实际的站点地图文件URL替换此URL。
  • <lastmod> :站点地图文件的最后修改日期和时间,采用W3C DateTime格式(YYYY-MM-DDThh:mm:ss+timezone)。请将其替换为您站点地图文件的实际最后修改日期和时间。

让我们来剖析一下这个文件与普通的XML sitemap有什么不同。

(1)XML 标头

<?xml version="1.0″ encoding="UTF-8″?>

这里没有什么新东西,就像我们之前定义文件是XML格式以及使用哪种及使用哪种及使用哪种字码我们之前定义文件是 XML

(2)站点地图索引的定义

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9″>

现在,我们看到的不是urlset定义,而是sitemapindex定义。此定义封装了站点地图索引中包含的所有站点地图,并再次说明了使用哪个版本的 XML 站点地图标准。

(3)单个站点地图

<sitemap>

<loc>https://www.example.com/sitemap1.xml</loc>

<lastmod>2023-03-20T18:00:00+00:00</lastmod>

</sitemap>

就像 URL 一样,每个站点地图定义都需要至少包含 <loc>标签,其中包含单个 XML 站点地图的完整 URL。最重要的是,站点地图定义也可以选择包含 <lastmod>标签。

4. 按内容类型分割站点地图

如果您的网站内容较多,即便不超过5万个URL,您也可以考虑将站点地图按内容类型(如文章、产品、分类等)进行拆分。然后,可以使用站点地图索引文件将各个站点地图链接起来。

5. 设置合适的更新频率和优先级

为 每 个 url 设置 合适 的 更新 频率 ((<CHANCEFREQ> 标签) 和 优先级 (<Prioritate> 标签)。 这 有助于 搜索 引擎 更 好 地 理解 网站 内容 的 重要性 和 更新 更新 频率。。 好 地 理解 网站 内容 的 重要性 和 更新 更新 频率。。。 地 地 理解 网站 内容 的 重要性 和 更新 更新 频率。。。 地 理解 理解 网站 内容 的 重要性 和 更新 更新 频率。。。

但是,您又不需要太担心优先级的设置。

一些站点地图有一个“优先级”列,表面上告诉搜索引擎哪些页面最重要。然而,这个功能是否真的有效一直存在争议。早在 2017 年,Google 的 Gary Illyes就回复推文称Googlebot 在抓取时会忽略优先级设置。

6. 避免包含无关或重复的URL

确保 站点 地图 中 只 包含 有 价值 、 不 重复 的 url。 避免 包含 重复 或 无关 内容 的 url , 因为 这 可能 会 导致 搜索 引擎 对 您 网站 的 评价 降低。。。。。

当 您 有 多 个 非常 相似 的 页面 时 , 例如同 一 产品 的 不同 颜色 的 产品 页面 页面 , 应该 使用 使用 „Link Rel = canonic” 标签 来 告诉 告诉 Google 哪 个 页面 是 它 应该 抓取 和 索引 的 的 的 的 的 主 哪 个 页面 是 它 应该 应该 抓取 和 索引 的 的 的 的 的 主 哪 个 页面 是 它 应该 应该 抓取 和 索引 的 的 的 的 的 主 哪 个 页面 页面 它 它 应该 抓取 和 索引 的 的 „主” 页面。 页面 是 它 应该 应该 抓取 和 索引 的 的 的 的 的 主 哪 个 页面 页面 是 它 应该 应该 抓取 和 索引 的 的 的 的 的 主 个 页面 页面 页面 它 它 应该 抓取 和 索引 的 ”

此外,永远不要列出您的 NoIndex 网址。站点地图用于告诉 Google 抓取和索引取和索引哪些 URL URL

7. 考虑只将高质量页面放在站点地图中

在排名方面,整体网站质量是一个关键因素。

如果 您 的 站点 地图 将 抓取 工具 引导 至 非常 多 低 质量 的 页面 , 搜索 引擎 会 将 这些 页面 解释 为 您 的 网站 的 大部分 内容 都 是 低 质量 的。 因此 , 您 可以 考虑 只 只 高 高 质量 的。。 因此 , 您 可以 考虑 只 只 高 高 质量 的。。 因此 , 您 可以 考虑 只 只 高 高 质量 的。。 因此 , 您 可以 考虑 只 只 高 高 质量 的 ”放在站点地图中。

8. 注意多语言网站的XML文件写法

对于 多 语言 网站 , 您 可以 使用 <xhtml: link> 标签 在 xml 站点 地图 中 指定 不同 语言 版本 的 url。 以下 是 一 个 多 语言 网站 的 xml 站点 地图 示例 :

在 这 个 示例 中 , 我们 为 同 一 个 页面 提供 了 三 种 语言 版本 : 英文 (() 、 中文 (zh) 和 西班牙文 (()。 请 注意 以下 几 点 点 :

  • 确保在<urlset>标签中添加xmlns:xhtml=”http://www.w3.org/1999/xhtml”属性,以便使用<xhtml:link>标签。
  • 使用<xhtml:link>标签为每个语言版本的URL添加rel=”alternate”和hreflang属性。hreflang属性的值应为个语言版本的URL添加rel=”alternate”和hreflang属性。hreflang属性的值应为的值应为仸应为仠1919 1989
  • 为每种语言版本的URL创建一个<url>条目,并在其中包含所有其他语言版本:的><xhtml:的>む本的

您可以根据您自己的多语言网站的实际情况修改上述示例。

9. 将站点地图添加到 robots.txt 文件

robots.txt文件是爬虫访问网站时首先访问的地方。通过向其中添加站点地添加站点地加站点地寙时首先访问的地方。通过向其中添加站点地加站点地加站点地地中瀚地图瀚点地图绌朰方的地方

10. 使用绝对URL

在站点地图中,确保所有URL为绝对URL(包括协议和域名)。这样搜索引样搜索引有为绝对为绝对乺URL

11. 站点地图文件编码

站点 地图 文件 必须 采用 utf-8 编码。 所有 站点 地图 文件 只 能 包含 ascii 字符 —— 即 数字 0-9 、 英文 字母 az 和 一些 特殊 字符。 像 符号 、 引号 或 大于/小于 需要 用 转义码 替换 的 的 符号 、 引号 或 大于/小于 需要 用 转义码 替换 替换 的 的 、 引号 或 大于 大于/小于 需要 用 转义码 替换 替换 的字符:

12. 站点地图文件位置

您 可以 将 站点 地图 托管 在 网站 的 任何 位置 , 但是 站点 地图 只 影响 父级 目录 中 的 下级 目录。 因此 , 如果 站点 地图 发布 在 网站 的 根 目录 下 , 则 可以 影响 网站 上 的 所有 文件 , 所以 我 我 建议 可以 影响 网站 上 的 所有 文件 , 所以 我 我 建议 可以 影响 网站 上 的 的 文件 , 所以 所以 我 建议 则 可以 影响 上 上 的 所有 文件 , 所以 我 我 建议将站点地图发布在此目录下。

三、将您的站点地图提交给谷歌/Bing/Yandex/Yahoo

创建并上传站点地图后需要执行的最后一步是将其提交给搜索引擎,以便它们可以开始抓取其中列出的 URL。在这里,我将分别介绍如何将站点地图提交给Google、Bing、以及Yandex 。

1. 将Sitemap提交给Google

如果您想将 XML 站点地图提交给 Google,您可以通过3 种不同的方式进行。

(1)通过 Google Search Console 提交 XML 站点地图

针对Google, Google Search Console 是您提交网站站点地图的地方。请按照以下步骤向Google提交您的竰图的竰方:

1)登录 Google Search Console,然后找到屏幕左侧 „索引”部分下的“站点地图”。

2)进入页面后,输入您的站点地图URL,然后单击“提交”。

就是这么简单。现在Google将验证您的站点地图。如果格式正确,它将更新为“更新为“新为“新为

通过 Google Search Console 提交 XML 站点地图

(2)使用 robots.txt 文件提交 XML 站点地图

Consola de căutare Google

Roboți Shein.txt

(3)发送 HTTP GET 请求以“ping”谷歌

最后一个选项是“ping”谷歌并要求他们的抓取工具抓取您的网站。这是通这是通迌搚是通迌叱HTTP

https://www.google.com/ping?sitemap=https://yourwebsite.com/sitemaplocation.xml

2. 将Sitemap提交给Bing

与 Google 类似 , 您 可以 通过 bing 的 网站 网站 管理员 工具 将 您 网站 的 站点 地图 提交 给 给 bing。 您 可以 按照 以下 步骤 提交 您 的 站点 : :

1)在Bing网站管理员工具上注册您的网站。

2)登录 Bing 网站管理员工具后,转到“我的网站”页面并单击您的网站。

3)在左侧边栏菜单,找到“站点地图”;点击“提交站点地图”,然后输入您网站站点地图的完整URL,点击“提交”。与在Google中一样,您可以在下面的列表中查看有关您提交的站点地图的详细信息。

将Sitemap提交给Bing

3. 将Sitemap提交给Yandex

Yandex 是 俄罗斯 的 主要 搜索 引擎 之一。 在 那里 提交 您 的 站点 地图 可能 会 帮助 您 获得 更 多 来自 俄罗斯 的 流量。 您 可以 按照 以下 步骤 将 您 的 站点 地图 提交 给 给 yandex :

1)创建一个帐户并在Yandex上注册您的网站。

2)登录到 Yandex 网站管理员工具并从主仪表板中选择您的网站。

3)使用屏幕左侧的菜单,导航至„Indexare”> 站点地图文件。

4)在相应的字段中输入指向您网站站点地图的完整URL,即www.mywebsite.com/sitemap.xml 。

单击添加按钮.

将Sitemap提交给Yandex

结语

精心设计的网站站点地图可帮助访问者和爬虫更有效地浏览网站,这可帮助访问者和爬虫更有效地浏览网站,这网站,这可帮助这对春玦丙对丮厀䁙对発灷

对于 创建 站点 地图 , 您 可以 使用 在线 生成器 创建 站点 地图 以 加快 该 过程。 但是 , 如果 您 想 对 其 进行 更 多 , 请 请 考虑 手动 编写 代码。。

完成后,您只需将站点地图提交给主要搜索引擎并将其添加到robots.txt文件中文件

我希望本篇文章能帮助您通过创建和提交站点地图加大网站的收录量!