创建 和 提交 XML 站点 地图 خريطة الموقع : 基础 和 最佳 实践

نشرت: 2023-03-22
创建 和 提交 XML 站点 地图

الإنتقال السريع

  • 一 、 如何 创建 站点 地图
    • 方法 1 : 使用 插件 创建 站点 地图
    • 方法 2 : 使用 خريطة الموقع 生成 器 自动 创建 站点 地图
    • 方法 3 : 手动 创建 站点 地图
  • 二 、 站点 地图 最佳 实践 与 做法
    • 1. 使用 标准 的 XML 格式
    • 2. 确保 您 的 XML 地图 保持 最新
    • 3. URL 数量 和 文件 大小 的 限制
    • 4. 按 内容 类型 分割 站点 地图
    • 5. 设置 合适 的 更新 频率 和 优先 级
    • 6. 避免 包含 无关 或 重复 的 URL
    • 7. 考虑 只 将 高质量 页面 放在 站点 地图 中
    • 8. 注意 多 语言 网站 的 XML 文件 写法
    • 9. ملف robots.txt 将 站点 地图 添加
    • 10. 使用 绝对 URL
    • 11. 站点 地图 文件 编码
    • 12. 站点 地图 文件 位置
  • 三 、 将 您 的 站点 地图 提交 给 谷 歌 / بنج / ياندكس / ياهو
    • 1. 将 خريطة الموقع 提交 给 جوجل
    • (1) 通过 جوجل Search Console 提交 XML 地图
    • (2) 使用 ملف robots.txt 文件 提交 XML 站点 地图
    • (3) 发送 HTTP GET “ping” 谷 歌
    • 2. "خريطة الموقع" ، "بنج"
    • 3. 将 خريطة الموقع 提交 给 ياندكس
  • 结语

一 、 如何 创建 站点 地图

您 可以 手动 创建 站点 地图 或 使用 生成 站点 地图 的 工具 取决于 您 的 的 网站 类型 在 详细 了解 创建 网站 地图 不同 方法 之前 , 您 可能 一个 重要 步骤 您 的 网站内容 与 结构。

方法 1 : 使用 插件 创建 站点 地图

如果 您 的 网站 使用 WordPress 、 Wix 、 Squarespace 或 任何 其他 CMS , 您 将 可以 插件 创建 地图。 例如 , WordPress , 您 可以 使用 流行 Yoast SEO 插件 来 创建 站点。无需 担心。 他们 会 自动 创建 和 更新 您 的 网站 站点 地图。

方法 2 : 使用 خريطة الموقع 生成 器 自动 创建 站点 地图

如果 您 的 网站 不是 CMS 系统 搭建 的 , 您 也 可以 使用 一些 خريطة الموقع 生成 器 帮助 您 创建 的 站点 地图。 在 中 , 我 介绍 了 赞 的 خريطة الموقع 网站 地图 生成 器。去 挑选 适合 您 的 一款。

在 这里 , 我 选取 您 介绍 如何 XML 站点 地图。

第 1 步 - 使用 صراخ الضفدع 抓取 您 的 网站

在 工具 栏中 输入 您 网站 的 域名 地址 , 然后 按 您 网站 大小 , 这 可能 需要 一些 时间 , 因为 每个 页面 都 需要 被 发现 和 抓取。

第 2 步 - 删除 任何 不需要 的 URL

رابط الموقع URL按钮 (在 Windows 上) , 您 可以 选择 多个 URL 进行 批量 删除。

第 3 - 打开 站点 地图 菜单

打开 工具 栏 上 的 站点 地图 菜单 并 选择 “XML 站点 地图”。 您 将 打开 一个 包含 多个 选项 默认 默认 是 在 中 仅 包含 200 URL , 但 您 可以 选择 包含 带有 noindex标签 的 页面 、 分页 页面 或 带有 301 重定向 的 页面。

其他 子 菜单 - آخر تعديل 、 الأولوية 、 تغيير التردد 、 الصور 、 Hreflang - 让 您 可以 选择 编辑 <changefreq> 、 <الأولوية> 和 <lastmod> 标签 以 满足 您 网站 的 需要。

第 4 步 - 保存 站点 地图

完成 编辑 后 , 单击 “下一步” 按钮 , 将 打开 “保存” 菜单。 默认 文件 类型 XML。

第 5 - 上传 您 的 站点 地图

现在 您 有了 新 的 站点 地图 , 您 需要 将 其 上传 到 您 的 网站。

由于 每个 网站 的 CMS 都会 有所 不同 , 我 无法 就 执行 此 操作 的 最佳 方式 提供 建议。 如有 需要 , 您 可以 咨询 您 网站 的 开发 人员。

方法 3 : 手动 创建 站点 地图

在 部分 情况 下 , 您 不得不 手动 创建 站点 地图。

.网站 是 个 大型 网站 , 增加 的 难度 更有 可能 达到 ​​百倍 以上。 作为 回报 , 将 获得 对 地图 的 完全 可 定制 性 , 使其 成为 所有 方法 中 最具 扩展 性 的。

现在 , 我们 来 看看 手动 创建 站点 地图 的 基本 步骤。

第 1 步 : 打开 文本 编辑 器

如 记事 本 (المفكرة) 或 其他 任何 支持 纯 文本 编辑 的 软件。

第 2 步 : 编写 XML

在 文本 编辑 器 中 , 开始 XML 站点 地图 的 基本 结构。 首先 , 添加 XML 版本 信息 和 编码 方式 , 如下 所示 :

第 3 步 : 添加 站点 地图 协议

接下来 , 添加 站点 地图 协议 , 用以 告诉 搜索 引擎 这 是 一个 站点 地图 文件。 添加 如下 代码 :

第 4 步 : 添加 URL 信息

在 <urlset> 标签 内部 , 添加 网站 上 每个 页面 的 URL 信息。 对于 每个 页面 , 都 需要 使用 <url> 标签 , 并 在 其中 添加 相应 的 <loc> 、 <lastmod> 、 <changefreq> 和 <الأولوية > 标签。 例如 :

第 5 : 保存 文件 :

完成 上述 步骤 后 , 将 文件 保存 为 .xml 格式 , 例如 : ملف sitemap.xml。

6 步 : 验证 您 的 站点 地图

完成 创建 ملف sitemap.xml 文件 后 , 您 应该 对其 进行 验证 以 确保 代码 中 没有 错误。

您 可以 使用 使用 Google Search Console 或 Bing Webmaster Tools 验证 您 的 خريطة الموقع 是否 存在 错误。 您 还 在线 站点 地图 验证 工具。 , مدقق خرائط مواقع XML 是 流行 的 站点 地图 验证 工具。 只需 输入 您 的 站点 地图 URL 或上传 站点 地图 文件 , 这些 工具 将 检查 其 格式 并 报告 任何 错误 或 警告。

第 7 步 : 上传 站点 地图

将 生成 的 站点 地图 文件 上传 到 网站 的 根 目录 下 , 确保 搜索 引擎 可以 访问。

一般 情况 下 , 我们 会将 站点 地图 放在 网站 的 根 目录 下 (即 http://www.example.com/sitemap.xml)。 文件 位置 很 重要 , 提交 的 URL 必须 以 与 站点 地图 相同 的 路径开头。 例如 , 位于 http://example.com/catalog/sitemap.xml 的 站点 地图 文件 可以 包含 任何 以 http://example.com/catalog/ 开头 的 网址 , 但 不能 包含 以 http: // example. com / images 开头 的 网址。 又 或者 如果 站点 地图 位于 http://www.example.com/sitemap.xml , 则 它 不能 包含 来自 http://subdomain.example.com URL。

二 、 站点 地图 最佳 实践 与 做法

使用 XML 站点 地图 的 最佳 实践 可以 确保 搜索 引擎 更好 地 抓取 和 索引 您 的 网站 内容。 以下 是 一些 建议 :

1. 使用 标准 的 XML 格式

遵循 W3C 的 XML 标准 , 确保 站点 地图 的 格式 正确。 这样 搜索 引擎 才能 正确 解析 站点 地图。

2. 确保 您 的 XML 地图 保持 最新

XML 提供 的 内容。 每当 删除 页面 时 , 它 也 您 的 XML 站点 地图 中 删除 经常 更新 的 内容 地图 及时 更新。 如果 您 使用 可选 的lastmod 标签 , 请 确保 在 页面 更改 时 更新 时间戳。

当 我们 的 网站 有 很多 页面 时 , 我们 不太 可能 手动 更新 خريطة الموقع。 那么 , 如何 让 خريطة الموقع 自动 更新 呢?

要让 XML 站点 地图 自动 更新 , 您 可以 选择 以下 方法 之一 :

(1) 使用 内容 管理 系统 (CMS) 的 插件 或 扩展 :许多 内容 管理 系统 (如 WordPress 、 دروبال 、 جوملا 等) 提供 自动 生成 并 更新 站点 地图 插件 或 扩展。 安装 并 配置 这些 插件 的 ,地图 将 随着 网站 内容 的 更改 而 自动 更新。

例如 , 在 WordPress 中 , 您 可以 安装 “Yoast SEO” 等 插件 来 自动 生成 并 更新 站点 地图。

(2) 使用 自 定义 脚本 :如果 您 没有 使用 CMS , 可以 编写 自 定义 脚本 (如 Python 、 PHP 等) 来 生成 站点 地图。 这些 脚本 可 根据 的 网站 内容 自动 创建 站点 地图 , 并 在时 自动 更新 站点 地图。 将此 脚本 设置 为 定时 任务 (如 Linux 的 Cron Job 或 Windows 的 任务 计划 程序) , 以便 定期 运行 并 更新 站点 地图。

صراخ Frog SEO Spider 和 XML-Sitemaps.com 等 工具 可以 自动 生成 站点 地图 尽管如此 , 自动 更新 功能 可能 需要 付费 订阅 或 软件 软件 许可。

3. URL 数量 和 文件 大小 的 限制

单个 站点 地图 文件 中 的 URL 数量 不得 超过 50،000 个 , 文件 大小 不得 超过 50 ميجا بايت (未 压缩)。 超出 这些 限制 , 请将 站点 拆分 成 多个 文件 并 使用 站点 地图 索引 文件 进行 管理。

现在 我们 来 解释 一下 什么 是 站点 地图 索引 文件。

让 我们 看 一个 例子 :

在 这个 站点 地图 索引 文件 中 , 我们 有 三个 站点 地图 文件 sitemap1.xml 、 sitemap2.xml 和 sitemap3.xml)。 站点 地图 索引 文件 包括 以下 元素 :

  • <sitemap> : 此 标签 将 索引 文件 中 的 每个 站点 地图 条目 包裹 起来。
  • <loc> : 站点 地图 文件 的 URL。 请 用 您 实际 的 站点 地图 文件 URL 替换 此 URL。
  • <lastmod> : 站点 地图 文件 的 最后 修改 日期 和 时间 , 采用 W3C DateTime 格式 (YYYY-MM-DDThh: mm: ss + timezone)。 请将 其 替换 为 您 站点 地图 文件 的 实际 最后 修改 日期 和 时间。

让 我们 来 剖析 一下 这个 文件 与 的 خريطة موقع XML 有 什么 不同。

(1) XML 头

<؟ xml version = ”1.0 ″ encoding =” UTF-8 ″؟>

这里 没有 什么 新 东西 , 就像 我们 之前 定义 是 XML 格式 以及 使用 哪种 字符 编码 خريطة موقع XML 文件 一样。

(2) 站点 地图 索引 的 定义

<sitemapindex xmlns = ”http://www.sitemaps.org/schemas/sitemap/0.9 ″>

现在 ,我们 看到 的 不是 urlset 定义 , 而是 مخطط الموقع 定义。 此 定义 封装 了 地图 索引 中 包含 的 所有 站点 , , 说明 了 使用 哪个 版本 XML 站点 地图 标准。

(3) 单个 站点 地图

<خريطة الموقع>

<loc> https://www.example.com/sitemap1.xml </loc>

<lastmod> 2023-03-20T18: 00: 00 + 00: 00 </lastmod>

</sitemap>

就像 URL 一样 , 每个 站点 地图 定义 都 需要 至少 包含 <loc> 标签 , 其中 包含 单个 XML 站点 地图 的 完整 URL。 最 重要 的 是 , 地图 定义 也 可以 选择 包含 <lastmod> 标签。

4. 按 内容 类型 分割 站点 地图

如果 您 的 网站 内容 较多 , 即便 不 超过 5 万 个 URL , 您 也 可以 考虑 将 站点 地图 按 类型 (如 文章 、 分类 等) 进行 拆分。 可以 使用 站点 地图 索引 文件 将 各个 站点地图 链接 起来。

5. 设置 合适 的 更新 频率 和 优先 级

为 每个 URL 设置 合适 的 更新 频率 (<changefreq> 标签) 和 优先 级 (<الأولوية> 标签)。 这 有助于 搜索 引擎 更好 地 理解 网站 内容 的 重要性 和 更新 频率。

但是 , 您 又 不需要 太 担心 优先 级 的 设置。

一些 站点 地图 有 一个 “优先 级” 列 , 表面 上 告诉 搜索 引擎 哪些 页面 最 重要。 然而 是否 真的 有效 一直 2017 年 , Google 的 Gary Illyes 就 回复 推 文 称 Googlebot 在 抓取 时 会 忽略 优先 级 设置。

6. 避免 包含 无关 或 重复 的 URL

确保 站点 地图 中 只 包含 有价值 、 不 重复 的 URL。 避免 包含 重复 或 无关 内容 的 URL , 因为 这 可能 会 导致 搜索 引擎 对 您 网站 的 评价 降低。

当 您 有 多个 非常 相似 的 时 , 例如 同一 产品 的 不同 颜色 的 产品 , 您 “link rel = canonical” 标签 来 告诉 Google 哪个 页面 是 它 应该 抓取 索引 的 “主” 页面。

此外 , 永远 不要 列出 您 的 NoIndex 网址。 站点 地图 用于 Google 抓取 和 索引 哪些 URL , 而 不是 忽略 哪些 URL。

7. 考虑 只 将 高质量 页面 放在 站点 地图 中

在 排名 方面 , 整体 网站 质量 是 一个 关键 因素。

如果 您 的 站点 地图 将 抓取 工具 引导 至 非常 多 低 质量 的 页面 , 搜索 这些 这些 为 您 网站 的 大部分 低 质量 的。 因此 , 您 可以 考虑 只 将 高质量 的 页面放在 站点 地图 中。

8. 注意 多 语言 网站 的 XML 文件 写法

对于 多 语言 网站 , 您 可以 使用 <xhtml: link> 标签 在 XML 站点 地图 中 指定 不同 语言 版本 URL。 以下 是 一个 多 语言 网站 XML 站点 地图 示例 :

在 这个 示例 中 , 我们 为 同 一个 页面 提供 了 三种 语言 版本 : 英文 (en) 、 中文 zh) 和 西班牙文 (es)。 请 注意 以下 几点 :

  • 确保 在 <urlset> 标签 中 添加 xmlns: xhtml = ”http://www.w3.org/1999/xhtml” 属性 , 以便 使用 <xhtml: link> 标签。
  • 使用 <xhtml: link> 标签 为 每个 语言 版本 的 URL 添加 rel = ”alternate” hreflang 属性 。hreflang 属性 的 值 应 为 代表 相应 语言 ISO 639-1 语言 代码。
  • 为 每种 语言 版本 的 URL 创建 一个 <url> 条目 , 并 在 其中 包含 所有 其他 语言 版本 的 <xhtml: link> 标签。

您 可以 根据 您 自己 的 多 语言 网站 的 实际 情况 修改 上述 示例。

9. ملف robots.txt 将 站点 地图 添加

ملف robots.txt 文件 是 爬虫 访问 网站 时 首先 访问 的 地方。 通过 向 其中 添加 站点 地图 , 他们 快速 发现 站点 的 URL。

10. 使用 绝对 URL

在 站点 地图 中 , 确保 所有 URL 为 绝对 URL (包括 协议 和 域名)。 这样 搜索 引擎 就不 会对 URL 产生 歧义。

11. 站点 地图 文件 编码

站点 地图 文件 必须 采用 UTF-8 编码。 所有 站点 地图 文件 只能 ASCII 字符 —— 即 数字 0-9 、 英文 字母 AZ 和 一些 特殊 字符。 像 符号 、 引号 或 大于 / 小于 需要 用 转义 码 替换 的字符 :

12. 站点 地图 文件 位置

.将 站点 地图 发布 在 此 目录 下。

三 、 将 您 的 站点 地图 提交 给 谷 歌 / بنج / ياندكس / ياهو

创建 并 上传 站点 地图 后 需要 执行 的 最后 一步 是 将 其 提交 给 搜索 引擎 , 以便 它们 抓取 其中 列出 的 的 , 我 将 分别 介绍 如何 站点 地图 提交 给 Google 、 Bing 、 以及 Yandex 。

1. 将 خريطة الموقع 提交 给 جوجل

如果 您 想 将 XML 站点 地图 提交 给 Google , 您 可以 通过 3 种 不同 的 方式 进行。

(1) 通过 جوجل Search Console 提交 XML 地图

针对 Google و Google Search Console 是 您 提交 网站 站点 地图 的 地方。 请 按照 以下 步骤 向 Google 提交 您 的 站点 地图 :

1) 登录 Google Search Console , 然后 找到 屏幕 左侧 “索引” 部分 下 的 “站点 地图”。

2) 进入 页面 后 , 输入 您 的 站点 地图 URL , 然后 单击 “提交”。

就是 这么 简单。 现在 Google 将 验证 您 的 站点 地图。 如果 格式 正确 , 它将 更新 为 “成功” 状态。

通过 جوجل Search Console 提交 XML 地图

(2) 使用 ملف robots.txt 文件 提交 XML 站点 地图

Google Search Console

موقع Shein robots.txt

(3) 发送 HTTP GET “ping” 谷 歌

最后 一个 选项 是 “ping” 谷 歌 并 要求 他们 的 抓取 工具 抓取 您 的 网站。 这 是 通过 HTTP GET 请求 来 完成 的 :

https://www.google.com/ping؟sitemap=https://yourwebsite.com/sitemaplocation.xml

2. "خريطة الموقع" ، "بنج"

与 جوجل 类似 , 您 可以 通过 بنج 的 网站 管理员 工具 将 您 网站 的 站点 地图 提交 给 بنج。 您 可以 按照 以下 步骤 提交 您 的 站点 地图 :

1 ، 在 بنج 网站 管理员 工具 上 注册 您 的 网站。

2) 登录 Bing 网站 管理员 工具 后 , 转到 “我 的 网站” 页面 并 单击 您 的 网站。

3) 在 左侧 边 栏 菜单 , 找到 “站点 地图” ; 点击 “提交 站点 地图” , 然后 输入 您 网站 站点 地图 的 完整 “提交”。 与 在 Google 中 一样 , 您 可以 在 下面 的 列表 中 查看有关 您 提交 的 站点 地图 的 详细 信息。

将 خريطة الموقع 提交 给 بنج

3. 将 خريطة الموقع 提交 给 ياندكس

Yandex 是 俄罗斯 的 主要 搜索 引擎 之一。 在 那里 提交 您 的 站点 地图 可能 会 帮助 您 获得 来自 的 流量。 您 可以 以下 步骤 将 您 的 站点 地图 提交 给 Yandex :

1) 创建 一个 帐户 并 在 ياندكس 上 注册 您 的 网站。

2) 登录 到 ياندكس 网站 管理员 工具 并 从 主 仪表 板 中 选择 您 的 网站。

3) 使用 屏幕 左侧 的 菜单 , 导航 至 “فهرسة”> 站点 地图 文件。

4) 在 相应 的 字段 中 输入 指向 您 网站 站点 地图 的 完整 URL , 即 www.mywebsite.com/sitemap.xml。

单击 添加 按钮。

将 خريطة الموقع 提交 给 ياندكس

结语

精心 设计 的 网站 站点 地图 可 帮助 访问者 和 爬虫 更 有效 地 浏览 网站 , 这 对于 用户 体验 SEO 和 网站 优化 至关重要。

对于 创建 站点 地图 , 您 可以 使用 在线 生成 器 创建 站点 地图 以 加快 该 过程。 但是 , 如果 您 想 对其 进行 更多 控制 , 考虑 手动 编写 代码。

完成 后 , 您 只需 将 站点 地图 提交 给 主要 并将 其 添加 到 robots.txt 文件 中。

我 希望 本篇 文章 能 帮助 您 通过 创建 和 提交 站点 地图 加大 网站 的 收录 量!