谷歌的有用内容更新(HCU)和低质量人工智能用户生成内容的危险

已发表: 2023-11-06
电子邮件

包括帮助网站所有者驾驭 AI UGC 三重的提示和建议(低质量 AI 用户生成内容的检测、数量和速度。

AI 用户生成的内容和 Google 的有用内容更新。


“低质量人工智能用户生成内容”这个词虽然拗口,但对于允许在其网站上发布 UGC 的网站所有者来说,这是一个重要的话题。 通过深入分析 9 月份的有用内容更新 (HCU),我最近遇到了一些棘手的情况。 我认为还没有人通过有用的内容更新来讨论 UGC 的影响这一主题,因此我想在这篇文章中快速介绍一下。

自 2022 年 8 月推出第一个 HCU 以来,我看到了许多低质量 AI 内容受到重创的例子。 我在分享 2022 年 8 月 HCU、2022 年 12 月 HCU 以及现在更激进的 9 月 HCU(X) 的掉落时多次提到过这一点。 但这更多的是网站所有者大量使用人工智能在自己的网站上发布质量较低(且无用)的内容。 因此,随着时间的推移,这些网站最终会出现大量质量较低的人工智能内容,并受到 HCU 的打击。

我今天指的是其他人通过 UGC 添加低质量的 AI 内容到你的网站。 换句话说,如果提交用户生成内容的人使用人工智能快速制作该内容会怎样? 如果内容质量较低、没有经过编辑以增加价值、没有经过精炼以使其真正具有洞察力等等,该怎么办? 是的,这可能会产生问题,并且允许 UGC 的网站所有者开始发现这个问题正在蔓延。 对于 9 月份 HCU 后联系过我的一些网站来说,它们受到了非常严重的打击,搜索可见度大幅下降。

提醒一下谷歌对人工智能内容的立场:这与质量有关。
重要的是要记住,谷歌并不反对所有人工智能内容。 它反对低质量的人工智能内容。 因此,如果有人使用人工智能来帮助他们创建内容,并且他们编辑和完善该内容以确保其准确、有价值等,那么这可能完全没问题。 但如果有人只是导出人工智能生成的内容并大规模发布,那么他们就会让自己的网站被有用的内容更新甚至广泛的核心更新所淘汰。

以下是谷歌关于人工智能内容的帖子中的一段话,丹尼·沙利文解释说,他们所遇到的问题是,主要目的是操纵搜索结果排名的人工智能内容:

谷歌对人工智能内容的立场。


低质量的用户生成人工智能内容的阴险蔓延:
在我看来,根据我在分析许多受 HCU 影响的网站时所看到的情况,大规模的低质量人工智能内容可能非常危险。 如果 UGC 是您网站内容的核心部分,那么您必须密切关注质量。 很长一段时间以来,UGC 都是这种情况,但现在用户可以更轻松地利用人工智能创建工具在论坛、问答网站等上制作回复。

仅仅因为其他人在您的网站上发布了内容,您仍然要承担责任。 多年来,谷歌已经多次解释过这一点。 下面我仅列出了多年来我分享的有关 Google 的几条推文中的一条,解释了在评估质量时 UGC 将被计算在内。 如果它在您的网站上并且已编入索引,那么在评估质量时就会将其计入其中。


中等 UGC 大量:
自中世纪的 Panda 时代(大约 2011 年)以来,我一直解释说网站所有者需要严格控制用户生成的内容。 否则,随着时间的推移,低质量的内容可能会蔓延并不断增加。 当这种情况发生时,您正在将您的网站设置为受到重大算法更新的严重打击。 所以我现在的建议是一样的,但有一点人工智能的改变。 我现在还会留意低质量的人工智能内容,而不仅仅是典型的 UGC 垃圾邮件。 顶级人工智能内容检测工具不断改进,可以帮助标记很可能是通过人工智能创建的内容。

下面,我将向可能正在处理低质量人工智能用户生成内容的网站所有者介绍一些技巧。 同样,我已经有几个网站联系到了这个问题在过去一年左右的时间里逐渐出现的地方……

检测、音量和节奏:AI UGC 三重
除了识别人工智能生成的内容之外,您还可以检查用户的回复量以及提交这些回复的速度。 一位网站所有者最近联系了我,显示一位用户在短时间内提交了许多回复。 当通过人工智能内容检测工具运行这些响应时,它们都以 100% 的概率返回内容是通过人工智能创建的。 例如,您可以在下面看到其中两个提交的内容。

Originality.ai 检测到的 ai 用户生成内容的示例
Originality.ai 检测到的人工智能用户生成内容的第二个示例


因此,数量、速度和相当明显的人工智能内容的结合产生了一个很好的例子,说明用户利用人工智能在相关网站上产出大量 UGC。

请注意,这是一个大型网站,因此该用户可能不会产生什么影响。 但随着时间的推移,如果其他用户也这样做,从质量角度来看绝对可能会导致问题。 网站所有者很聪明地就此事与我联系。 他们处理该用户,并可能开发一个识别模式的流程,帮助那些试图用低质量的人工智能用户生成的内容来欺骗系统的人。

请记住,9 月份的 HCU 似乎将用户体验纳入了这个等式中(我在分析许多受影响的网站时经常看到这一点)。 因此,攻击性广告、弹出窗口、插页式广告等用户体验障碍可能会导致“无用内容”。 因此,如果您将低质量的人工智能用户生成的内容与糟糕的用户体验结合起来,您可能会遇到 HCU 漫游网络的严重问题。 谨防。

无用的内容和糟糕的用户体验的结合是谷歌有用内容更新的死亡之吻。


总结:对接受 UGC 的网站所有者的警告。
同样,我想为任何发布用户生成内容的网站介绍这个主题。 即使您有一个包含大量内容的大型网站,我也会非常小心地在网站上放置任何类型的低质量内容。 现在,随着人工智能内容生成工具的便利,您应该小心不要让低质量的人工智能用户生成的内容出现在网站上。 同样,我已经有几家公司在遭受重创后伸出援手,这显然是问题的一部分。

我将向网站所有者提供一些提示和建议来结束这篇文章:

  • 严格审核,并采用人工智能技术:如果您接受网站上用户生成的内容,那么从质量角度来看,您应该已经进行了严格审核。 但现在您还应该留意正在提交的低质量人工智能内容。
  • 提交速度:一个危险信号可能是某些用户的提交速度。 例如,我之前解释过,一家公司在通知提交内容后联系我,这似乎有点不对劲……当深入研究该用户时,在很短的时间内就有了一堆提交内容。 通过人工智能内容检测工具运行这些提交内容后,这些提交内容有 100% 的可能性是通过人工智能创建的。
  • 测试实验室:我建议创建一个利用多种人工智能内容检测工具的测试实验室。 这些工具并不完美,但它们擅长检测人工智能生成的低质量内容。 制定适当的流程来检查已标记的内容。 接下来我将介绍 API,它可以帮助批量检查内容。
  • API 是您的朋友:一些 AI 内容检测工具具有 API,可让您批量检查内容。 如果您有一个大型网站,并且有大量用户生成的内容,那么利用 API 可能是一个明智的选择。 例如,GPTZero、Originality.ai 和其他公司都有 API,您可以利用它们来大规模检查内容。
  • 针对用户生成内容的 AI 内容政策:制定有关用户可以访问并轻松理解的 AI 内容的政策。 确保用户了解什么是允许的,什么是不允许的,包括如果检测到低质量的 AI 内容你会做什么。
  • 索引方面,要快,要果断:最后,快速处理人工智能提交的内容并确保它们不会被索引(或不保持索引状态)。 正如我之前在有关主要算法更新的帖子和演示中多次介绍的那样,当 Google 评估质量时,所有索引页面都会被考虑在内。 因此,重点关注我所说的“质量索引”,并确保低质量的人工智能用户生成的内容不会被索引。

摘要:关注具有 AI 特色的 UGC。
对于接受用户生成内容的网站来说,从质量角度对内容进行严格审核始终很重要。 现在有了人工智能内容生成工具,UGC 现在变得更加棘手,审核也变得更加困难。 我建议查看我在这篇文章中提供的提示和建议,以创建一个标记潜在问题的流程,然后快速处理这些问题。 这是维持强大的“质量索引”水平的最佳方式,这对于避免基于主要算法更新(例如有用的内容更新和广泛的核心更新)的问题非常重要。

GG