La mise à jour du contenu utile (HCU) de Google et le danger du contenu généré par les utilisateurs de l'IA de mauvaise qualité

Publié: 2023-11-06
E-mail

Y compris des conseils et des recommandations pour aider les propriétaires de sites à naviguer dans le triple UGC de l'IA (détection, volume et rythme du contenu généré par les utilisateurs de l'IA de moindre qualité.)

Contenu généré par les utilisateurs de l'IA et mise à jour du contenu utile de Google.


L'expression « contenu généré par les utilisateurs par l'IA de mauvaise qualité » est une longue phrase, mais il s'agit d'un sujet important pour les propriétaires de sites qui autorisent la publication d'UGC sur leurs sites. Et j'ai récemment rencontré plusieurs situations difficiles sur la base d'une analyse approfondie de la mise à jour de contenu utile (HCU) de septembre. Je ne pense pas que quiconque ait encore abordé le sujet de l'impact de l'UGC avec la mise à jour du contenu utile, je voulais donc l'aborder rapidement dans cet article.

Depuis le lancement du premier HCU en août 2022, j’ai vu de nombreux exemples de contenu d’IA de mauvaise qualité être durement touchés. J'ai mentionné cela à plusieurs reprises lors du partage des baisses avec le HCU d'août 2022, le HCU de décembre 2022, et maintenant avec le HCU(X) plus agressif de septembre. Mais il s’agissait davantage du propriétaire du site qui utilisait massivement l’IA pour publier du contenu de moindre qualité (et inutile) sur son propre site. Ainsi, les sites se sont retrouvés avec beaucoup de contenu IA de moindre qualité au fil du temps et ont été touchés par le HCU.

Ce à quoi je fais référence aujourd'hui concerne d'autres personnes qui ajoutent du contenu IA de moindre qualité à votre site via l'UGC. En d’autres termes, que se passerait-il si les personnes soumettant du contenu généré par les utilisateurs utilisaient l’IA pour créer rapidement ce contenu ? Et si ce contenu était de moindre qualité, n’était pas modifié pour ajouter de la valeur, n’était pas affiné pour être vraiment instructif, etc. ? Oui, cela peut être problématique, et les propriétaires de sites qui autorisent l’UGC commencent à voir ce problème s’accentuer. Et pour certains sites qui m'ont contacté après le HCU de septembre, ils ont été très durement touchés et ont considérablement perdu en visibilité dans les recherches.

Un rappel sur la position de Google sur le contenu de l'IA : c'est une question de qualité.
Il est important de se rappeler que Google n’est pas contre tout contenu IA. C'est contre le contenu IA de mauvaise qualité . Donc, si quelqu'un utilise l'IA pour l'aider à créer du contenu, et qu'il modifie et affine ce contenu pour s'assurer qu'il est exact, précieux, etc., alors cela pourrait être tout à fait bien. Mais si quelqu'un exporte simplement du contenu généré par l'IA et le publie à grande échelle, alors il prépare son site pour qu'il soit effacé soit par la mise à jour du contenu utile, soit même par une mise à jour générale de base.

Voici un paragraphe de l'article de Google sur le contenu de l'IA dans lequel Danny Sullivan explique que le contenu de l'IA dont le but principal est de manipuler le classement dans les résultats de recherche est ce qui leur pose problème :

La position de Google sur le contenu de l'IA.


La dérive insidieuse du contenu IA de mauvaise qualité généré par les utilisateurs :
À mon avis, et d’après ce que j’ai vu en analysant de nombreux sites impactés par le HCU, un contenu d’IA de mauvaise qualité à grande échelle peut être incroyablement dangereux. Et si l’UGC est un élément essentiel du contenu de votre site, vous devez alors surveiller de près la qualité. C'est le cas de l'UGC depuis très longtemps, mais il est désormais beaucoup plus facile pour les utilisateurs d'exploiter les outils de création d'IA pour rédiger des réponses sur les forums, les sites de questions-réponses, etc.

Et même si quelqu’un d’autre a publié le contenu sur votre site, vous en êtes toujours responsable. Google l’a expliqué à plusieurs reprises au fil des ans. Ci-dessous, j'ai inclus l'un des nombreux tweets que j'ai partagés au fil des ans à propos de Google expliquant que l'UGC sera pris en compte lors de l'évaluation de la qualité. S'il se trouve sur votre site et qu'il est indexé, il est pris en compte lors de l'évaluation de la qualité.


UGC modéré fortement :
Depuis l’époque médiévale du Panda (vers 2011), j’ai toujours expliqué que les propriétaires de sites devaient fortement modérer le contenu généré par les utilisateurs. Dans le cas contraire, un contenu de moindre qualité peut s’infiltrer et se développer au fil du temps. Et lorsque cela se produit, vous configurez votre site pour qu’il soit durement touché par une mise à jour majeure de l’algorithme. Mon conseil est donc le même maintenant, mais avec une légère touche d’IA. Je serais désormais également à la recherche de contenu IA de moindre qualité et pas seulement de votre spam UGC typique. Les meilleurs outils de détection de contenu d’IA continuent de s’améliorer et peuvent aider à signaler les contenus présentant une forte probabilité qu’ils aient été créés via l’IA.

Ci-dessous, je présenterai quelques conseils pour les propriétaires de sites susceptibles d'être confrontés à un contenu généré par les utilisateurs d'IA de moindre qualité. Encore une fois, j'ai consulté plusieurs sites sur lesquels ce problème s'est manifesté au cours de la dernière année…

Détection, volume et rythme : le triple IA UGC
Au-delà de la simple identification du contenu généré par l'IA, vous pouvez vérifier le volume de réponses des utilisateurs et la vitesse à laquelle ces réponses sont soumises. Un propriétaire de site m'a récemment contacté pour me montrer un utilisateur qui avait soumis de nombreuses réponses en peu de temps. Lors de l’exécution de ces réponses via un outil de détection de contenu IA, elles sont toutes revenues avec une probabilité de 100 % que le contenu ait été créé via l’IA. Par exemple, vous pouvez voir deux de ces soumissions ci-dessous.

Exemple de contenu généré par un utilisateur IA détecté par Originality.ai
Un deuxième exemple de contenu généré par un utilisateur IA détecté par Originality.ai


Ainsi, la combinaison du volume, du rythme et du contenu de l'IA assez évident a donné un bon exemple d'utilisateur tirant parti de l'IA pour générer une tonne d'UGC sur le site en question.

Notez qu'il s'agit d'un site à grande échelle, donc cet utilisateur unique aurait probablement peu d'impact. Mais au fil du temps, si d’autres utilisateurs faisaient de même, cela pourrait absolument poser des problèmes du point de vue de la qualité. Le propriétaire du site a eu la bonne idée de me contacter à ce sujet. Ils ont géré cet utilisateur et pourraient développer un processus d'identification de modèles qui pourraient aider à faire apparaître des personnes essayant de jouer avec le système avec un contenu généré par les utilisateurs d'IA de moindre qualité.

Et rappelez-vous, le HCU de septembre semblait intégrer l'UX dans l'équation (ce que j'ai largement constaté en analysant de nombreux sites impactés). Ainsi, les obstacles à l'expérience utilisateur tels que les publicités agressives, les popups, les interstitiels, etc. peuvent contribuer à un « contenu inutile ». Ainsi, si vous combinez un contenu généré par l’IA de mauvaise qualité avec une UX épouvantable, vous pourriez avoir de sérieux problèmes avec le HCU itinérant sur le Web. Méfiez-vous.

La combinaison d'un contenu inutile et d'une UX épouvantable est le coup fatal pour la mise à jour du contenu utile de Google.


Conclusion : un avertissement pour les propriétaires de sites qui acceptent l'UGC.
Encore une fois, je voulais aborder ce sujet pour tout site publiant du contenu généré par les utilisateurs. Même si vous avez un site à plus grande échelle avec une tonne de contenu, je serais très prudent en laissant tout type de contenu de mauvaise qualité sur le site. Et maintenant, avec la facilité des outils de génération de contenu d’IA, vous devez faire attention à ne pas laisser sur le site du contenu généré par les utilisateurs d’IA de mauvaise qualité. Encore une fois, plusieurs entreprises m’ont contacté après avoir été durement touchées, et cela faisait clairement partie du problème.

Je terminerai cet article avec quelques conseils et recommandations pour les propriétaires de sites :

  • Modérez fortement et avec une touche d'IA : si vous acceptez le contenu généré par les utilisateurs sur votre site, vous devriez déjà modérer fortement du point de vue de la qualité. Mais maintenant, vous devriez également être à l’affût du contenu IA de moindre qualité soumis.
  • Rythme de soumission : un signal d’alarme pourrait être le rythme de soumission par certains utilisateurs. Par exemple, j'ai expliqué plus tôt qu'une entreprise m'avait contacté après avoir notifié des soumissions qui semblaient un peu bizarres… En creusant auprès de cet utilisateur, il y a eu un tas de soumissions dans un laps de temps très court. Et après avoir exécuté ces soumissions via des outils de détection de contenu d’IA, il y avait une probabilité de 100 % que ces soumissions aient été créées via l’IA.
  • Laboratoire de tests : je recommande de créer un laboratoire de tests qui exploite plusieurs outils de détection de contenu d'IA. Les outils ne sont pas parfaits, mais ils sont efficaces pour détecter le contenu généré par l’IA de moindre qualité . Mettez en place un processus pour vérifier le contenu signalé. Et je parlerai ensuite des API, qui peuvent aider à vérifier le contenu en masse.
  • Les API sont vos amies : certains outils de détection de contenu d'IA disposent d'API qui vous permettent de vérifier le contenu en masse. Si vous disposez d’un site à grande échelle, avec beaucoup de contenu généré par les utilisateurs, tirer parti d’une API pourrait être une solution intelligente. Par exemple, GPTZero, Originality.ai et d'autres disposent d'API que vous pouvez exploiter pour vérifier le contenu à grande échelle.
  • Politique de contenu d'IA pour le contenu généré par les utilisateurs : disposez d'une politique en matière de contenu d'IA à laquelle les utilisateurs peuvent accéder et facilement comprendre. Assurez-vous que les utilisateurs comprennent ce qui est autorisé et ce qui ne l’est pas , y compris ce que vous ferez si du contenu IA de mauvaise qualité est détecté.
  • En termes d'indexation, soyez rapide, soyez décisif : et enfin, traitez rapidement les soumissions d'IA et assurez-vous qu'elles ne sont pas indexées (ou ne restent pas indexées). Comme je l'ai déjà expliqué à plusieurs reprises dans des articles et des présentations sur les mises à jour majeures des algorithmes, toutes les pages indexées sont prises en compte lorsque Google évalue la qualité. Concentrez-vous donc sur ce que j’appelle « l’indexation de qualité » et assurez-vous que le contenu généré par les utilisateurs de l’IA de moindre qualité ne soit pas indexé.

Résumé : Surveillez l'UGC avec une touche d'IA.
Pour les sites qui acceptent le contenu généré par les utilisateurs, il a toujours été important de modérer fortement ce contenu du point de vue de la qualité. Et maintenant, avec les outils de génération de contenu IA, l’UGC est désormais plus difficile à gérer et la modération est devenue un peu plus difficile. Je vous recommande de consulter les conseils et recommandations que j'ai fournis dans cet article pour créer un processus permettant de signaler les problèmes potentiels, puis de gérer ces problèmes rapidement. C'est le meilleur moyen de maintenir des niveaux d'« indexation de qualité » élevés, ce qui est important pour éviter les problèmes liés aux mises à jour majeures des algorithmes, telles que la mise à jour du contenu utile et les mises à jour générales du noyau.

GG