Pourquoi Noindexing Syndicated Content Is The Way – Suivi de 3K articles de presse syndiqués pour déterminer l'impact sur l'indexation, le classement et le trafic sur les surfaces Google [Étude de cas]

Publié: 2023-08-04
E-mail
Étude de cas sur le référencement de contenu syndiqué

Le mois dernier, John Shehata de NewzDash a publié un article de blog documentant une étude couvrant l'impact de la syndication sur les éditeurs de nouvelles. Par exemple, lorsqu'un éditeur syndique des articles à des partenaires de syndication, quel site se classe et à quoi cela ressemble-t-il sur les surfaces Google (Recherche, Google Actualités, etc.)

Les résultats ont confirmé ce que beaucoup ont vu dans les SERP au fil du temps en travaillant ou en aidant des éditeurs de nouvelles. Google peut souvent classer le partenaire de syndication par rapport à la source d'origine, même lorsque le contenu syndiqué sur les sites partenaires est correctement canonisé à la source d'origine.

Et pour rappel, Google a mis à jour sa documentation sur la canonisation en mai 2023 et a révisé sa recommandation pour le contenu syndiqué. Google recommande désormais pleinement aux partenaires de syndication de ne pas indexer le contenu des éditeurs d'actualités si l'éditeur ne souhaite pas entrer en concurrence avec ce partenaire de syndication dans la recherche. Google a expliqué que rel canonique n'est pas suffisant car la page d'origine et la page située sur le site Web du partenaire de syndication peuvent souvent être différentes (lorsque vous prenez en compte la page entière, y compris le passe-partout, d'autres contenus supplémentaires, etc.). Par conséquent, les systèmes de Google peut vraisemblablement avoir du mal à déterminer qu'il s'agit du même article syndiqué et ensuite classer la mauvaise version, ou même les deux. Plus d'informations sur cette situation bientôt lorsque je couvrirai l'étude de cas…

Document d'aide à la canonisation de Google avec des recommandations de contenu syndiqué.

Et voici des informations tirées de la documentation de Google destinée aux éditeurs d'actualités pour éviter les problèmes de duplication dans Google Actualités avec du contenu syndiqué :

Auparavant, Google avait déclaré que vous pouviez utiliser rel canonique pointant vers la source d'origine, tout en fournissant un lien vers la source d'origine, ce qui aurait dû aider leurs systèmes à déterminer l'URL canonique (et la source d'origine). Et pour être juste envers Google, ils ont également expliqué dans le passé que vous ne pouviez pas indexer le contenu pour éviter les problèmes. Mais comme le comprend toute personne travaillant avec des éditeurs de nouvelles, demander aux partenaires de syndication de ne pas indexer ce contenu est une situation difficile à faire approuver. Je ne m'enliserai pas dans cet article en couvrant ce sujet, mais la plupart des partenaires de syndication veulent en fait classer le contenu (il est donc peu probable qu'ils n'indexent pas le contenu syndiqué qu'ils consomment.)

Vos conversations avec eux pourraient ressembler à ceci :

Partenaires de syndication ignorant les propriétaires de sites.

L'étude de cas : un exemple clair de problèmes de syndication des éditeurs de presse.
OK, nous savons donc que Google recommande de ne pas indexer le contenu sur le site Web du partenaire de syndication et d'éviter d'utiliser rel canonique comme solution. Mais à quoi tout cela ressemble-t-il réellement dans les SERP ? Quelle est la gravité de la situation lorsque le contenu n'est pas indexé ? Et cela a-t-il un impact sur toutes les surfaces Google telles que la recherche, Top Stories, l'onglet Actualités dans la recherche, Google Actualités et Discover ?

Eh bien, j'ai décidé de creuser pour un client qui syndique fortement le contenu sur des sites Web partenaires. Ils ont depuis longtemps, mais jamais vraiment compris le véritable impact. Après avoir envoyé l'étude de NewzDash, nous avons eu un appel avec plusieurs personnes de toute l'organisation. Il était clair que tout le monde voulait savoir combien de visibilité ils perdaient en syndiquant du contenu, où ils perdaient cette visibilité, si cela avait également un impact sur l'indexation du contenu, et plus encore. Donc, dans un premier temps, j'ai décidé de concevoir un système pour commencer à capturer des données qui pourraient aider à identifier les problèmes de syndication potentiels. Je couvrirai cela ensuite.

Le test : vérification des URL récemment publiées par 3K qui sont également syndiquées à des partenaires.
J'ai pris du recul et j'ai commencé à élaborer un système pour suivre la situation de syndication du mieux que je pouvais en me basant sur les API de Google (y compris l'API Search Console et l'API d'inspection d'URL). Mon objectif était de comprendre comment Google gérait les trois mille dernières URL publiées du point de vue de la visibilité, du point de vue de l'indexation et du point de vue des performances sur les surfaces Google (Recherche, Top Stories, l'onglet News dans Search et Discover).

Voici le système que j'ai tracé:

  • Exportez les trois mille dernières URL basées sur le sitemap de Google News.
  • Exécutez les URL via l'API d'inspection d'URL pour vérifier l'indexation en bloc (pour identifier tout type de problème d'indexation, comme Google choisissant le partenaire de syndication comme source canonique par rapport à la source d'origine). Si les pages n'étaient pas indexées, elles ne seraient clairement pas classées…
  • Vérifiez ensuite les données de performances de chaque URL de manière groupée via l'API Search Console. Cela comprenait des données pour la recherche, l'onglet Actualités dans la recherche, Google Actualités et Discover.
  • Sur la base de ces données, identifiez les URL indexées sans données de performances (ou très peu) comme candidates aux problèmes de syndication. Si les URL n'avaient pas d'impressions ou de clics, alors peut-être qu'un partenaire de syndication se classait par rapport à mon client.
  • Vérifiez ponctuellement les SERP pour voir comment Google gérait les URL du point de vue du classement sur toutes les surfaces.

Pas de rime ni de raison : ce que j'ai trouvé m'a encore plus perturbé que je ne le pensais.
Tout d'abord, la vérification de l'indexation sur trois mille URL, qui s'est très bien déroulée. Presque toutes les URL ont été indexées par Google. Et il n'y avait aucun exemple de Google ayant choisi à tort des partenaires de syndication comme canonique. C'était super et ça m'a un peu surpris. Je pensais que je verrais cela pour au moins certaines des URL.

Vérification de l'indexation dans les articles de presse récents.

Ensuite, j'ai exporté des données de performances en masse pour les trois mille dernières URL. Une fois exporté, j'ai pu isoler les URL avec très peu ou pas de données de performance sur les surfaces. C'étaient d'excellents candidats pour les problèmes de syndication potentiels. c'est-à-dire que si le contenu n'a généré aucune impression ou clic, alors peut-être qu'un partenaire de syndication se classait par rapport à mon client.

Données de performance GSC dans les articles de presse récents.

Et puis j'ai commencé à vérifier ponctuellement les SERP. Après avoir vérifié un certain nombre de requêtes basées sur la liste des URL signalées, il n'y avait aucune rime ni raison pour laquelle Google faisait apparaître les URL de mon client par rapport aux partenaires de syndication (ou vice versa). Et pour compliquer encore plus les choses, parfois les deux urls étaient classées dans Top Stories, Search, etc. Et puis il y avait des fois où l'une se classait dans Top Stories tandis que l'autre se classait dans Search. Et il en va de même pour l'onglet Actualités dans la recherche et Google Actualités. C'était le bordel…

Je vais vous donner un exemple rapide ci-dessous afin que vous puissiez voir le désordre de la syndication. Remarque, j'ai dû brouiller fortement les SERP dans les captures d'écran suivantes, mais je voulais donner un exemple de ce que j'ai trouvé. Encore une fois, il n'y avait ni rime ni raison pour laquelle cela se produisait. Sur la base de cet exemple et de ce que j'ai vu dans d'autres exemples que j'ai vérifiés, je peux comprendre pourquoi Google dit de ne pas indexer les URL en aval sur les partenaires de syndication. Sinon, tout cela pourrait arriver.

Tout d'abord, voici un exemple de classement de Yahoo Finance dans Top Stories alors que l'original se classe dans la recherche juste en dessous :

Le partenaire de syndication se classe dans les Top Stories tandis que la source d'origine se classe dans la recherche.

Ensuite, Yahoo News se classe deux fois dans l'onglet Actualités de la recherche (qui est une surface importante pour mon client), tandis que la source d'origine est introuvable. Et le logo de mon client est affiché pour le contenu syndiqué. Comme c'est gentil…

Partenaire de syndication classé deux fois dans l'onglet Actualités de la recherche par rapport à la source d'origine.

Et puis dans Google Actualités, les rangs de la source d'origine et les partenaires de syndication sont introuvables :

Le classement de la source d'origine dans Google Actualités par rapport aux partenaires de syndication.

Comme vous pouvez le voir, la situation est un gâchis… et bonne chance pour essayer de suivre cela régulièrement. Et la perte de visibilité sur des milliers de pages par mois pourrait vraiment s'additionner… Il est difficile de déterminer le nombre exact d'impressions et de clics perdus, mais cela peut être énorme pour les grands éditeurs d'actualités.

Découvrez : Le trou noir personnalisé
Et en ce qui concerne Discover, il est difficile de suivre la visibilité perdue car le flux est personnalisé et vous ne pouvez pas voir ce que toutes les autres personnes voient dans leur propre flux. Mais vous pourriez trouver des exemples dans la nature de partenaires de syndication qui y sont classés par rapport à votre propre contenu. Vous trouverez ci-dessous un exemple que j'ai trouvé récemment du classement de Yahoo Finance dans Discover pour un article d'Insider Monkey. Remarque, Insider Monkey n'est pas un client et non le site que je couvre dans l'étude de cas, mais c'est un bon exemple de ce qui peut arriver dans Discover. Et si cela se produit souvent, le site pourrait perdre une tonne de trafic…

Voici le classement Yahoo Finance dans Discover :

Classement du contenu syndiqué par rapport à la source d'origine dans Google Discover.

Et voici l'article original sur Insider Monkey (mais c'est sous forme de diaporama). Cet exemple montre comment Google peut voir que les pages sont différentes, ce qui peut poser des problèmes pour comprendre qu'il s'agit du même article :

Article original qui est syndiqué à Yahoo Finance.

Et voici le classement n ° 2 de Yahoo Finance pour le mot clé cible dans les principaux SERP. Ainsi, le partenaire de syndication se classe au-dessus de l'original dans les résultats de recherche :

Partenaire de syndication surclassant la source d'origine dans la recherche.


Points clés et recommandations pour les éditeurs d'actualités confrontés à des problèmes de syndication :

  • Tout d'abord, essayez de comprendre au mieux les problèmes d'indexation et de visibilité. Utilisez une approche comme celle que j'ai tracée pour au moins avoir une idée de la gravité du problème. Les API de Google sont vos amis ici et vous pouvez traiter en masse de nombreuses URL en peu de temps.
  • Évaluez les risques et les avantages de la syndication de contenu auprès de partenaires. La visibilité supplémentaire sur les partenaires vaut-elle la peine de perdre de la visibilité dans la recherche, les articles à la une, l'onglet Actualités dans la recherche, Google Actualités et Discover ? N'oubliez pas que cela pourrait également signifier une perte de liens puissants… Par exemple, si le partenaire de syndication se classe et que d'autres sites proposent des liens vers ces articles, vous perdez ces liens.
  • Si nécessaire, discutez avec les partenaires de syndication de la possibilité de ne pas indexer le contenu syndiqué. Cela ne se passera probablement PAS bien… Encore une fois, ils veulent souvent se classer pour obtenir ce trafic. Mais on ne sait jamais… certains pourraient accepter de ne pas indexer les URL.
  • Comprendre que Discover est difficile à suivre, vous risquez donc de perdre plus de trafic que vous ne le pensez (et peut-être beaucoup). Vous pourriez y rencontrer des problèmes de syndication dans la nature, mais vous ne pouvez pas simplement y aller et trouver facilement des problèmes de syndication (comme vous le pouvez avec la recherche, Top Stories, l'onglet News et Google News).
  • Des outils comme Semrush et NewzDash peuvent aider à combler les lacunes du point de vue du suivi du classement. Et NewzDash se concentre sur les éditeurs de nouvelles, ce qui pourrait être un outil précieux dans votre arsenal de suivi. Semrush pourrait aider avec la recherche et les Top Stories. Encore une fois, essayez d'avoir une bonne idée des problèmes de visibilité dus à la syndication de contenu.

Résumé - Les problèmes de syndication pour les éditeurs de nouvelles pourraient être pires que vous ne le pensez.
Si vous syndiquez du contenu, je vous recommande d'essayer de comprendre ce qui se passe dans les SERP (et sur les surfaces Google). Et puis former un plan d'attaque pour faire face à la situation. Cela peut inclure de garder les choses telles quelles, ou cela peut entraîner des changements dans votre stratégie de syndication. Mais la première étape consiste à acquérir une certaine visibilité de la situation (jeu de mots). Bonne chance.

GG