Atualização de conteúdo útil (HCU) do Google e o perigo do conteúdo gerado pelo usuário com IA de baixa qualidade

Publicados: 2023-11-06
E-mail

Incluindo dicas e recomendações para ajudar os proprietários de sites a navegar no triplo AI UGC (detecção, volume e ritmo de conteúdo gerado por usuários de IA de qualidade inferior).

Conteúdo gerado pelo usuário de IA e atualização de conteúdo útil do Google.


O termo “conteúdo gerado pelo usuário com IA de baixa qualidade” é exagerado, mas é um tópico importante para proprietários de sites que permitem que UGC seja publicado em seus sites. E me deparei com várias situações difíceis recentemente, com base na análise minuciosa da atualização de conteúdo útil (HCU) de setembro. Não acho que alguém tenha abordado o tópico do impacto do UGC com a atualização de conteúdo útil ainda, então gostaria de abordá-lo rapidamente nesta postagem.

Desde o lançamento do primeiro HCU em agosto de 2022, vi muitos exemplos de conteúdo de IA de baixa qualidade serem duramente atingidos. Mencionei isso várias vezes ao compartilhar sobre quedas com a HCU de agosto de 2022, a HCU de dezembro de 2022 e agora com a HCU(X) de setembro mais agressiva. Mas isso era mais sobre o proprietário do site usar fortemente a IA para publicar conteúdo de qualidade inferior (e inútil) em seu próprio site. Assim, os sites acabaram com muito conteúdo de IA de qualidade inferior ao longo do tempo e foram atingidos pela HCU.

O que estou me referindo hoje é sobre outras pessoas adicionando conteúdo de IA de qualidade inferior ao seu site por meio de UGC. Em outras palavras, e se as pessoas que enviam conteúdo gerado pelo usuário estiverem usando IA para criar esse conteúdo rapidamente? E se esse conteúdo for de qualidade inferior, não for editado para agregar valor, não for refinado para ser verdadeiramente esclarecedor, etc.? Sim, isso pode ser problemático, e os proprietários de sites que permitem UGC estão começando a ver esse problema aumentar. E para alguns sites que me contataram após o HCU de setembro, eles foram duramente atingidos e caíram fortemente na visibilidade da pesquisa.

Um lembrete sobre a posição do Google em relação ao conteúdo de IA: trata-se de qualidade.
É importante lembrar que o Google não é contra todo conteúdo de IA. É contra conteúdo de IA de baixa qualidade . Portanto, se alguém estiver usando IA para ajudá-lo a criar conteúdo e editar e refinar esse conteúdo para garantir que seja preciso, valioso, etc., então tudo bem. Mas se alguém está simplesmente exportando conteúdo gerado por IA e publicando-o em grande escala, então ele está preparando seu site para ser destruído pela atualização de conteúdo útil ou até mesmo por uma atualização central ampla.

Aqui está um parágrafo da postagem do Google sobre conteúdo de IA, onde Danny Sullivan explica que o conteúdo de IA com o objetivo principal de manipular a classificação nos resultados de pesquisa é o que eles têm problemas:

A posição do Google em relação ao conteúdo de IA.


O avanço insidioso do conteúdo de IA gerado pelo usuário de baixa qualidade:
Na minha opinião, e com base no que vi ao analisar muitos sites impactados pela HCU, conteúdo de IA de baixa qualidade em grande escala pode ser incrivelmente perigoso. E se o UGC é uma parte essencial do conteúdo do seu site, você deve ficar atento à qualidade. Esse tem sido o caso do UGC há muito tempo, mas agora é muito mais fácil para os usuários aproveitarem as ferramentas de criação de IA para criar respostas em fóruns, sites de perguntas e respostas e muito mais.

E só porque outra pessoa postou o conteúdo em seu site, você ainda é responsável. O Google explicou isso muitas vezes ao longo dos anos. Abaixo, incluí apenas um dos vários tweets que compartilhei ao longo dos anos sobre o Google explicando que o UGC será contado na avaliação da qualidade. Se estiver no seu site e estiver indexado, será contabilizado na avaliação da qualidade.


Modere fortemente o UGC:
Desde a época medieval do Panda (por volta de 2011), sempre expliquei que os proprietários de sites precisam moderar fortemente o conteúdo gerado pelos usuários. Caso contrário, conteúdo de qualidade inferior pode surgir e crescer com o tempo. E quando isso acontece, você está configurando seu site para ser duramente atingido por uma grande atualização de algoritmo. Portanto, meu conselho é o mesmo agora, mas com uma ligeira variação de IA. Agora eu também estaria em busca de conteúdo de IA de qualidade inferior e não apenas do típico spam UGC. As principais ferramentas de detecção de conteúdo de IA continuam a melhorar e podem ajudar a sinalizar conteúdo com alta probabilidade de ter sido criado por meio de IA.

Abaixo, abordarei algumas dicas para proprietários de sites que podem estar lidando com conteúdo gerado por usuários de IA de qualidade inferior. Mais uma vez, vários sites contataram onde esse problema tem surgido ao longo do último ano ou assim…

Detecção, volume e ritmo: o triplo AI UGC
Além de apenas identificar o conteúdo gerado por IA, você pode verificar o volume de respostas dos usuários e o ritmo em que essas respostas estão sendo enviadas. O proprietário de um site entrou em contato comigo recentemente mostrando um usuário que enviou muitas respostas em um curto período de tempo. Ao executar essas respostas por meio de uma ferramenta de detecção de conteúdo de IA, todas elas retornaram com 100% de probabilidade de que o conteúdo tenha sido criado por meio de IA. Por exemplo, você pode ver dois desses envios abaixo.

Exemplo de conteúdo gerado pelo usuário AI sendo detectado por Originality.ai
Um segundo exemplo de conteúdo gerado pelo usuário de IA sendo detectado pelo Originality.ai


Portanto, a combinação de volume, ritmo e conteúdo de IA bastante óbvio rendeu um bom exemplo de um usuário aproveitando a IA para gerar uma tonelada de UGC no site em questão.

Observe que é um site de grande escala, portanto esse usuário provavelmente teria pouco impacto. Mas com o tempo, se outros usuários fizessem o mesmo, isso poderia causar problemas do ponto de vista da qualidade. O proprietário do site foi inteligente em entrar em contato comigo sobre isso. Eles lidaram com esse usuário e podem desenvolver um processo para identificar padrões que poderiam ajudar a revelar pessoas que tentam manipular o sistema com conteúdo gerado por usuários de IA de qualidade inferior.

E lembre-se, a HCU de setembro pareceu incorporar UX à equação (o que tenho visto fortemente ao analisar muitos sites impactados). Portanto, barreiras à experiência do usuário, como anúncios agressivos, pop-ups, intersticiais e muito mais, podem contribuir para “conteúdo inútil”. Portanto, se você combinar conteúdo gerado pelo usuário de IA de baixa qualidade com uma experiência de usuário terrível, poderá ter um problema sério em suas mãos com o HCU em roaming na web. Cuidado.

A combinação de conteúdo inútil e UX terrível é o beijo da morte para a atualização de conteúdo útil do Google.


Concluindo: um aviso para proprietários de sites que aceitam UGC.
Novamente, eu queria abordar este tópico para qualquer site que publique conteúdo gerado pelo usuário. Mesmo se você tiver um site de maior escala com muito conteúdo, eu tomaria muito cuidado ao permitir qualquer tipo de conteúdo de baixa qualidade no site. E agora, com a facilidade das ferramentas de geração de conteúdo de IA, você deve ter cuidado ao permitir conteúdo de IA de baixa qualidade gerado pelo usuário no site. Mais uma vez, várias empresas entraram em contato depois de serem duramente atingidas, e isso era claramente parte do problema.

Encerrarei esta postagem com algumas dicas e recomendações para proprietários de sites:

  • Modere fortemente e com um toque de IA: se você aceita conteúdo gerado pelo usuário em seu site, você já deve estar moderando fortemente do ponto de vista da qualidade. Mas agora você também deve estar atento ao conteúdo de IA de qualidade inferior que está sendo enviado.
  • Ritmo de envio: um sinal de alerta pode ser o ritmo de envio de determinados usuários. Por exemplo, expliquei anteriormente que uma empresa me procurou depois de notificar envios que pareciam um pouco errados… Ao investigar esse usuário, houve um monte de envios em um período muito curto de tempo. E depois de executar esses envios por meio de ferramentas de detecção de conteúdo de IA, havia 100% de probabilidade de que esses envios fossem criados por meio de IA.
  • Laboratório de testes: recomendo a criação de um laboratório de testes que aproveite várias ferramentas de detecção de conteúdo de IA. As ferramentas não são perfeitas, mas são boas na detecção de conteúdo gerado por IA de qualidade inferior . Tenha um processo em vigor para verificar o conteúdo que foi sinalizado. E abordarei as APIs a seguir, que podem ajudar a verificar o conteúdo em massa.
  • APIs são suas amigas: algumas ferramentas de detecção de conteúdo de IA possuem APIs que permitem verificar o conteúdo em massa. Se você tem um site de grande escala, com muito conteúdo gerado pelo usuário, aproveitar uma API pode ser uma maneira inteligente de fazer isso. Por exemplo, GPTZero, Originality.ai e outros têm APIs que você pode aproveitar para verificar o conteúdo em grande escala.
  • Política de conteúdo de IA para conteúdo gerado pelo usuário: tenha uma política em vigor sobre conteúdo de IA que os usuários possam acessar e compreender facilmente. Certifique-se de que os usuários entendam o que é permitido e o que não é permitido, incluindo o que você fará se for detectado conteúdo de IA de baixa qualidade.
  • Em termos de indexação, seja rápido, seja decisivo: e, por fim, lide com os envios de IA rapidamente e certifique-se de que eles não sejam indexados (ou não permaneçam indexados). Como já abordei muitas vezes em postagens e apresentações sobre as principais atualizações de algoritmos, todas as páginas indexadas são levadas em consideração quando o Google avalia a qualidade. Portanto, concentre-se no que chamo de “indexação de qualidade” e certifique-se de que o conteúdo gerado pelo usuário com IA de qualidade inferior não seja indexado.

Resumo: Fique atento ao UGC com um toque de IA.
Para sites que aceitam conteúdo gerado pelo usuário, sempre foi importante moderar fortemente esse conteúdo do ponto de vista da qualidade. E agora, com as ferramentas de geração de conteúdo de IA, o UGC é mais complicado de lidar e a moderação ficou um pouco mais difícil. Recomendo revisar as dicas e recomendações fornecidas nesta postagem para criar um processo para sinalizar possíveis problemas e, em seguida, lidar com esses problemas rapidamente. Essa é a melhor maneira de manter níveis fortes de “indexação de qualidade”, o que é importante para evitar problemas com base em atualizações importantes de algoritmos, como atualizações de conteúdo útil e atualizações principais amplas.

GG