L'Helpful Content Update (HCU) di Google e il pericolo dei contenuti generati dagli utenti con intelligenza artificiale di bassa qualità

Pubblicato: 2023-11-06
E-mail

Inclusi suggerimenti e raccomandazioni per aiutare i proprietari dei siti a orientarsi nel triplo UGC dell'AI (rilevamento, volume e ritmo dei contenuti generati dagli utenti dell'IA di qualità inferiore).

Contenuti generati dagli utenti tramite intelligenza artificiale e utile aggiornamento dei contenuti di Google.


Il termine "contenuti generati dagli utenti con intelligenza artificiale di bassa qualità" è un parolone, ma è un argomento importante per i proprietari di siti che consentono la pubblicazione di UGC sui loro siti. E recentemente mi sono imbattuto in diverse situazioni difficili basate sull'analisi approfondita dell'aggiornamento dei contenuti utili di settembre (HCU). Non credo che nessuno abbia ancora trattato l'argomento dell'impatto degli UGC con l'utile aggiornamento dei contenuti, quindi volevo trattarlo rapidamente in questo post.

Dal lancio del primo HCU nell’agosto del 2022, ho visto molti esempi di contenuti AI di bassa qualità essere colpiti duramente. Ne ho parlato più volte quando ho condiviso i cali con l'HCU di agosto 2022, l'HCU di dicembre 2022 e ora con il più aggressivo HCU di settembre (X). Ma si trattava più del fatto che il proprietario del sito utilizzava pesantemente l’intelligenza artificiale per pubblicare contenuti di qualità inferiore (e inutili) sul proprio sito. Pertanto, nel corso del tempo i siti si sono ritrovati con molti contenuti AI di qualità inferiore e sono stati colpiti dall'HCU.

Ciò a cui mi riferisco oggi riguarda altre persone che aggiungono contenuti AI di qualità inferiore al tuo sito tramite UGC. In altre parole, cosa succederebbe se le persone che inviano contenuti generati dagli utenti utilizzassero l’intelligenza artificiale per creare rapidamente tali contenuti? E cosa succederebbe se il contenuto fosse di qualità inferiore, non modificato per aggiungere valore, non perfezionato per essere veramente approfondito, ecc.? Sì, questo può essere problematico e i proprietari di siti che consentono gli UGC stanno iniziando a vedere questo problema insinuarsi. E per alcuni siti che mi hanno contattato dopo l'HCU di settembre, sono stati colpiti molto duramente e hanno perso pesantemente visibilità nelle ricerche.

Un promemoria sulla posizione di Google sui contenuti AI: è una questione di qualità.
È importante ricordare che Google non è contrario a tutti i contenuti basati sull'intelligenza artificiale. È contro i contenuti IA di bassa qualità . Quindi, se qualcuno utilizza l'intelligenza artificiale per creare contenuti e modifica e perfeziona tali contenuti per assicurarsi che siano accurati, preziosi, ecc., allora potrebbe andare benissimo. Ma se qualcuno sta semplicemente esportando contenuti generati dall’intelligenza artificiale e pubblicandoli su larga scala, allora sta preparando il proprio sito per essere cancellato dall’utile aggiornamento dei contenuti o anche da un ampio aggiornamento di base.

Ecco un paragrafo del post di Google sui contenuti AI in cui Danny Sullivan spiega che i contenuti AI con lo scopo principale di manipolare il posizionamento nei risultati di ricerca sono ciò con cui hanno problemi:

La posizione di Google sui contenuti AI.


L'insidioso fenomeno dei contenuti IA di bassa qualità generati dagli utenti:
A mio parere, e in base a ciò che ho visto analizzando molti siti interessati dall’HCU, i contenuti AI di bassa qualità su larga scala possono essere incredibilmente pericolosi. E se gli UGC sono una parte fondamentale dei contenuti del tuo sito, allora devi tenere d'occhio la qualità. Questo è il caso degli UGC da molto tempo, ma ora è molto più semplice per gli utenti sfruttare gli strumenti di creazione dell'intelligenza artificiale per creare risposte su forum, siti di domande e risposte e altro ancora.

E solo perché qualcun altro ha pubblicato il contenuto sul tuo sito, sei comunque responsabile. Google lo ha spiegato più volte nel corso degli anni. Di seguito ho incluso solo uno dei numerosi tweet che ho condiviso nel corso degli anni su Google in cui spiegava che gli UGC verranno conteggiati nella valutazione della qualità. Se è sul tuo sito ed è indicizzato, viene conteggiato nella valutazione della qualità.


UGC moderati e molto:
Sin dai tempi medievali di Panda (circa 2011), ho sempre spiegato che i proprietari dei siti devono moderare pesantemente i contenuti generati dagli utenti. In caso contrario, contenuti di qualità inferiore possono insinuarsi e accumularsi nel tempo. E quando ciò accade, stai impostando il tuo sito per essere colpito duramente da un importante aggiornamento dell’algoritmo. Quindi il mio consiglio è lo stesso ora, ma con una leggera svolta nell’IA. Ora sarei anche alla ricerca di contenuti AI di qualità inferiore e non solo del tipico spam UGC. I principali strumenti di rilevamento dei contenuti basati sull'intelligenza artificiale continuano a migliorare e possono aiutare a contrassegnare i contenuti con un'alta probabilità che siano stati creati tramite l'intelligenza artificiale.

Di seguito, tratterò alcuni suggerimenti per i proprietari di siti che potrebbero avere a che fare con contenuti generati dagli utenti con intelligenza artificiale di qualità inferiore. Ancora una volta, ho contattato diversi siti in cui il problema si è manifestato nell'ultimo anno o giù di lì...

Rilevamento, volume e ritmo: il triplo UGC dell'AI
Oltre a identificare semplicemente i contenuti generati dall'intelligenza artificiale, puoi controllare il volume delle risposte degli utenti e il ritmo con cui tali risposte vengono inviate. Il proprietario di un sito mi ha contattato di recente mostrandomi un utente che ha inviato molte risposte in un breve periodo di tempo. Quando si eseguivano tali risposte tramite uno strumento di rilevamento dei contenuti AI, tutte tornavano con una probabilità del 100% che il contenuto fosse stato creato tramite AI. Ad esempio, puoi vedere due di questi invii di seguito.

Esempio di contenuti generati dagli utenti ai rilevati da Originality.ai
Un secondo esempio di contenuti generati dagli utenti ai rilevati da Originality.ai


Quindi la combinazione di volume, ritmo e contenuto AI abbastanza ovvio ha prodotto un buon esempio di un utente che sfrutta l’IA per pompare una tonnellata di UGC sul sito in questione.

Tieni presente che si tratta di un sito su larga scala, quindi questo utente probabilmente avrebbe un impatto minimo. Ma nel tempo, se altri utenti facessero lo stesso, ciò potrebbe assolutamente causare problemi dal punto di vista della qualità. Il proprietario del sito è stato intelligente nel contattarmi a riguardo. Hanno gestito quell'utente e potrebbero sviluppare un processo per identificare modelli che potrebbero aiutare a far emergere le persone che cercano di ingannare il sistema con contenuti generati dagli utenti con intelligenza artificiale di qualità inferiore.

E ricorda, l'HCU di settembre sembrava incorporare l'UX nell'equazione (cosa che ho visto pesantemente analizzando molti siti interessati). Pertanto, le barriere relative all'esperienza utente come annunci aggressivi, popup, interstitial e altro ancora possono contribuire alla creazione di "contenuti inutili". Quindi, se combini contenuti generati dagli utenti di intelligenza artificiale di bassa qualità con una pessima UX, potresti avere un problema serio tra le mani con l'HCU in roaming sul web. Attenzione.

La combinazione di contenuti inutili e pessima UX è il bacio della morte per l'utile aggiornamento dei contenuti di Google.


In conclusione: un avviso per i proprietari di siti che accettano UGC.
Ancora una volta, volevo trattare questo argomento per qualsiasi sito che pubblica contenuti generati dagli utenti. Anche se hai un sito su larga scala con moltissimi contenuti, starei molto attento a lasciare sul sito qualsiasi tipo di contenuto di bassa qualità. E ora, con la facilità degli strumenti di generazione di contenuti AI, dovresti stare attento a lasciare sul sito contenuti generati dagli utenti AI di bassa qualità. Ancora una volta, diverse aziende mi hanno contattato dopo essere state colpite duramente, e questo era chiaramente parte del problema.

Concluderò questo post con alcuni suggerimenti e raccomandazioni per i proprietari di siti:

  • Modera pesantemente e con un tocco di intelligenza artificiale: se accetti contenuti generati dagli utenti sul tuo sito, dovresti già moderare pesantemente dal punto di vista della qualità. Ma ora dovresti anche prestare attenzione ai contenuti AI di qualità inferiore che vengono inviati.
  • Ritmo di invio: un campanello d'allarme potrebbe essere il ritmo di invio da parte di alcuni utenti. Ad esempio, ho spiegato in precedenza che un'azienda che mi ha contattato dopo aver notato alcuni invii che sembravano un po' fuori luogo... Analizzando quell'utente, ci sono stati un sacco di invii in un periodo di tempo molto breve. E dopo aver eseguito tali invii tramite strumenti di rilevamento dei contenuti basati sull'intelligenza artificiale, c'era una probabilità del 100% che tali invii fossero stati creati tramite l'intelligenza artificiale.
  • Laboratorio di test: consiglio di creare un laboratorio di test che sfrutti diversi strumenti di rilevamento dei contenuti AI. Gli strumenti non sono perfetti, ma sono efficaci nel rilevare contenuti generati dall’intelligenza artificiale di qualità inferiore . Avere un processo in atto per controllare i contenuti che sono stati contrassegnati. Successivamente tratterò delle API, che possono aiutare a controllare i contenuti in blocco.
  • Le API sono tue amiche: alcuni strumenti di rilevamento dei contenuti basati sull'intelligenza artificiale dispongono di API che ti consentono di controllare i contenuti in blocco. Se disponi di un sito su larga scala, con molti contenuti generati dagli utenti, sfruttare un'API potrebbe essere una strada intelligente da percorrere. Ad esempio, GPTZero, Originality.ai e altri dispongono di API che puoi sfruttare per controllare i contenuti su larga scala.
  • Policy sui contenuti AI per i contenuti generati dagli utenti: disporre di una policy sui contenuti AI a cui gli utenti possano accedere e comprendere facilmente. Assicurati che gli utenti capiscano cosa è consentito e cosa non è consentito, incluso cosa farai se vengono rilevati contenuti AI di bassa qualità.
  • Per quanto riguarda l'indicizzazione, sii veloce, sii deciso: infine, gestisci rapidamente gli invii dell'IA e assicurati che non vengano indicizzati (o non rimangano indicizzati). Come ho spiegato molte volte in post e presentazioni sui principali aggiornamenti dell’algoritmo, tutte le pagine indicizzate vengono prese in considerazione quando Google valuta la qualità. Quindi concentrati su ciò che chiamo “indicizzazione di qualità” e assicurati che i contenuti generati dagli utenti con intelligenza artificiale di qualità inferiore non vengano indicizzati.

Riepilogo: fai attenzione agli UGC con un tocco di intelligenza artificiale.
Per i siti che accettano contenuti generati dagli utenti, è sempre stato importante moderare fortemente tali contenuti dal punto di vista della qualità. E ora, con gli strumenti di generazione di contenuti basati sull’intelligenza artificiale, gli UGC sono diventati più complicati da gestire e la moderazione è diventata un po’ più difficile. Consiglio di rivedere i suggerimenti e i consigli forniti in questo post per creare un processo per segnalare potenziali problemi e quindi gestirli rapidamente. Questo è il modo migliore per mantenere elevati livelli di "indicizzazione della qualità", che è importante per evitare problemi basati su importanti aggiornamenti dell'algoritmo come l'utile aggiornamento dei contenuti e gli ampi aggiornamenti di base.

GG