La actualización de contenido útil (HCU) de Google y el peligro del contenido generado por el usuario con IA de baja calidad

Publicado: 2023-11-06

Correo electrónico

Incluye consejos y recomendaciones para ayudar a los propietarios de sitios a navegar por el triple UGC de IA (detección, volumen y ritmo de contenido generado por usuarios de IA de menor calidad).

Contenido generado por el usuario con IA y actualización de contenido útil de Google.

El término “contenido generado por usuarios de IA de baja calidad” es complicado, pero es un tema importante para los propietarios de sitios que permiten que se publique UGC en sus sitios. Y recientemente me he encontrado con varias situaciones difíciles basadas en un análisis exhaustivo de la actualización de contenido útil (HCU) de septiembre. No creo que nadie haya cubierto todavía el tema del impacto de UGC con la útil actualización de contenido, así que quería cubrirlo rápidamente en esta publicación.

Desde el lanzamiento de la primera HCU en agosto de 2022, he visto muchos ejemplos de contenido de IA de baja calidad que se han visto gravemente afectados. Mencioné esto varias veces al compartir sobre las caídas con la HCU de agosto de 2022, la HCU de diciembre de 2022 y ahora con la HCU(X) de septiembre más agresiva. Pero se trataba más bien de que el propietario del sitio utilizaba en gran medida la IA para publicar contenido de menor calidad (e inútil) en su propio sitio. Entonces, con el tiempo, los sitios terminaron con una gran cantidad de contenido de IA de menor calidad y fueron afectados por la HCU.

A lo que me refiero hoy es a que otras personas agreguen contenido de IA de menor calidad a su sitio a través de UGC. En otras palabras, ¿qué pasa si las personas que envían contenido generado por el usuario utilizan IA para crear rápidamente ese contenido? ¿Y qué pasa si ese contenido es de menor calidad, no está editado para agregar valor, no está refinado para ser verdaderamente revelador, etc.? Sí, eso puede ser problemático, y los propietarios de sitios que permiten UGC están empezando a ver cómo este problema aumenta. Y algunos sitios que se comunicaron conmigo después de la HCU de septiembre, se vieron muy afectados y su visibilidad de búsqueda disminuyó considerablemente.

Un recordatorio sobre la postura de Google sobre el contenido de IA: se trata de calidad.
Es importante recordar que Google no está en contra de todo el contenido de IA. Va en contra del contenido de IA de baja calidad . Entonces, si alguien usa IA para ayudarlo a crear contenido, y lo edita y refina para asegurarse de que sea preciso, valioso, etc., entonces eso podría estar totalmente bien. Pero si alguien simplemente exporta contenido generado por IA y lo publica a escala, entonces está preparando su sitio para que lo elimine la útil actualización de contenido o incluso una actualización central amplia.

Aquí hay un párrafo de la publicación de Google sobre contenido de IA donde Danny Sullivan explica que el contenido de IA con el propósito principal de manipular la clasificación en los resultados de búsqueda es con lo que tienen problemas:

La postura de Google sobre el contenido de IA.

El insidioso avance del contenido de IA de baja calidad generado por los usuarios:
En mi opinión, y según lo que he visto al analizar muchos sitios afectados por la HCU, el contenido de IA de baja calidad a escala puede ser increíblemente peligroso. Y si UGC es una parte fundamental del contenido de su sitio, entonces debe vigilar de cerca la calidad. Ese ha sido el caso con UGC durante mucho tiempo, pero ahora es mucho más fácil para los usuarios aprovechar las herramientas de creación de IA para elaborar respuestas en foros, sitios de preguntas y respuestas y más.

Y sólo porque otra persona publicó el contenido en su sitio, usted sigue siendo responsable. Google lo ha explicado muchas veces a lo largo de los años. A continuación he incluido sólo uno de varios tweets que he compartido a lo largo de los años sobre Google explicando que el UGC se contará al evaluar la calidad. Si está en su sitio y está indexado, se cuenta al evaluar la calidad.

Esto debería sonar familiar... ya que John ha estado diciendo esto *desde siempre*. Si el contenido está en su sitio, se puede tener en cuenta cuando Google evalúa la calidad. No importa si es UGC (y no lo escribiste). Los propietarios del sitio deberían moderar mucho. https://t.co/g9KSkHhVPF
– Glenn Gabe (@glenngabe) 22 de agosto de 2022

CGU moderado En gran medida:
Desde la época medieval de Panda (alrededor de 2011), siempre he explicado que los propietarios de sitios deben moderar en gran medida el contenido generado por los usuarios. De lo contrario, el contenido de menor calidad puede aparecer y desarrollarse con el tiempo. Y cuando eso sucede, estás configurando tu sitio para que se vea muy afectado por una actualización importante del algoritmo. Así que mi consejo es el mismo ahora, pero con un ligero toque de IA. Ahora también estaría atento a contenido de IA de menor calidad y no solo al típico spam UGC. Las principales herramientas de detección de contenido de IA continúan mejorando y pueden ayudar a marcar contenido con una alta probabilidad de que haya sido creado mediante IA.

A continuación, cubriré algunos consejos para propietarios de sitios que podrían estar lidiando con contenido generado por usuarios de IA de menor calidad. Una vez más, he tenido contacto con varios sitios en los que ese problema ha ido surgiendo durante el último año...

Detección, volumen y ritmo: el triple UGC de IA
Más allá de simplemente identificar el contenido generado por IA, puede verificar el volumen de respuestas de los usuarios y el ritmo al que se envían esas respuestas. El propietario de un sitio se acercó a mí recientemente para mostrarme a un usuario que envió muchas respuestas en un corto período de tiempo. Al ejecutar esas respuestas a través de una herramienta de detección de contenido de IA, todas regresaron con un 100% de probabilidad de que el contenido se haya creado mediante IA. Por ejemplo, puede ver dos de esos envíos a continuación.

Ejemplo de contenido de IA generado por usuarios detectado por Originality.ai

Un segundo ejemplo de contenido de IA generado por usuarios detectado por Originality.ai

Entonces, la combinación de volumen, ritmo y contenido de IA bastante obvio produjo un buen ejemplo de un usuario que aprovecha la IA para generar una tonelada de UGC en el sitio en cuestión.

Tenga en cuenta que es un sitio de gran escala, por lo que este usuario probablemente tendría poco impacto. Pero con el tiempo, si otros usuarios hicieran lo mismo, podría causar problemas desde el punto de vista de la calidad. El propietario del sitio fue inteligente al comunicarse conmigo sobre esto. Manejaron a ese usuario y podrían desarrollar un proceso para identificar patrones que podrían ayudar a descubrir a las personas que intentan engañar al sistema con contenido generado por el usuario de IA de menor calidad.

Y recuerde, la HCU de septiembre pareció incorporar UX en la ecuación (lo que he visto en gran medida al analizar muchos sitios afectados). Por lo tanto, las barreras en la experiencia del usuario, como anuncios agresivos, ventanas emergentes, intersticiales y más, pueden contribuir a generar "contenido inútil". Entonces, si combina contenido de IA de baja calidad generado por el usuario con una experiencia de usuario terrible, podría tener un problema grave con la HCU deambulando por la web. Tener cuidado.

La combinación de contenido inútil y una experiencia de usuario terrible es el beso de la muerte para la útil actualización de contenido de Google.

Conclusión: una advertencia para los propietarios de sitios que aceptan UGC.
Nuevamente, quería cubrir este tema para cualquier sitio que publique contenido generado por el usuario. Incluso si tiene un sitio de mayor escala con una gran cantidad de contenido, tendría mucho cuidado al permitir cualquier tipo de contenido de baja calidad en el sitio. Y ahora, con la facilidad de las herramientas de generación de contenido de IA, debe tener cuidado de no permitir que contenido de baja calidad generado por el usuario de IA ingrese al sitio. Una vez más, varias empresas se acercaron después de haber sido duramente afectadas, y eso fue claramente parte del problema.

Terminaré esta publicación con algunos consejos y recomendaciones para propietarios de sitios:

Modere mucho y con un toque de inteligencia artificial: si acepta contenido generado por el usuario en su sitio, ya debería estar moderando mucho desde una perspectiva de calidad. Pero ahora también debería estar atento al contenido de IA de menor calidad que se envía.
Ritmo de envío: una señal de alerta podría ser el ritmo de envío de ciertos usuarios. Por ejemplo, expliqué anteriormente que una empresa que se comunicó conmigo después de notar envíos que parecían un poco fuera de lugar... Al investigar a ese usuario, hubo un montón de envíos en un período de tiempo muy corto. Y después de ejecutar esos envíos a través de herramientas de detección de contenido de IA, había un 100% de probabilidad de que esos envíos se crearan a través de IA.
Laboratorio de pruebas: recomiendo crear un laboratorio de pruebas que aproveche varias herramientas de detección de contenido de IA. Las herramientas no son perfectas, pero son buenas para detectar contenido generado por IA de menor calidad . Tenga implementado un proceso para verificar el contenido que ha sido marcado. Y a continuación cubriré las API, que pueden ayudar a verificar el contenido de forma masiva.
Las API son tus amigas: algunas herramientas de detección de contenido de IA tienen API que te permiten verificar el contenido de forma masiva. Si tiene un sitio a gran escala, con una gran cantidad de contenido generado por el usuario, aprovechar una API podría ser una forma inteligente de hacerlo. Por ejemplo, GPTZero, Originality.ai y otros tienen API que puede aprovechar para verificar contenido a escala.
Política de contenido de IA para contenido generado por el usuario: establezca una política sobre el contenido de IA al que los usuarios puedan acceder y comprender fácilmente. Asegúrese de que los usuarios comprendan lo que está permitido y lo que no , incluido lo que hará si se detecta contenido de IA de baja calidad.
En cuanto a la indexación, sea rápido, sea decisivo: y finalmente, ocúpese de los envíos de IA rápidamente y asegúrese de que no se indexen (o no permanezcan indexados). Como he cubierto muchas veces en publicaciones y presentaciones sobre actualizaciones importantes de algoritmos, todas las páginas indexadas se tienen en cuenta cuando Google evalúa la calidad. Así que concéntrese en lo que yo llamo “indexación de calidad” y asegúrese de que el contenido generado por usuarios de IA de menor calidad no se indexe.

Resumen: Esté atento al UGC con un toque de IA.
Para los sitios que aceptan contenido generado por el usuario, siempre ha sido importante moderar en gran medida ese contenido desde una perspectiva de calidad. Y ahora, con las herramientas de generación de contenido de IA, el UGC es más complicado de manejar y la moderación se ha vuelto un poco más difícil. Recomiendo revisar los consejos y recomendaciones que proporcioné en esta publicación para crear un proceso para señalar problemas potenciales y luego manejarlos rápidamente. Esa es la mejor manera de mantener niveles sólidos de "indexación de calidad", lo cual es importante para evitar problemas basados en actualizaciones importantes de algoritmos, como la actualización de contenido útil y las actualizaciones principales generales.

GG