Aktualizacja Helpful Content Update (HCU) firmy Google i niebezpieczeństwo związane z treściami generowanymi przez sztuczną inteligencję o niskiej jakości

Opublikowany: 2023-11-06

E-mail

Zawiera wskazówki i zalecenia, które pomogą właścicielom witryn poruszać się po potrójnym obszarze AI UGC (wykrywanie, ilość i tempo treści generowanych przez użytkowników AI o niższej jakości).

Treści tworzone przez użytkowników AI i pomocna aktualizacja treści Google.

Termin „treści generowane przez użytkowników AI o niskiej jakości” to potoczne określenie, ale jest to ważny temat dla właścicieli witryn, którzy zezwalają na publikowanie treści UGC w swoich witrynach. Ostatnio natknąłem się na kilka trudnych sytuacji, opierając się na dokładnej analizie wrześniowej aktualizacji przydatnej zawartości (HCU). Nie sądzę, żeby ktokolwiek jeszcze poruszał temat wpływu UGC w przydatnej aktualizacji zawartości, więc chciałem szybko omówić to w tym poście.

Od premiery pierwszego HCU w sierpniu 2022 r. widziałem wiele przykładów treści AI niskiej jakości, które mocno ucierpiały. Wspomniałem o tym kilka razy, dzieląc się informacjami o spadkach z HCU z sierpnia 2022 r., HCU z grudnia 2022 r., a teraz z bardziej agresywnym HCU(X) z września. Chodziło jednak raczej o to, że właściciel witryny intensywnie korzystał ze sztucznej inteligencji do publikowania treści o niższej jakości (i nieprzydatnych) we własnej witrynie. Dlatego z biegiem czasu witryny zawierały dużo treści AI o niższej jakości i zostały dotknięte przez HCU.

Dzisiaj mam na myśli to, że inne osoby dodają do Twojej witryny treści AI o niższej jakości za pośrednictwem UGC. Innymi słowy, co się stanie, jeśli osoby przesyłające treści generowane przez użytkowników używają sztucznej inteligencji do szybkiego tworzenia tych treści? A co, jeśli te treści są niższej jakości, nie są edytowane w celu dodania wartości, nie są dopracowane tak, aby były naprawdę wnikliwe itp.? Tak, to może być problematyczne, a właściciele witryn, którzy pozwalają na UGC, zaczynają zauważać, że ten problem się nasila. W przypadku niektórych witryn, które skontaktowały się ze mną po wrześniowym HCU, zostały one bardzo mocno dotknięte i znacznie spadły w wyszukiwarce.

Przypomnienie o stanowisku Google w sprawie treści AI: chodzi o jakość.
Należy pamiętać, że Google nie jest przeciwny wszystkim treściom opartym na sztucznej inteligencji. Jest to sprzeczne z treściami AI o niskiej jakości . Jeśli więc ktoś korzysta ze sztucznej inteligencji do tworzenia treści, a następnie edytuje i udoskonala tę treść, aby mieć pewność, że jest dokładna, wartościowa itp., może to być całkowicie w porządku. Jeśli jednak ktoś po prostu eksportuje treści generowane przez sztuczną inteligencję i publikuje je na dużą skalę, podwyższa poziom swojej witryny, aby została zniszczona przez przydatną aktualizację treści lub nawet obszerną aktualizację podstawową.

Oto akapit z postu Google na temat treści AI, w którym Danny Sullivan wyjaśnia, że problem dotyczy treści AI , których głównym celem jest manipulowanie pozycją w wynikach wyszukiwania :

Podstępne rozprzestrzenianie się niskiej jakości treści AI generowanych przez użytkowników:
Moim zdaniem i na podstawie tego, co widziałem podczas analizy wielu witryn, na które wpływa HCU, treści AI niskiej jakości na dużą skalę mogą być niezwykle niebezpieczne. A jeśli UGC jest podstawową częścią treści Twojej witryny, musisz uważnie zwracać uwagę na jakość. Tak było w przypadku treści UGC przez bardzo długi czas, ale teraz użytkownikom znacznie łatwiej jest wykorzystywać narzędzia do tworzenia sztucznej inteligencji do tworzenia odpowiedzi na forach, stronach z pytaniami i odpowiedziami i nie tylko.

I tylko dlatego, że ktoś inny umieścił treść w Twojej witrynie, nadal ponosisz za to odpowiedzialność. Google wyjaśniał to wiele razy na przestrzeni lat. Poniżej zamieściłem tylko jeden z kilku tweetów, które udostępniałem przez lata na temat Google, wyjaśniając, że UGC będzie brane pod uwagę przy ocenie jakości. Jeśli znajduje się on w Twojej witrynie i jest zaindeksowany, jest on brany pod uwagę przy ocenie jakości.

To powinno brzmieć znajomo… skoro John powtarzał to *od zawsze*. Jeśli treść znajduje się na Twojej stronie, może zostać wzięta pod uwagę przy ocenie jakości Google. Nie ma znaczenia, czy jest to UGC (i tego nie napisałeś). Właściciele witryn powinni intensywnie moderować. https://t.co/g9KSkHhVPF
— Glenn Gabe (@glengabe) 22 sierpnia 2022 r

Umiarkowane UGC Mocno:
Od czasów średniowiecznych Pand (około 2011 r.) zawsze wyjaśniałem, że właściciele witryn muszą intensywnie moderować treści generowane przez użytkowników. Jeśli nie, z czasem treści o niższej jakości mogą się wkradać i narastać. A kiedy tak się stanie, konfigurujesz swoją witrynę tak, aby została poważnie dotknięta poważną aktualizacją algorytmu. Moja rada jest teraz taka sama, ale z lekkim urozmaiceniem AI. Teraz będę również szukać treści AI o niższej jakości, a nie tylko typowego spamu UGC. Najlepsze narzędzia do wykrywania treści AI są stale udoskonalane i mogą pomóc w oznaczaniu treści z dużym prawdopodobieństwem, że zostały utworzone za pomocą sztucznej inteligencji.

Poniżej przedstawię kilka wskazówek dla właścicieli witryn, którzy mogą mieć do czynienia z treściami generowanymi przez sztuczną inteligencję o niższej jakości. Ponownie skontaktowałem się z kilkoma witrynami, w których problem ten narastał w ciągu ostatniego roku…

Wykrywanie, głośność i tempo: potrójna sztuczna inteligencja UGC
Oprócz identyfikowania treści generowanych przez sztuczną inteligencję możesz sprawdzić liczbę odpowiedzi użytkowników i tempo, w jakim te odpowiedzi są przesyłane. Niedawno skontaktował się ze mną jeden z właścicieli witryny, pokazując użytkownikowi, który przesłał wiele odpowiedzi w krótkim czasie. Po sprawdzeniu tych odpowiedzi za pomocą narzędzia do wykrywania treści opartego na sztucznej inteligencji wszystkie uzyskały 100% prawdopodobieństwo, że treść została utworzona za pomocą sztucznej inteligencji. Na przykład poniżej możesz zobaczyć dwa z tych zgłoszeń.

Przykład treści generowanych przez użytkowników AI wykrytych przez Originality.ai

Drugi przykład treści generowanych przez użytkowników AI wykrytych przez Originality.ai

Zatem połączenie objętości, tempa i dość oczywistej zawartości sztucznej inteligencji dało dobry przykład użytkownika wykorzystującego sztuczną inteligencję do wypompowania ton treści UGC w danej witrynie.

Należy pamiętać, że jest to witryna o dużej skali, więc ten jeden użytkownik prawdopodobnie miałby niewielki wpływ. Jednak z biegiem czasu, jeśli inni użytkownicy zrobią to samo, może to absolutnie spowodować problemy z punktu widzenia jakości. Właściciel witryny mądrze postąpił i skontaktował się ze mną w tej sprawie. Zajmowali się tym użytkownikiem i być może opracowali proces identyfikowania wzorców, który mógłby pomóc wydobyć osoby próbujące grać w systemie z użyciem treści generowanych przez użytkowników AI o niższej jakości.

I pamiętajcie, że wrześniowe HCU zdawało się uwzględniać UX w równaniu (co wyraźnie zauważyłem, analizując wiele witryn, których to dotyczy). Dlatego bariery w doświadczeniach użytkowników, takie jak agresywne reklamy, wyskakujące okienka, reklamy pełnoekranowe i inne, mogą przyczyniać się do tworzenia „nieprzydatnych treści”. Jeśli więc połączysz niskiej jakości treści generowane przez użytkowników AI z okropnym UX, możesz mieć poważny problem z HCU wędrującym po sieci. Strzec się.

Połączenie nieprzydatnej treści i okropnego UX to pocałunek śmierci dla przydatnej aktualizacji treści Google.

Podsumowanie: ostrzeżenie dla właścicieli witryn, którzy akceptują treści UGC.
Ponownie chciałem omówić ten temat w przypadku każdej witryny publikującej treści generowane przez użytkowników. Nawet jeśli masz witrynę o większej skali i zawierającą mnóstwo treści, byłbym bardzo ostrożny, jeśli chodzi o umieszczanie w niej treści o niskiej jakości. Teraz, dzięki łatwości narzędzi do generowania treści AI, należy zachować ostrożność, aby nie udostępniać w witrynie treści generowanych przez użytkowników AI o niskiej jakości. Powtórzę: kilka firm skontaktowało się ze mną po mocnym uderzeniu i to niewątpliwie stanowiło część problemu.

Zakończę ten post kilkoma wskazówkami i zaleceniami dla właścicieli witryn:

Intensywnie moderuj z dodatkiem sztucznej inteligencji: jeśli akceptujesz w swojej witrynie treści generowane przez użytkowników, powinieneś już intensywnie moderować z punktu widzenia jakości. Ale teraz powinieneś także zwracać uwagę na przesyłane treści AI o niższej jakości.
Tempo przesyłania: Jedną z sygnałów ostrzegawczych może być tempo przesyłania przez niektórych użytkowników. Na przykład wyjaśniłem wcześniej, że firma, która skontaktowała się ze mną po powiadomieniu o zgłoszeniach, które wydawały się nieco nieodpowiednie… Gdy zagłębiłem się w dane tego użytkownika, w bardzo krótkim czasie pojawiło się wiele zgłoszeń. Po sprawdzeniu tych zgłoszeń za pomocą narzędzi do wykrywania treści AI istniało 100% prawdopodobieństwo, że zostały one utworzone za pomocą sztucznej inteligencji.
Laboratorium testowe: Polecam utworzenie laboratorium testowego, które wykorzystuje kilka narzędzi do wykrywania treści AI. Narzędzia nie są doskonałe, ale dobrze radzą sobie z wykrywaniem treści generowanych przez sztuczną inteligencję o niższej jakości . Należy wdrożyć proces sprawdzania oznaczonych treści. Następnie omówię interfejsy API, które mogą pomóc w zbiorczym sprawdzaniu treści.
Interfejsy API są Twoim przyjacielem: niektóre narzędzia do wykrywania treści AI mają interfejsy API, które umożliwiają zbiorcze sprawdzanie treści. Jeśli masz witrynę o dużej skali i zawierającą dużo treści generowanych przez użytkowników, dobrym rozwiązaniem może być wykorzystanie interfejsu API. Na przykład GPTZero, Originality.ai i inne mają interfejsy API, które można wykorzystać do sprawdzania treści na dużą skalę.
Polityka dotycząca treści AI dla treści generowanych przez użytkowników: Należy wdrożyć zasady dotyczące treści AI, do których użytkownicy mają dostęp i które są łatwo zrozumiałe. Upewnij się, że użytkownicy rozumieją, co jest dozwolone, a co nie , w tym co zrobią w przypadku wykrycia treści AI o niskiej jakości.
Jeśli chodzi o indeksowanie, bądź szybki, bądź zdecydowany: i na koniec szybko zajmij się zgłoszeniami AI i upewnij się, że nie zostaną zaindeksowane (lub nie pozostaną indeksowane). Jak już wielokrotnie pisałem w postach i prezentacjach na temat głównych aktualizacji algorytmów, wszystkie zaindeksowane strony są brane pod uwagę podczas oceny jakości przez Google. Skoncentruj się więc na tym, co nazywam „indeksowaniem jakości” i upewnij się, że treści generowane przez użytkowników AI o niższej jakości nie zostaną zaindeksowane.

Podsumowanie: Uważaj na treści UGC z elementami sztucznej inteligencji.
W przypadku witryn akceptujących treści tworzone przez użytkowników zawsze ważne było ich intensywne moderowanie ze względu na jakość. A teraz, dzięki narzędziom do generowania treści AI, radzenie sobie z UGC jest teraz trudniejsze, a moderacja stała się nieco trudniejsza. Zalecam zapoznanie się ze wskazówkami i zaleceniami podanymi w tym poście, aby stworzyć proces oznaczania potencjalnych problemów, a następnie szybkiego rozwiązywania tych problemów. To najlepszy sposób na utrzymanie wysokiego poziomu „indeksowania jakości”, co jest ważne, aby uniknąć problemów związanych z głównymi aktualizacjami algorytmów, takimi jak aktualizacja przydatnej zawartości i ogólne aktualizacje podstawowe.

GG