Aktualizacja Helpful Content Update (HCU) firmy Google i niebezpieczeństwo związane z treściami generowanymi przez sztuczną inteligencję o niskiej jakości
Opublikowany: 2023-11-06Zawiera wskazówki i zalecenia, które pomogą właścicielom witryn poruszać się po potrójnym obszarze AI UGC (wykrywanie, ilość i tempo treści generowanych przez użytkowników AI o niższej jakości).
Termin „treści generowane przez użytkowników AI o niskiej jakości” to potoczne określenie, ale jest to ważny temat dla właścicieli witryn, którzy zezwalają na publikowanie treści UGC w swoich witrynach. Ostatnio natknąłem się na kilka trudnych sytuacji, opierając się na dokładnej analizie wrześniowej aktualizacji przydatnej zawartości (HCU). Nie sądzę, żeby ktokolwiek jeszcze poruszał temat wpływu UGC w przydatnej aktualizacji zawartości, więc chciałem szybko omówić to w tym poście.
Od premiery pierwszego HCU w sierpniu 2022 r. widziałem wiele przykładów treści AI niskiej jakości, które mocno ucierpiały. Wspomniałem o tym kilka razy, dzieląc się informacjami o spadkach z HCU z sierpnia 2022 r., HCU z grudnia 2022 r., a teraz z bardziej agresywnym HCU(X) z września. Chodziło jednak raczej o to, że właściciel witryny intensywnie korzystał ze sztucznej inteligencji do publikowania treści o niższej jakości (i nieprzydatnych) we własnej witrynie. Dlatego z biegiem czasu witryny zawierały dużo treści AI o niższej jakości i zostały dotknięte przez HCU.
Dzisiaj mam na myśli to, że inne osoby dodają do Twojej witryny treści AI o niższej jakości za pośrednictwem UGC. Innymi słowy, co się stanie, jeśli osoby przesyłające treści generowane przez użytkowników używają sztucznej inteligencji do szybkiego tworzenia tych treści? A co, jeśli te treści są niższej jakości, nie są edytowane w celu dodania wartości, nie są dopracowane tak, aby były naprawdę wnikliwe itp.? Tak, to może być problematyczne, a właściciele witryn, którzy pozwalają na UGC, zaczynają zauważać, że ten problem się nasila. W przypadku niektórych witryn, które skontaktowały się ze mną po wrześniowym HCU, zostały one bardzo mocno dotknięte i znacznie spadły w wyszukiwarce.
Przypomnienie o stanowisku Google w sprawie treści AI: chodzi o jakość.
Należy pamiętać, że Google nie jest przeciwny wszystkim treściom opartym na sztucznej inteligencji. Jest to sprzeczne z treściami AI o niskiej jakości . Jeśli więc ktoś korzysta ze sztucznej inteligencji do tworzenia treści, a następnie edytuje i udoskonala tę treść, aby mieć pewność, że jest dokładna, wartościowa itp., może to być całkowicie w porządku. Jeśli jednak ktoś po prostu eksportuje treści generowane przez sztuczną inteligencję i publikuje je na dużą skalę, podwyższa poziom swojej witryny, aby została zniszczona przez przydatną aktualizację treści lub nawet obszerną aktualizację podstawową.
Oto akapit z postu Google na temat treści AI, w którym Danny Sullivan wyjaśnia, że problem dotyczy treści AI , których głównym celem jest manipulowanie pozycją w wynikach wyszukiwania :
Podstępne rozprzestrzenianie się niskiej jakości treści AI generowanych przez użytkowników:
Moim zdaniem i na podstawie tego, co widziałem podczas analizy wielu witryn, na które wpływa HCU, treści AI niskiej jakości na dużą skalę mogą być niezwykle niebezpieczne. A jeśli UGC jest podstawową częścią treści Twojej witryny, musisz uważnie zwracać uwagę na jakość. Tak było w przypadku treści UGC przez bardzo długi czas, ale teraz użytkownikom znacznie łatwiej jest wykorzystywać narzędzia do tworzenia sztucznej inteligencji do tworzenia odpowiedzi na forach, stronach z pytaniami i odpowiedziami i nie tylko.
I tylko dlatego, że ktoś inny umieścił treść w Twojej witrynie, nadal ponosisz za to odpowiedzialność. Google wyjaśniał to wiele razy na przestrzeni lat. Poniżej zamieściłem tylko jeden z kilku tweetów, które udostępniałem przez lata na temat Google, wyjaśniając, że UGC będzie brane pod uwagę przy ocenie jakości. Jeśli znajduje się on w Twojej witrynie i jest zaindeksowany, jest on brany pod uwagę przy ocenie jakości.
Umiarkowane UGC Mocno:
Od czasów średniowiecznych Pand (około 2011 r.) zawsze wyjaśniałem, że właściciele witryn muszą intensywnie moderować treści generowane przez użytkowników. Jeśli nie, z czasem treści o niższej jakości mogą się wkradać i narastać. A kiedy tak się stanie, konfigurujesz swoją witrynę tak, aby została poważnie dotknięta poważną aktualizacją algorytmu. Moja rada jest teraz taka sama, ale z lekkim urozmaiceniem AI. Teraz będę również szukać treści AI o niższej jakości, a nie tylko typowego spamu UGC. Najlepsze narzędzia do wykrywania treści AI są stale udoskonalane i mogą pomóc w oznaczaniu treści z dużym prawdopodobieństwem, że zostały utworzone za pomocą sztucznej inteligencji.
Poniżej przedstawię kilka wskazówek dla właścicieli witryn, którzy mogą mieć do czynienia z treściami generowanymi przez sztuczną inteligencję o niższej jakości. Ponownie skontaktowałem się z kilkoma witrynami, w których problem ten narastał w ciągu ostatniego roku…
Wykrywanie, głośność i tempo: potrójna sztuczna inteligencja UGC
Oprócz identyfikowania treści generowanych przez sztuczną inteligencję możesz sprawdzić liczbę odpowiedzi użytkowników i tempo, w jakim te odpowiedzi są przesyłane. Niedawno skontaktował się ze mną jeden z właścicieli witryny, pokazując użytkownikowi, który przesłał wiele odpowiedzi w krótkim czasie. Po sprawdzeniu tych odpowiedzi za pomocą narzędzia do wykrywania treści opartego na sztucznej inteligencji wszystkie uzyskały 100% prawdopodobieństwo, że treść została utworzona za pomocą sztucznej inteligencji. Na przykład poniżej możesz zobaczyć dwa z tych zgłoszeń.
Zatem połączenie objętości, tempa i dość oczywistej zawartości sztucznej inteligencji dało dobry przykład użytkownika wykorzystującego sztuczną inteligencję do wypompowania ton treści UGC w danej witrynie.
Należy pamiętać, że jest to witryna o dużej skali, więc ten jeden użytkownik prawdopodobnie miałby niewielki wpływ. Jednak z biegiem czasu, jeśli inni użytkownicy zrobią to samo, może to absolutnie spowodować problemy z punktu widzenia jakości. Właściciel witryny mądrze postąpił i skontaktował się ze mną w tej sprawie. Zajmowali się tym użytkownikiem i być może opracowali proces identyfikowania wzorców, który mógłby pomóc wydobyć osoby próbujące grać w systemie z użyciem treści generowanych przez użytkowników AI o niższej jakości.
I pamiętajcie, że wrześniowe HCU zdawało się uwzględniać UX w równaniu (co wyraźnie zauważyłem, analizując wiele witryn, których to dotyczy). Dlatego bariery w doświadczeniach użytkowników, takie jak agresywne reklamy, wyskakujące okienka, reklamy pełnoekranowe i inne, mogą przyczyniać się do tworzenia „nieprzydatnych treści”. Jeśli więc połączysz niskiej jakości treści generowane przez użytkowników AI z okropnym UX, możesz mieć poważny problem z HCU wędrującym po sieci. Strzec się.
Podsumowanie: ostrzeżenie dla właścicieli witryn, którzy akceptują treści UGC.
Ponownie chciałem omówić ten temat w przypadku każdej witryny publikującej treści generowane przez użytkowników. Nawet jeśli masz witrynę o większej skali i zawierającą mnóstwo treści, byłbym bardzo ostrożny, jeśli chodzi o umieszczanie w niej treści o niskiej jakości. Teraz, dzięki łatwości narzędzi do generowania treści AI, należy zachować ostrożność, aby nie udostępniać w witrynie treści generowanych przez użytkowników AI o niskiej jakości. Powtórzę: kilka firm skontaktowało się ze mną po mocnym uderzeniu i to niewątpliwie stanowiło część problemu.
Zakończę ten post kilkoma wskazówkami i zaleceniami dla właścicieli witryn:
- Intensywnie moderuj z dodatkiem sztucznej inteligencji: jeśli akceptujesz w swojej witrynie treści generowane przez użytkowników, powinieneś już intensywnie moderować z punktu widzenia jakości. Ale teraz powinieneś także zwracać uwagę na przesyłane treści AI o niższej jakości.
- Tempo przesyłania: Jedną z sygnałów ostrzegawczych może być tempo przesyłania przez niektórych użytkowników. Na przykład wyjaśniłem wcześniej, że firma, która skontaktowała się ze mną po powiadomieniu o zgłoszeniach, które wydawały się nieco nieodpowiednie… Gdy zagłębiłem się w dane tego użytkownika, w bardzo krótkim czasie pojawiło się wiele zgłoszeń. Po sprawdzeniu tych zgłoszeń za pomocą narzędzi do wykrywania treści AI istniało 100% prawdopodobieństwo, że zostały one utworzone za pomocą sztucznej inteligencji.
- Laboratorium testowe: Polecam utworzenie laboratorium testowego, które wykorzystuje kilka narzędzi do wykrywania treści AI. Narzędzia nie są doskonałe, ale dobrze radzą sobie z wykrywaniem treści generowanych przez sztuczną inteligencję o niższej jakości . Należy wdrożyć proces sprawdzania oznaczonych treści. Następnie omówię interfejsy API, które mogą pomóc w zbiorczym sprawdzaniu treści.
- Interfejsy API są Twoim przyjacielem: niektóre narzędzia do wykrywania treści AI mają interfejsy API, które umożliwiają zbiorcze sprawdzanie treści. Jeśli masz witrynę o dużej skali i zawierającą dużo treści generowanych przez użytkowników, dobrym rozwiązaniem może być wykorzystanie interfejsu API. Na przykład GPTZero, Originality.ai i inne mają interfejsy API, które można wykorzystać do sprawdzania treści na dużą skalę.
- Polityka dotycząca treści AI dla treści generowanych przez użytkowników: Należy wdrożyć zasady dotyczące treści AI, do których użytkownicy mają dostęp i które są łatwo zrozumiałe. Upewnij się, że użytkownicy rozumieją, co jest dozwolone, a co nie , w tym co zrobią w przypadku wykrycia treści AI o niskiej jakości.
- Jeśli chodzi o indeksowanie, bądź szybki, bądź zdecydowany: i na koniec szybko zajmij się zgłoszeniami AI i upewnij się, że nie zostaną zaindeksowane (lub nie pozostaną indeksowane). Jak już wielokrotnie pisałem w postach i prezentacjach na temat głównych aktualizacji algorytmów, wszystkie zaindeksowane strony są brane pod uwagę podczas oceny jakości przez Google. Skoncentruj się więc na tym, co nazywam „indeksowaniem jakości” i upewnij się, że treści generowane przez użytkowników AI o niższej jakości nie zostaną zaindeksowane.
Podsumowanie: Uważaj na treści UGC z elementami sztucznej inteligencji.
W przypadku witryn akceptujących treści tworzone przez użytkowników zawsze ważne było ich intensywne moderowanie ze względu na jakość. A teraz, dzięki narzędziom do generowania treści AI, radzenie sobie z UGC jest teraz trudniejsze, a moderacja stała się nieco trudniejsza. Zalecam zapoznanie się ze wskazówkami i zaleceniami podanymi w tym poście, aby stworzyć proces oznaczania potencjalnych problemów, a następnie szybkiego rozwiązywania tych problemów. To najlepszy sposób na utrzymanie wysokiego poziomu „indeksowania jakości”, co jest ważne, aby uniknąć problemów związanych z głównymi aktualizacjami algorytmów, takimi jak aktualizacja przydatnej zawartości i ogólne aktualizacje podstawowe.
GG