W jaki sposób platformy do wykrywania treści mogą zwalczać fałszywe wiadomości poprzez drapanie stron internetowych i sztuczną inteligencję?

Opublikowany: 2017-06-20

Spis treści pokaż

Jak duży jest problem?

Czy sztuczna inteligencja może pomóc?

Rola web scrapingu

Dodawanie warstwy ręcznej

Dawno minęły czasy, kiedy ludzie musieli polegać na tradycyjnych mediach w celu uzyskania wiadomości; teraz są bombardowani wiadomościami przez ogromną liczbę mediów online w Internecie. Do tego stopnia, że jest to przeciążenie informacjami dla przeciętnej osoby, która ma ograniczony czas na zapoznanie się z wiadomościami i historiami. Media społecznościowe działają teraz jako medium dla wiadomości, a nawet poprawiają wrażenia użytkowników, dostosowując kanał do ich nawyków czytelniczych. Jednak ta masowa proliferacja mediów społecznościowych i publikowania w Internecie ma swoje wady.

Skrobanie fałszywych danych z sieci

Powszechna dostępność łatwych w użyciu systemów zarządzania treścią, takich jak WordPress, ułatwiła każdemu bycie wydawcą internetowym. Oznacza to, że dosłownie każdy może pisać i publikować wszystko – bez zadawania pytań. To prawda, że otworzyło to szerokie możliwości dla sieci wydawniczych i blogerów. Jednak, tak jak w przypadku wszystkich potężnych rzeczy, duża grupa nadużywa łatwej dostępności technologii wydawniczej do rozpowszechniania fałszywych wiadomości z ohydnymi motywami. Fałszywe wiadomości to większy problem niż to, co wydaje się być na powierzchni. Może siać spustoszenie w społeczeństwie, a nawet negatywnie wpływać na firmy i inne instytucje.

Jak duży jest problem?

Mówi się, że rozpowszechnianie fałszywych wiadomości przechyliło szalę na korzyść Donalda Trumpa w ostatnich wyborach prezydenckich w USA. Niezależnie od prawdy o zarzutach, fake newsy bez wątpienia mogą w niezdrowy sposób wpływać na opinię masową, kropka. Rozpowszechnianie fałszywych wiadomości może wywołać nieufność w społeczeństwie, która jest powolną trucizną, która może działać jako główna przyczyna wielu innych zła społecznego. Na przykład fałszywe wiadomości mogą promować przemoc w społecznościach i tworzyć niepokojącą atmosferę w życiu ludzi.

Istnieją pewne tematy, które można łatwo zmaterializować jako fałszywe wiadomości; nadużycie władzy, strach przed wyobcowaniem, kwestie wojny i pokoju itp. mogą łatwo rozprzestrzeniać się lotem błyskawicy, powodując nieodwracalne szkody.

Zdarzały się przypadki, że firmy prowadziły kampanie oszczerstw, aby osłabić swoich konkurentów, rozpowszechniając fałszywe pogłoski o firmie w celu zapewnienia, że poszkodowana firma straci klientów.

Całkiem niedawno syryjski uchodźca pozwał Facebooka po tym, jak w sieci społecznościowej rozprzestrzeniły się fałszywe wiadomości łączące go z terroryzmem. Facebook później usunął posty, ale szkody zostały już wyrządzone.

Platformy do wykrywania treści i serwisy społecznościowe same mogą być zagrożone procesami sądowymi, jeśli takie problemy będą się powtarzać. Wpłynęłoby to również na reputację platform wykrywania treści, na których takie wiadomości się rozprzestrzeniają, prowadząc do zmniejszenia zaangażowania użytkowników. Przy tych wszystkich reperkusjach fake newsy to ogromny problem, który należy zdusić w zarodku.

Czy sztuczna inteligencja może pomóc?

Bez wątpienia wykrywanie i zwalczanie fałszywych wiadomości to trudne przedsięwzięcie. Z pewnością nie jest opłacalnym rozwiązaniem zatrudnianie ludzi do przeglądania każdego postu udostępnianego na platformach do wyszukiwania treści w celu oceny ich autentyczności. Na szczęście nie żyjemy już w epoce, w której ludzie muszą wykonywać całą ciężką pracę.

Sztuczna inteligencja przeszła długą drogę od koncepcji science fiction, którą kiedyś była. Mamy teraz potężne algorytmy rozpoznawania głosu, obrazu i wzorców oraz moc obliczeniową do ich uruchomienia.

Zwalczanie fałszywych wiadomości za pomocą sztucznej inteligencji i uczenia maszynowego byłoby dobrym rozwiązaniem, biorąc pod uwagę głębię tego problemu. Aby umożliwić maszynom wykrywanie fałszywych wiadomości, najpierw musimy zidentyfikować wspólne cechy postów z fałszywymi wiadomościami. Zobaczmy, jak można to osiągnąć.

Reputacja strony internetowej

Reputacja strony internetowej jest jednym z kluczowych wskaźników, które można wykorzystać do oceny autentyczności opublikowanego na niej artykułu. Google, gigant wyszukiwarek, wykonuje świetną robotę w rankingu stron internetowych w swoich SERPach pod względem ich reputacji. Chociaż nie będziemy mogli używać zastrzeżonego algorytmu Google do wykrywania fałszywych wiadomości, możemy użyć sygnałów rankingowych wielu innych witryn, takich jak DA, ranking Alexa i wiek domeny, aby ocenić stronę internetową w naszym własnym systemie wykrywania fałszywych wiadomości. Starsze witryny z wysoką pozycją Alexa są bardziej zaufanymi źródłami, podczas gdy odwrotna strona może wskazywać na płytką witrynę.

Przetwarzanie języka naturalnego

Przetwarzanie języka naturalnego, w najprostszej definicji, to zdolność maszyny do prawdziwego zrozumienia ludzkiego języka i przetwarzania go w taki sam sposób, jak robi to człowiek. Silniki NLP są budowane poprzez zasilanie algorytmów uczenia maszynowego korpusami tekstowymi. Aby naprawdę wykryć fałszywe wiadomości, maszyny muszą być w stanie interpretować ludzkie języki, tak jak my. Jeśli chodzi o wykrywanie fałszywych wiadomości, silnik NLP musi być zasilany ogromnymi ilościami danych tekstowych, które należą zarówno do oryginalnych, jak i fałszywych artykułów. Stamtąd można złamać kod fałszywych wiadomości, co zasadniczo umożliwi maszynom wykrywanie fałszywych wiadomości z przyzwoitą dokładnością. Oto dwie rzeczy, które algorytm może wykorzystać do wykrycia fałszywych postów.

a) Spójność wewnętrzna

Fałszywe lub wprowadzające w błąd artykuły często mają dużą niespójność między różnymi częściami samego postu; powiedz tytuł, treść, fragment itp. System NLP może być używany do skanowania i oceny, czy fakty przedstawione w artykule są spójne lub sprzeczne.

b) Szukaj sensacyjnych słów

Artykuły nadmiernie sensacyjne często bywają fałszywe. System przetwarzania języka naturalnego może być użyty do zdefiniowania sensacyjnego aspektu artykułu na podstawie użycia sensacyjnych słów w artykule z wiadomościami.

Rola web scrapingu

Silnik sztucznej inteligencji, który potrafi wykrywać fałszywe wiadomości, będzie oczywiście wymagał ogromnych ilości danych, które zostaną wykorzystane do uczenia algorytmu uczenia maszynowego. Wyodrębnianie danych z sieci nie powinno stanowić problemu, biorąc pod uwagę, że istnieją zaawansowane technologie, które można wykorzystać do wydajnego skrobania sieci. Ponieważ jednak wykrywanie fałszywych wiadomości jest wyzwaniem samym w sobie, do pozyskiwania danych z mediów (zarówno oryginalnych, jak i fałszywych) zaleca się korzystanie z rozwiązania typu data as a service (DaaS), takiego jak PromptCloud . Ponieważ bierzemy na siebie pełną odpowiedzialność za proces ekstrakcji danych, możesz pominąć złożoność związaną ze skrobaniem sieci i uzyskać gotowe do użycia dane przy znacznie niższych kosztach w porównaniu ze skrobaniem wewnętrznym.

Dodawanie warstwy ręcznej

Ponieważ maszyna identyfikuje wskazówki i oznacza posty, które uważa za fałszywe, niewielka warstwa człowieka może zostać wykorzystana do zweryfikowania wyników. Będzie to łatwe teraz, gdy całe ciężkie podnoszenie zostało już wykonane przez system AI. Dzięki warstwie ręcznej system byłby wystarczająco wydajny, aby wykrywać fałszywe wiadomości z bardzo dużą dokładnością. W przypadku platform do wykrywania treści i serwisów społecznościowych możliwość wyeliminowania fałszywych wiadomości okazałaby się niezbędna do utrzymania zaangażowania użytkowników w miarę upływu czasu, a użytkownicy stracą zaufanie do wiadomości rozpowszechnianych na takich platformach. Potencjał sztucznej inteligencji i ekstrakcji danych internetowych w tym zakresie jest ogromny i powinien zostać wykorzystany do jak najwcześniejszego zwalczania tego zła.