Nový algoritmus dokáže rozpoznat, zda falešnou zprávu napsal algoritmus

Vědci z Harvardské univerzity a laboratoře MIT-IBM Watson AI Lab vyvinuli nový nástroj pro vyhledávání textů, které byly vytvořeny pomocí umělé inteligence. Nástroj dostal poetický název GLTR (Giant Language Model Test Room) a využívá toho, že generátory textu pracující s umělou inteligencí na rozdíl od skutečného významu slov a celých vět spoléhají na statistické vzorce, jež jsou obecně v textech obsažené. Jinými slovy, nástroj může zjistit, zda se slova, která v textu čtete, zdají příliš předvídatelná, než aby je napsal člověk.

Dezinformační kampaně se stále více automatizují a technologie potřebná k automatickému vytváření falešných textů a obrázků se velmi rychle vyvíjí. Nástroje poháněné umělou inteligencí, jako je právě GLTR, se mohou stát cennými zbraněmi ve snaze odhalovat fake news, deep fakes nebo třeba i boty na Twitteru.

Studenti byli schopni odhalit pouze polovinu umělých článků bez pomoci GLTR, pokud ale tento nástroj měli k dispozici, tak jejich úspěšnost stoupla na 72 %.

Vědci ze společnosti OpenAI nedávno představili algoritmus, který dokáže stvořit překvapivě realistické pasáže textu. Algoritmus využívající strojové učení nakrmili obrovským množstvím textů, a právě díky hrubé síle a množství dat se pak algoritmus naučil rozpoznávat statistické vzorce v používání slov. Tým z Harvardu potom na tomto nápadu postavil svůj nástroj a dal ho k dispozici veřejnosti, vyzkoušet si ho tedy může každý.

Předvídatelná spojení

GLTR zvýrazňuje slova, která se s určitou pravděpodobností objeví za předchozím slovem v textu. Jak je vidět na testovacích vzorcích, nejvíce předvídatelná slova jsou podbarvena zeleně, méně předvídatelná žlutě a červeně. Nejméně předvídatelná slova jsou pak fialová. Při testování na úryvcích textu napsaného pomocí algoritmu OpenAI bylo odhaleno mnoho předvídatelných slov, jinak řečeno celý text je podbarven zeleně a je zřejmé, že vznikl uměle. Naopak případy článků či vědeckých studií odhalují jistou originalitu a nepředvídatelnost, zastoupeny jsou v nich všechny barvy a nechybí ani nejvíce překvapivá fialová slova.

Vědci v prostředí GLTR provedli také další experiment. Požádali studenty Harvardu, aby identifikovali text generovaný umělou inteligencí. Nejprve bez tohoto nástroje a poté s jeho pomocí a zvýraznění slov barvami. Studenti byli schopni odhalit pouze polovinu umělých článků bez pomoci GLTR, pokud ale tento nástroj měli k dispozici, tak jejich úspěšnost stoupla na 72 %.