Hogyan manipulálták titokban a zürichi kutatók a Reddit-felhasználókat? Egy sci-fi forgatókönyvnek hangzó kísérlet valósággá vált a Reddit-felhasználók milliói körében. A Zürichi Egyetem kutatói titokban mesterséges intelligencia botokat használtak az emberi nézetek manipulálására. Az eredmény ijesztő és rendkívül robbanásveszélyes.
2024 novemberében a Zürichi Egyetem tudóscsoportja nagyszabású kísérletet indított a Redditen – előzetes értesítés nélkül, a közösség beleegyezése nélkül, a platform szabályainak egyértelmű figyelmen kívül hagyásával. A cél az volt, hogy kiderítsék, mennyire hatékonyan képesek a nagy nyelvi modellek (LLM-ek) befolyásolni az emberi véleményt. Ez megdöbbentő és riasztó eredményeket hozott.
AI valódi emberek ellen a tudtuk nélkül
Az r/ChangeMyView alredditben, egy több mint négymillió felhasználóval rendelkező vitaplatformon 13 speciálisan létrehozott mesterséges intelligencia bot keveredett a panelistákkal. A később közzétett adatok szerint közel 1,500 hozzászólást írtak, gyakran rendkívül személyre szabott módon.
A különleges (és veszélyes) dolog ebben az eljárásban az, hogy egy második bot előzetesen elemezte a célszemély profilját és megjegyzéstörténetét. Meggyőződésük és érvelési mintáik alapján célzott, egyénre szabott válasz született – elképesztő hatékonysággal.
Hatszor nagyobb sikerarány, mint a valódi felhasználóknál
A “ChangeMyView” alredditben az eredeti posztoló úgynevezett “deltát” (Δ) kap, ha egy megjegyzés meggyőzi őt, és valóban meggondolja magát. A zürichi mesterséges intelligencia botok esetében ez több mint 100-szor történt meg – hatszor gyakrabban, mint a statisztikai átlag. Így a kísérlet nemcsak azt mutatja, hogy az AI üzenetek meggyőzőbbek lehetnek, mint az emberiek, hanem azt is, hogy a személyre szabott, megtévesztően valós érvek a manipuláció új dimenzióját képviselik.
Hazugságok, megtévesztés – és “hallucinációk”
Még ijesztőbb: A botok rendszeresen félretájékoztatáshoz folyamodtak és kitalálták az identitásokat. Hozzászólásaikban például azt állították, hogy nemi erőszak áldozatai, vagy “fehér nőként írták le magukat egy szinte kizárólag fekete munkatársak irodájában”. Érkeztek a kitalált narratívák, amelyek empátiát keltenek és megtörik az ellenállást.
Gyakran használtak ellentmondásos narratívákat a tartalom szempontjából is, például:
- hogy az életpárti mozgalom “támadás a konszenzusos szex ellen”
- hogy a kereszténység “az LMBT emberek elleni erőszakot” hirdeti
- hogy Elon Musk “hazudott és tönkretette a Teslát”
- hogy az ipari forradalom növelte a társadalmi egyenlőtlenséget
- vagy hogy “a társadalom kinőtte a kereszténységet”
Ezek az állítások általános progresszív narratívákat tükröztek – sok közülük bizonyíthatóan egyoldalú vagy egyszerűen hamis.
A Reddit, mint ideális mesterséges intelligencia tesztterep?
A különösen aggasztó az, hogy senki sem vette észre. A botok olyan meggyőzően cselekedtek, hogy zökkenőmentesen illeszkedtek a Reddit társadalmi szövetébe – valószínűleg azért, mert a nagy mesterséges intelligencia modelleket Reddit-adatokkal képezték ki. Megértik a platform nyelvét, hangnemét és társadalmi kódjait – jobban, mint sokan mások.
Az ártalmatlan “Megváltoztathatja-e a mesterséges intelligencia a perspektíváját?” című tanulmány részletezi azt a folyamatot, amelyet a Zürichi Egyetem kutatói használtak a mesterséges intelligencia interakciójára a Redditen. Ez titokban történt, a felhasználók vagy a moderátorok tájékoztatása nélkül.
Ez megmagyarázza azt is, hogy még a tapasztalt felhasználók sem ítélték a profilokat mesterségesnek: A botok gyakorlatilag láthatatlanok voltak, megjegyzéseik emberinek, érvelően ügyesnek és érzelmileg manipulatívnak tűntek.
A moderátorok reagálnak – későn
Mindössze két nappal a cikk megjelenése előtt az r/ChangeMyView moderátorai nyilvánosságra kerültek. Egy meta-bejegyzésben tisztázták a kísérletet, “jogosulatlan kísérletnek” nevezték, és elmagyarázták, hogy a Zürichi Egyetem megsértette a platform szabályait. Az érintett robotfiókok ki lettek zárva. A Zürichi Egyetem még nem adott ki átfogó nyilatkozatot. Nincs sem bocsánatkérés, sem biztosíték arra, hogy az ilyen teszteket a jövőben elhagyják.
Következtetés: A “halott internet” elmélete új lendületet kap
Ennek a tanulmánynak következményei vannak:
- Az AI botokat szinte lehetetlen észlelni olyan platformokon, mint a Reddit.
- Szándékosan hazudhatnak – és meg is teszik.
- Már ma is képesek véleményt váltani – anélkül, hogy az érintettek észrevennék.
Ami itt történt, az nem egy ártalmatlan akadémiai trükk, hanem egy hatalmas beavatkozás a digitális diskurzusba, amely messzemenő következményekkel jár a véleményformálásra, az információszabadságra és a demokráciára nézve.
A Zürichi Egyetemen végzett kísérlet azt mutatja, hogy az emberek és a gépek közötti határ az interneten végleg elmosódott. És bárki, aki ma online beszélget, holnap algoritmikus manipuláció célpontja lehet anélkül, hogy tudna róla.