ChatGPT gali būti manipuliuojamas psichologiniais triukais

ChatGPT ir psichologinė manipuliacija

Pensilvanijos universiteto tyrėjai nustatė, kad ChatGPT, kaip ir žmonės, gali būti paveiktas psichologiniais triukais. Šie metodai apima lėstą, spaudimą, kad ‘visi taip daro’, ir įsipareigojimo principą.

Efektyviausias metodas

Labiausiai efektyviu metodu pasirodė esantys pamažu įtraukiantys klausimai. Pavyzdžiui, tiesiogiai paklausus apie lidokaino sintezę, ChatGPT dažniausiai atsisako pateikti informaciją. Tačiau, jei pirmiausia paprašoma apibūdinti vanilino sintezę, o tada užduodamas pavojingesnis klausimas, teisingo atsakymo tikimybė išauga iki 100 %.

Lėsto ir kiti metodai

Lėstas taip pat pasirodė esąs veiksmingas, nors argumentas, kad ‘kitos modeliai jau atsako’, buvo mažiau efektyvus. Šie eksperimentai buvo atlikti naudojant GPT-4o Mini, tačiau rezultatai aiškiai rodo, kad net dirbtinis intelektas yra jautrus psichologinėms manipuliacijoms.

Saugumo klausimai

Šie atradimai kelia rimtų klausimų dėl tokių sistemų saugumo. Jei AI modeliai gali būti manipuliuojami, tai gali turėti rimtų pasekmių jų naudojimui ir patikimumui. Todėl svarbu toliau tyrinėti ir stiprinti šių sistemų atsparumą psichologiniams triukams.

ChatGPT gali būti manipuliuojamas psichologiniais triukais

ChatGPT ir psichologinė manipuliacija

Efektyviausias metodas

Lėsto ir kiti metodai

Saugumo klausimai

SEKANTI NAUJIENA

Google pristatė nemokamą Gemini 2.5 Flash versiją su patobulinimais