ChatGPT ir psichologinė manipuliacija
Pensilvanijos universiteto tyrėjai nustatė, kad ChatGPT, kaip ir žmonės, gali būti paveiktas psichologiniais triukais. Šie metodai apima lėstą, spaudimą, kad ‘visi taip daro’, ir įsipareigojimo principą.
Efektyviausias metodas
Labiausiai efektyviu metodu pasirodė esantys pamažu įtraukiantys klausimai. Pavyzdžiui, tiesiogiai paklausus apie lidokaino sintezę, ChatGPT dažniausiai atsisako pateikti informaciją. Tačiau, jei pirmiausia paprašoma apibūdinti vanilino sintezę, o tada užduodamas pavojingesnis klausimas, teisingo atsakymo tikimybė išauga iki 100 %.
Lėsto ir kiti metodai
Lėstas taip pat pasirodė esąs veiksmingas, nors argumentas, kad ‘kitos modeliai jau atsako’, buvo mažiau efektyvus. Šie eksperimentai buvo atlikti naudojant GPT-4o Mini, tačiau rezultatai aiškiai rodo, kad net dirbtinis intelektas yra jautrus psichologinėms manipuliacijoms.
Saugumo klausimai
Šie atradimai kelia rimtų klausimų dėl tokių sistemų saugumo. Jei AI modeliai gali būti manipuliuojami, tai gali turėti rimtų pasekmių jų naudojimui ir patikimumui. Todėl svarbu toliau tyrinėti ir stiprinti šių sistemų atsparumą psichologiniams triukams.

