Anthropic tyrimas: dirbtinio intelekto modelių įtaka deryboms
Anthropic neseniai atliko tyrimą, pavadintą Project Deal, kuriame dalyvavo 69 darbuotojai, kiekvienas gavęs po 100 dolerių, ir Claude agentai, kurie derėjosi per Slack platformą. Buvo uždaryti 186 sandoriai, kurių bendra vertė viršijo 4 000 dolerių. Dalyviai buvo suskirstyti į keturias lygiagrečias rinkas, kuriose žmonės neturėjo prieigos po pradinio etapo.
Modelių skirtumai ir rezultatai
Tyrime pusė agentų naudojo Claude Opus 4.5, stipresnį modelį, o kita pusė – Claude Haiku 4.5, silpnesnį modelį. Dalyviai nežinojo, kurį modelį naudoja. Rezultatai parodė, kad Opus pardavėjai už tuos pačius prekes uždirbo 3,64 dolerio daugiau, o pirkėjai mokėjo 2,45 dolerio mažiau. Pavyzdžiui, už tą patį sugedusį dviratį Opus sandoris siekė 65 dolerius, o Haiku – 38 dolerius.
Modelio kokybė prieš instrukcijas
Nustatyta, kad modelio kokybė turi didesnę įtaką nei instrukcijos. Pakeitus derybų strategijas, pvz., „derėkitės griežčiau”, rezultatai beveik nesikeitė. Stipresni modeliai geriau suprato priešingą pusę ir tiksliau nustatė sandorio ribas.
Nepastebima nelygybė
Tyrimas parodė, kad Haiku naudotojai vertino sandorių sąžiningumą beveik taip pat kaip Opus naudotojai (atitinkamai 4,06 ir 4,05 balo). Dauguma dalyvių negalėjo atspėti, kurį modelį naudoja, todėl pralaimėjusieji net nesuvokė, kad pralaimi.
Ateities perspektyvos
Rinkoms pereinant prie agentų tarpusavio sąveikos, modelio kokybė tampa paslėptu struktūriniu pranašumu. Stipresni modeliai nuolat laimi derybose, o priešingos pusės nesupranta, kodėl gauna blogesnes sąlygas. Ateityje gali prireikti sandorių skaidrumo įrankių, agentų sertifikavimo standartų ir B2B derybų našumo etalonų. Net „sąžiningo sandorio” apibrėžimas gali keistis, kai Opus derasi prieš Haiku.
Norėdami sužinoti daugiau, apsilankykite originaliame straipsnyje.

