Anthropic tyrimas atskleidžia dirbtinio intelekto modelių įtaką derybų rezultatams

Anthropic tyrimas: dirbtinio intelekto modelių įtaka deryboms

Anthropic neseniai atliko tyrimą, pavadintą Project Deal, kuriame dalyvavo 69 darbuotojai, kiekvienas gavęs po 100 dolerių, ir Claude agentai, kurie derėjosi per Slack platformą. Buvo uždaryti 186 sandoriai, kurių bendra vertė viršijo 4 000 dolerių. Dalyviai buvo suskirstyti į keturias lygiagrečias rinkas, kuriose žmonės neturėjo prieigos po pradinio etapo.

Modelių skirtumai ir rezultatai

Tyrime pusė agentų naudojo Claude Opus 4.5, stipresnį modelį, o kita pusė – Claude Haiku 4.5, silpnesnį modelį. Dalyviai nežinojo, kurį modelį naudoja. Rezultatai parodė, kad Opus pardavėjai už tuos pačius prekes uždirbo 3,64 dolerio daugiau, o pirkėjai mokėjo 2,45 dolerio mažiau. Pavyzdžiui, už tą patį sugedusį dviratį Opus sandoris siekė 65 dolerius, o Haiku – 38 dolerius.

Modelio kokybė prieš instrukcijas

Nustatyta, kad modelio kokybė turi didesnę įtaką nei instrukcijos. Pakeitus derybų strategijas, pvz., „derėkitės griežčiau”, rezultatai beveik nesikeitė. Stipresni modeliai geriau suprato priešingą pusę ir tiksliau nustatė sandorio ribas.

Nepastebima nelygybė

Tyrimas parodė, kad Haiku naudotojai vertino sandorių sąžiningumą beveik taip pat kaip Opus naudotojai (atitinkamai 4,06 ir 4,05 balo). Dauguma dalyvių negalėjo atspėti, kurį modelį naudoja, todėl pralaimėjusieji net nesuvokė, kad pralaimi.

Ateities perspektyvos

Rinkoms pereinant prie agentų tarpusavio sąveikos, modelio kokybė tampa paslėptu struktūriniu pranašumu. Stipresni modeliai nuolat laimi derybose, o priešingos pusės nesupranta, kodėl gauna blogesnes sąlygas. Ateityje gali prireikti sandorių skaidrumo įrankių, agentų sertifikavimo standartų ir B2B derybų našumo etalonų. Net „sąžiningo sandorio” apibrėžimas gali keistis, kai Opus derasi prieš Haiku.

Norėdami sužinoti daugiau, apsilankykite originaliame straipsnyje.