Dirbtinio intelekto modelių IQ testų rezultatai ir jų pažanga

Dirbtinio intelekto modelių IQ vertinimas

Jau ilgą laiką diskutuojama apie dirbtinio intelekto galią ir jo gebėjimą imituoti žmogaus protą. Šioje srityje žurnalistas Maksimas Lotas žengė dar vieną žingsnį, sukūręs svetainę Tracking AI, kurioje renkama informacija apie įvairių dirbtinio intelekto modelių IQ testų rezultatus. Naudoti tiek oficialūs Mensa testai, tiek unikalus autoriaus sukurtas testas, kuris nebuvo įtrauktas į dirbtinio intelekto mokymosi duomenų rinkinius.

Rezultatų viršūnėje GPT-5 Pro

Pirmaujančiu modeliu tapo GPT-5 Pro, kuris „namų“ teste pasiekė IQ 123, o Mensa teste – net 138. Tai yra reikšmingas pasiekimas lyginant su ankstesniais rezultatais. Pavyzdžiui, ankstesnė versija GPT-4o tesugebėjo surinkti tik 65 balus. Kita vertus, Grok 4 pasiekė 110 balų „namų“ teste ir 125 Mensa teste, taip pat rodo augantį potencialą.

Claude modelių pažanga

Dar viena įdomi tendencija pastebėta Claude 3.7 Sonnet Extended ir Claude 3.5 Sonnet modeliuose. Šie modeliai rodo nuoseklią pažangą, kiekviename atnaujinime didindami savo rezultatus. Jei anksčiau Claude modeliai galėjo suklysti net paprastose loginėse užduotyse, dabar jie sėkmingai įveikia testus, viršijančius vidutinį lygį.

Ateities perspektyvos

Šie rezultatai ne tik atspindi dirbtinio intelekto tobulėjimą, bet ir kelia klausimus apie jo galimybes ateityje. Ar dirbtinis intelektas galės lygiuotis su žmogaus protu? Šiuo metu akivaizdu, kad AI modeliai demonstruoja įspūdingus gebėjimus, o jų tobulėjimas užtikrina naujas galimybes ir iššūkius tiek technologijų, tiek visuomenės srityse.

Dirbtinio intelekto modelių IQ testų rezultatai ir jų pažanga

Dirbtinio intelekto modelių IQ vertinimas

Rezultatų viršūnėje GPT-5 Pro

Claude modelių pažanga

Ateities perspektyvos

SEKANTI NAUJIENA

SR Space oficialiai paskelbta bankrutavusia