Inteligență artificială (AI) a mai făcut un pas uimitor.
Un nou model de AI a reușit rezultate la nivel uman la un test conceput pentru a măsura „inteligența generală”.
Sistemul o3 al OpenAI a obținut un scor de 85% la benchmark-ul ARC-AGI, cu mult peste cel mai bun scor AI anterior de 55% și la egalitate cu scorul mediu uman. De asemenea, a avut rezultate bune la un test de matematică foarte dificil.
Crearea inteligenței generale artificiale, sau AGI, este obiectivul declarat al tuturor laboratoarelor majore de cercetare AI. La prima vedere, OpenAI pare să fi făcut cel puțin un pas semnificativ către acest obiectiv, transmite The Conversation.
Cercetători și dezvoltatori AI cred că ceva tocmai s-a schimbat. Pentru mulți, perspectiva AGI pare acum mai reală, urgentă și mai apropiată decât se anticipase.
Testul ARC-AGI este un test al „eficienței eșantionului” a unui sistem AI în adaptarea la ceva nou. Un sistem AI precum ChatGPT (GPT-4) nu este foarte eficient în eșantionare.
ARC-AGI testează pentru adaptarea eficientă a eșantionului utilizând probleme mici cum ar fi cea de mai jos. AI trebuie să descopere modelul care transformă grila din stânga în grila din dreapta.
Nu se știe exact cum a făcut OpenAI, dar rezultatele sugerează că modelul o3 este foarte adaptabil.
Un lucru care se cunoaște este că OpenAI a început cu o versiune de uz general a modelului o3 (care diferă de majoritatea celorlalte modele, pentru că poate petrece mai mult timp „gândindu-se” la întrebări dificile) și apoi l-a antrenat special pentru testul ARC-AGI.
Cercetătorul Francois Chollet, care a proiectat benchmark-ul, este de părere că o3 caută prin diferite „lanțuri de gândire” care descriu pașii pentru rezolvarea sarcinii, ulterior ar alege „cel mai bun” conform unei reguli vag definite sau „euristice”.
Înțelegerea cu adevărat a potențialului o3 va necesita o muncă extinsă, inclusiv evaluări, o înțelegere a distribuției capacităților sale, cât de des eșuează și cât de des reușește.