Il Futuro dell’Intelligenza Artificiale: Sfide e Progressi

L'evoluzione dell'IA verso l'AGI e il test di benchmark ARC-AGI

L’intelligenza artificiale ha recentemente ottenuto risultati eccezionali su un programma progettato per valutare l’intelligenza generale, raggiungendo un punteggio paragonabile a quello di una persona media. Storicamente, i ricercatori hanno utilizzato il Test di Turing come metro di misura per valutare l’intelligenza delle macchine, che richiede alla macchina di convincere un essere umano di essere essa stessa una persona. Secondo alcuni resoconti, la tecnologia potrebbe aver già superato questa sfida, come nel caso di ChatGPT all’inizio di quest’anno. Tuttavia, sorge il dubbio se questo successo possa effettivamente rappresentare una forma di intelligenza autentica.

Per offrire un’alternativa al Test di Turing, l’ingegnere del software e ricercatore di intelligenza artificiale Francois Chollet ha ideato il test di benchmark ARC-AGI, un software progettato per valutare l’intelligenza artificiale generale (AGI). Secondo Chollet, l’AGI è un sistema in grado di apprendere nuove abilità in modo efficiente al di fuori dei dati di addestramento. Su questo fronte, ChatGPT non supererebbe il test, poiché si basa principalmente sulla probabilità e su grandi quantità di dati per generare previsioni linguistiche.

Chollet sostiene che l’intelligenza generale non si limiti alla capacità di eseguire determinate attività, come nel caso di ChatGPT nel generare contenuti, ma riguardi piuttosto la capacità di acquisire tali competenze senza la necessità di un’enorme quantità di input. Questa abilità fondamentale manca a ChatGPT, che quindi non supererebbe il test di benchmark ARC-AGI.

Per superare il test ARC-AGI, l’intelligenza artificiale deve risolvere una serie di problemi di ragionamento basati su modelli di quadrati colorati in una griglia, con soli tre esempi a disposizione per apprendere. Il precedente record, detenuto da Jeremy Berman, era del 58,5%. Questo record è stato superato dal nuovo sistema o3 di OpenAI, che ha ottenuto un notevole 82,8%, posizionando l’IA, secondo Chollet, su un livello paragonabile a quello umano.

Chollet ha descritto questo risultato come un significativo passo avanti che rappresenta una svolta in termini di adattabilità e capacità di generalizzazione. Ha sottolineato che si tratta di un progresso significativo che richiede seria attenzione scientifica. A titolo di confronto, quattro anni fa, GPT-3 aveva ottenuto un modesto 0%, mentre nel 2024, GPT-4o si era fermato al 5%. È evidente un notevole miglioramento nel tempo, sebbene ci siano ancora aree in cui il sistema o3 mostra carenze in alcune attività di base.

Nonostante i progressi impressionanti nell’ambito dell’intelligenza artificiale, non esiste un consenso tra i ricercatori sul momento in cui potremmo assistere all’avvento di una vera AGI. Alcuni esperti ritengono che potremmo vederne la comparsa entro la fine del decennio. In un recente intervento, Ben Goertzel, fondatore di SingularityNET, ha previsto che i singoli computer potrebbero raggiungere una potenza computazionale equivalente a quella di un cervello umano entro il 2023, e che entro altri 10/15 anni un singolo computer potrebbe avere la potenza di calcolo di tutta la società umana.

Links: