Scoperte Sconvolgenti: Gli LLM Stanno Invecchiando Come Noi!

Introduzione a ChatGPT e all’Intelligenza Artificiale

Negli ultimi due anni, OpenAI ha reso disponibile al pubblico ChatGPT, un’intelligenza artificiale innovativa che consente agli utenti di interagire con una mente artificiale su vari argomenti. Le applicazioni di questo modello di linguaggio di grandi dimensioni (LLM) spaziano dalla scrittura di poesie alla redazione di lettere, fino ai compiti scolastici.

Declino Cognitivo degli LLM

Recenti ricerche condotte da scienziati israeliani hanno rivelato un aspetto preoccupante: gli LLM mostrano segni di declino cognitivo che aumenta con l’età, simile a quanto accade negli esseri umani. I ricercatori, tra cui neurologi e data scientist, hanno testato diversi chatbot, tra cui ChatGPT e Gemini, evidenziando risultati allarmanti.

Risultati dello Studio

Lo studio ha mostrato un livello di declino cognitivo paragonabile ai processi neurodegenerativi umani. Gli LLM, pur apparendo dotati di personalità, si avvicinano più al testo predittivo degli smartphone che alla generazione di conoscenza umana. Le limitazioni di questi algoritmi riguardano:

  • Difficoltà nel discernere contenuti significativi da pura finzione
  • Scarsa credibilità nelle risposte fornite

Le Aspettative sull’Intelligenza Artificiale

Con l’aumento delle aspettative nei confronti dell’IA, è fondamentale riconoscere che anche i cervelli umani commettono errori. Tuttavia, si sviluppano assunzioni secondo cui ogni nuova generazione di LLM migliorerà nella comunicazione e nel “pensiero” significativo.

Strumenti di Valutazione Cognitiva

Per valutare il progresso degli LLM, i ricercatori hanno utilizzato la Montreal Cognitive Assessment (MoCA), un test per misurare abilità cognitive come memoria e funzioni esecutive. I risultati hanno rivelato:

  • ChatGPT 4o: 26 punti su 30, lieve deterioramento cognitivo
  • ChatGPT 4 e Claude: 25 punti
  • Gemini: 16 punti, indicativo di grave deterioramento

Limitazioni nei Compiti Cognitivi

Un’analisi approfondita ha mostrato punteggi insoddisfacenti nelle funzioni visuo-spaziali ed esecutive. I chatbot hanno faticato in compiti come:

  • Tracciamento e copia di disegni
  • Disegno di un orologio

Le risposte a domande sulla posizione spaziale hanno richiamato quelle di pazienti affetti da demenza, evidenziando la mancanza di empatia nei test cognitivi.

grafico dei punteggi MoCA dell'IA
Confronti di cinque punteggi MoCA LLM.
Dayan et al., BMJ, 2025

Progresso delle Versioni Recenti

Le versioni più recenti degli LLM hanno mostrato risultati migliori, suggerendo un progresso rispetto ai modelli precedenti. Tuttavia, gli autori avvertono che non è possibile diagnosticare questi modelli come cervelli umani, poiché le loro funzioni cognitive sono diverse.

Conclusioni e Futuro dell’IA

Con l’innovazione continua nell’intelligenza artificiale, è probabile che nei prossimi decenni vedremo LLM capaci di ottenere punteggi eccellenti in valutazioni cognitive. Fino ad allora, è fondamentale approcciare i consigli forniti dai chatbot con scetticismo. Questa ricerca, pubblicata su BMJ, contribuisce a un dibattito crescente sull’affidabilità degli LLM nella vita quotidiana.

tentativi di disegnare un cubo di Necker
Tentativi di disegnare un cubo di Necker
in alto a sinistra