L’Intelligenza Artificiale (IA) non sembra destinata a sostituire presto i medici umani, contrariamente a quanto si potrebbe pensare. Uno studio pubblicato sul numero natalizio di The BMJ ha evidenziato che i principali modelli di lingua di grandi dimensioni, noti anche come chatbot, mostrano segni di compromissioni cognitive simili ai sintomi precoci della demenza quando sottoposti al test MoCA, utilizzato per rilevare la demenza precoce.
Questo studio ha rivelato che i chatbot più datati hanno ottenuto risultati peggiori nei test, proprio come i pazienti umani invecchiati. Questi risultati mettono in discussione l’idea che l’IA possa presto sostituire i medici umani nelle applicazioni cliniche, specialmente nei compiti che richiedono abilità visive ed esecutive.
I recenti progressi nell’IA hanno suscitato sia entusiasmo che preoccupazione riguardo alla possibilità che i chatbot possano superare i medici umani nei compiti medici. Sebbene i grandi modelli di lingua abbiano dimostrato eccellenza in vari compiti diagnostici medici, la loro vulnerabilità a compromissioni cognitive simili a quelle umane è rimasta in gran parte inesplorata fino ad ora.
Per colmare questa lacuna di conoscenza, i ricercatori hanno valutato le abilità cognitive dei principali modelli di lingua di grandi dimensioni – come ChatGPT versioni 4 e 4o, Claude 3.5 Sonnet e Gemini versioni 1 e 1.5 – utilizzando il test MoCA. Questo test valuta abilità come l’attenzione, la memoria, il linguaggio, le abilità visuospaziali e le funzioni esecutive.
I risultati hanno mostrato che i chatbot hanno ottenuto punteggi diversi nel test MoCA, con ChatGPT 4o che ha ottenuto il punteggio più alto (26 su 30) e Gemini 1.0 il punteggio più basso (16 su 30). Tutti i chatbot hanno mostrato una scarsa performance nelle abilità visuospaziali e nei compiti esecutivi, mentre hanno ottenuto buoni risultati in altri compiti come la denominazione, l’attenzione, il linguaggio e l’astrazione.
Tuttavia, i chatbot hanno mostrato difficoltà nel mostrare empatia e nell’interpretare scene visive complesse. Questi risultati mettono in luce un’area significativa di debolezza che potrebbe limitare l’utilizzo dei chatbot in contesti clinici.
Gli autori dello studio sottolineano che, nonostante i progressi dell’IA, i medici umani non saranno presto sostituiti dai grandi modelli di lingua. Al contrario, potrebbero trovarsi a curare nuovi “pazienti virtuali” – modelli di intelligenza artificiale con compromissioni cognitive. Questi risultati, sebbene osservazionali, evidenziano la complessità e le sfide nell’applicare l’IA in contesti clinici.
In conclusione, l’IA potrà certamente supportare e integrare il lavoro dei medici umani, ma non sembra destinata a sostituire completamente nel prossimo futuro.
Links: