L’intelligenza artificiale scopre, in un colpo solo, più di 160.000 nuove specie di virus

Si tratta della più ampia ricerca finora pubblicata sui nuovi virus. Le nuove specie sono state trovate nell'atmosfera, nelle sorgenti termali e nelle sorgenti idrotermali nelle profondità dell'oceano.

Un team internazionale di ricercatori ha appena reso pubblica la scoperta di 161.979 nuove specie di virus grazie all’utilizzo dell’Intelligenza Artificiale. Una pietra miliare nella storia della conoscenza di queste piccole creature onnipresenti e ancora non del tutto comprese.

Proprio al confine tra ciò che è vivo e ciò che non lo è, i virus possono replicarsi solo all’interno delle cellule di altri esseri viventi, che costringono a fare copie di se stessi. Ecco perché infettano tutti i tipi di organismi, dai batteri ai funghi, alle piante, agli animali e persino ad altri virus. Non è un’esagerazione affermare che i virus sono letteralmente ovunque e che ne conosciamo solo un piccolo numero. Infatti, sebbene ne siano già state scoperte diverse centinaia di migliaia, finora ne sono state descritte solo circa 5.000. Gli scienziati, tuttavia, ritengono che il loro numero reale sia molto più alto.

In un articolo appena pubblicato su ” Cell “, i ricercatori spiegano di aver utilizzato uno strumento di apprendimento automatico che secondo loro migliorerà notevolmente la mappatura della vita sulla Terra e potrebbe aiutare nell’identificazione di molti altri milioni di virus ancora da caratterizzare. Il lavoro è il più grande finora pubblicato sulla scoperta di nuove specie di virus.

Siamo solo l’inizio


Ci è stata offerta una finestra su una parte della vita sulla Terra che altrimenti sarebbe rimasta nascosta“, spiega Edwards Holmes, dell’Università di Sydney e autore principale dell’articolo, “rivelando una notevole biodiversità. Si tratta del maggior numero di nuove specie di virus scoperte in un singolo studio, ampliando notevolmente la nostra conoscenza dei virus che vivono tra noi. Trovare così tanti nuovi virus contemporaneamente è strabiliante, ma non riesce a scalfire la superficie, aprendo un intero mondo di scoperte. “Ce ne sono altri milioni da scoprire e possiamo applicare lo stesso approccio per identificare batteri e parassiti“.


Sebbene i virus a RNA siano comunemente associati alle malattie umane, possono essere trovati anche negli ambienti più estremi del mondo, nelle caldere dei vulcani attivi a diversi chilometri sotto il ghiaccio, e si ritiene che possano persino svolgere un ruolo chiave negli ecosistemi globali. I virus trovati nel presente studio sono stati osservati vivere nell’atmosfera, nelle sorgenti termali e nelle sorgenti idrotermali degli oceani profondi.

Il fatto che gli ambienti estremi contengano così tanti tipi di virus – continua Holmes – è solo un altro esempio della loro fenomenale diversità e tenacia nel vivere negli ambienti più difficili, dandoci potenzialmente indizi su come sono emersi i virus e altre forme di vita elementare.

Uno strumento rivoluzionario


Per identificare la nuova specie virale, Holmes e i suoi colleghi hanno creato un algoritmo di deep learning, chiamato LucaProt, per calcolare grandi quantità di dati di sequenze genetiche, inclusi estesi genomi virali fino a 47.250 nucleotidi e informazioni geneticamente complesse. Il risultato è stata la scoperta di oltre 160.000 virus precedentemente sconosciuti.

«La stragrande maggioranza di questi virus – spiega Holmes – erano già stati sequenziati e si trovavano in database pubblici, ma quei dati erano così dispersi che nessuno sapeva cosa rappresentassero. In effetti, hanno formato quella che è spesso conosciuta come una “sequenza di materia oscura”. “Il nostro metodo AI, tuttavia, è riuscito a organizzare e classificare tutte quelle informazioni disparate, facendo luce per la prima volta sul significato di quella materia oscura”.

Lo strumento AI, quindi, è stato addestrato per analizzare la materia oscura e identificare i virus sulla base di sequenze e strutture secondarie della proteina che tutti i virus a RNA utilizzano per replicarsi. Che è riuscita ad accelerare il processo di identificazione di nuovi virus, cosa che con i metodi tradizionali richiede una grande quantità di tempo.

Secondo Mang Shi dell’Università Sun Yat-sen e coautore dello studio, “Facevamo affidamento su noiosi processi bioinformatici per la scoperta dei virus, che limitavano la diversità che potevamo esplorare. Ora disponiamo di un modello basato sull’intelligenza artificiale molto più efficace che offre sensibilità e specificità eccezionali e ci consente allo stesso tempo di approfondire la diversità virale. “Abbiamo in programma di applicare questo modello in diverse applicazioni”.

“LucaProt”, afferma il coautore Zhao-Rong Li, “rappresenta una significativa integrazione tra virologia e tecnologia di intelligenza artificiale all’avanguardia, dimostrando che l’intelligenza artificiale può svolgere compiti di esplorazione biologica in modo efficace”.

“L’ovvio passo successivo“, conclude Holmes, “è quello di allenare il nostro metodo per scoprire ancora di più questa straordinaria diversità, e chissà quali nuove sorprese ci aspettano“.

Fonte:

https://www.cell.com/cell/fulltext/S0092-8674(24)01085-7?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS0092867424010857%3Fshowall%3Dtrue