La Sintesi di Nuove Proteine e il Potenziale dell’Intelligenza Artificiale
La sintesi di nuove proteine, considerati i mattoni essenziali della vita biologica, rappresenta un ambito scientifico di straordinario potenziale. Recentemente, un innovativo modello di intelligenza artificiale ha dimostrato la capacità di generare istruzioni per la creazione di proteine che superano le varianti già esistenti in natura.
Il Modello EvolutionaryScale Model 3 (ESM3)
Un team di scienziati statunitensi ha impiegato il modello EvolutionaryScale Model 3 (ESM3) per sviluppare una nuova proteina, denominata esmGFP, una proteina fluorescente verde. Questa nuova entità biologica condivide solo il 58% della sua sequenza con il suo parente naturale più prossimo, la tagRFP, il che equivale a circa 500 milioni di anni di evoluzione sintetizzati dall’intelligenza artificiale.

Progettazione di Proteine su Misura
Questa scoperta apre la strada alla progettazione di proteine su misura, destinate a usi specifici o in grado di sbloccare ulteriori funzioni da proteine già esistenti. I ricercatori, guidati da Thomas Hayes, fondatore di EvolutionaryScale a New York, sottolineano che oltre tre miliardi di anni di evoluzione hanno contribuito a formare un’immagine complessa della biologia, codificata nello spazio delle proteine naturali.
Le Potenzialità dell’ESM3
L’ESM3 si configura come un modello di linguaggio generativo multimodale mascherato, specificamente progettato per la programmazione biologica. Questo modello è stato addestrato su un vasto insieme di dati, comprendente:
- 3,15 miliardi di sequenze proteiche
- 236 milioni di strutture proteiche tridimensionali
- 539 milioni di annotazioni descrittive
Attraverso l’analisi di questi enormi archivi di dati, l’intelligenza artificiale è in grado di identificare schemi e comprendere le dinamiche di costruzione e funzionamento delle proteine.

Funzionalità della Proteina esmGFP
La proteina esmGFP si distingue per la sua funzionalità: emette fluorescenza, proprio come la tagRFP. Le proteine fluorescenti sono responsabili del bagliore di alcuni organismi marini e rivestono un’importanza cruciale in ambito medico e biotecnologico, dove vengono utilizzate come marcatori.
Riduzione del Margine di Errore nella Sintesi Proteica
L’intelligenza artificiale riduce significativamente il margine di errore nella sintesi proteica, consentendo al contempo di esplorare possibilità lontane dalle proteine attualmente conosciute. I ricercatori descrivono la struttura dell’evoluzione come una rete che connette tutte le proteine, delineando i percorsi che l’evoluzione potrebbe seguire.
Prospettive Future nella Progettazione di Proteine
Sebbene le proteine progettate da ESM3 debbano ancora essere validate, sintetizzate e testate, il team è ottimista riguardo ai futuri sviluppi. In un futuro non troppo lontano, potrebbe diventare possibile produrre proteine per una vasta gamma di applicazioni, dai medicinali ai biomateriali, semplicemente fornendo suggerimenti intelligenti all’intelligenza artificiale.
Conclusioni sulla Ricerca in Biologia Sintetica
Questa ricerca è stata recentemente pubblicata sulla rivista Science, segnando un passo significativo nel campo della biologia sintetica. I modelli di linguaggio proteico non operano esplicitamente all’interno dei vincoli fisici dell’evoluzione, ma sono in grado di costruire implicitamente un modello delle molteplici strade che l’evoluzione avrebbe potuto intraprendere.
Fonti e Riferimenti dell'Articolo: