(AGENPARL) - Roma, 17 Febbraio 2026Un nuovo modello di intelligenza artificiale sviluppato dai ricercatori del Massachusetts Institute of Technology (MIT) potrebbe rendere più efficiente la produzione di farmaci proteici, riducendone tempi e costi di sviluppo. Lo studio, pubblicato sulla rivista Proceedings of the National Academy of Sciences, dimostra come un modello linguistico di grandi dimensioni (LLM) possa ottimizzare le sequenze genetiche delle proteine prodotte dal lievito industriale.
Il team ha analizzato il codice genetico del lievito Komagataella phaffii, un microrganismo ampiamente utilizzato per produrre vaccini, biofarmaci e altre proteine di interesse medico. In particolare, i ricercatori hanno studiato i “codoni”, sequenze di tre lettere del DNA che codificano gli amminoacidi. Poiché più codoni possono corrispondere allo stesso amminoacido, scegliere la combinazione più adatta all’organismo ospite può aumentare significativamente l’efficienza produttiva.
Grazie all’IA, il modello ha appreso i modelli di utilizzo dei codoni specifici di K. phaffii e ha previsto quali sequenze sarebbero risultate più efficaci nella produzione di proteine mirate. I test sperimentali hanno mostrato un aumento dell’efficienza nella produzione di sei proteine differenti, tra cui l’ormone della crescita umano e il trastuzumab, anticorpo monoclonale impiegato nel trattamento di alcuni tumori.
“Disporre di strumenti predittivi affidabili è fondamentale per ridurre il tempo tra l’ideazione e la produzione industriale”, ha spiegato J. Christopher Love, professore di ingegneria chimica al MIT e autore senior dello studio. Eliminare l’incertezza, sottolinea il ricercatore, significa risparmiare tempo e denaro in un settore dove lo sviluppo può rappresentare fino al 20% del costo complessivo di commercializzazione di un farmaco biologico.
Il modello, basato su un’architettura codificatore-decodificatore, è stato addestrato utilizzando dati pubblici del National Center for Biotechnology Information, comprendenti circa 5.000 proteine naturalmente prodotte dal lievito. Una volta addestrato, il sistema ha generato sequenze ottimizzate che, in cinque casi su sei, hanno superato le prestazioni degli strumenti commerciali attualmente disponibili.
Oltre a migliorare l’efficienza produttiva, il modello ha mostrato di aver appreso principi biologici complessi, come l’evitare sequenze ripetitive che possono inibire l’espressione genica e la capacità di distinguere tra amminoacidi idrofobici e idrofili. Secondo i ricercatori, questo dimostra che l’IA non si limita a ottimizzare matematicamente un compito, ma riesce a cogliere aspetti biologici significativi.
I lieviti come K. phaffii e Saccharomyces cerevisiae (il comune lievito da forno) sono pilastri dell’industria biofarmaceutica globale, utilizzati per produrre insulina, vaccini contro l’epatite B e numerosi anticorpi monoclonali. Rendere più efficiente la loro ingegnerizzazione potrebbe avere un impatto rilevante sulla sostenibilità economica dei nuovi farmaci biologici.
Il codice del modello è stato reso disponibile alla comunità scientifica, aprendo la strada a ulteriori applicazioni su altre specie e sistemi produttivi. Se confermato su larga scala, questo approccio potrebbe rappresentare un passo decisivo verso una produzione biofarmaceutica più rapida, prevedibile e meno costosa.