Il Premio Nobel per la Chimica 2024 a David Baker, Demis Hassabis e John M. Jumper che hanno vinto per i loro studi sulle strutture delle proteine
Il Premio Nobel per la Chimica 2024 va per metà a David Baker “per il design computazionale delle proteine” e per l’altra metà, congiuntamente a Demis Hassabis e John M. Jumper “per la predizione della struttura delle proteine”.
Il Nobel per la Chimica 2024 riguarda il più ingegnoso e brillante strumento chimico della vita: le proteine, delle quali i tre scienziati appena premiati hanno decifrato il codice segreto. David Baker è riuscito in un compito che si riteneva impossibile: creare tipi di proteine interamente nuovi.
Demis Hassabis e John Jumper hanno sviluppato un modello di IA per risolvere un problema che ci trascinavamo da cinquant’anni, ossia prevedere le complesse strutture delle proteine.
Entrambe scoperte che hanno un enorme potenziale.
Il ruolo dei tre scienziati. David Baker, nato nel 1962 a Seattle e oggi Professore all’Università di Washington, Seattle, ha sviluppato metodi computerizzati per creare, nel 2003, una proteina che in precedenza non esisteva, e che ha funzioni interamente nuove.
La proteina, chiamata Top7, ha una struttura unica che non esiste in natura.
Tutti coloro che prima di Baker si erano cimentati in questo compito, avevano creato soltanto proteine che imitassero strutture esistenti.
La Top7, con i suoi 93 amminoacidi, è anche la più grande mai prodotta usando un design completamente nuovo. Da allora, il gruppo di ricerca di Baker ha prodotto una proteina inedita dietro l’altra, incluse proteine che possono essere usate in nuovi farmaci, in vaccini, nanomateriali e minuscoli sensori.
Da quel momento, AlphaFold2 è stato usato da oltre 2 milioni di persone in 190 Paesi, per una miriade di applicazioni scientifiche – da studi per comprendere meglio i meccanismi dell’antibiotico-resistenza a ricerche per immaginare enzimi in grado di decomporre meglio la plastica. Il Nobel per la Chimica 2024 premia due scoperte diverse ma, come vedremo, strettamente collegate.
Le tappe storiche dello studio delle proteine.
Il primo balzo in avanti nella ricerca sulle proteine arriva alla fine degli anni ’50, quando gli scienziati di Cambridge John Kendrew e Max Perutz usano con successo la cristallografia a raggi X (una tecnica per determinare la struttura dei cristalli) per presentare i primi modelli tridimensionali delle proteine.
Per questa impresa i due vincono un Nobel per la Chimica, nel 1962. Da allora la cristallografia ai raggi X è stata il metodo primario per produrre le immagini della struttura di circa 200.000 proteine.
Un altro tassello fondamentale sulla ricerca sulle proteine viene dal lavoro dello scienziato statunitense Christian Anfinsen, che nel 1961 concluse che il modo in cui una proteina si ripiega è determinato esclusivamente dalla sequenza di amminoacidi che la compongono (un’altra scoperta da Nobel, assegnato nel 1972).
Il processo è predeterminato: tutte le informazioni relative al ripiegamento delle proteine sono insite nella catena di amminoacidi che le formano, tant’è che, anche quando la catena è molto lunga, il processo all’interno di una cellula avviene in pochi millisecondi.
Da queste scoperte l’intuizione che, nota la sequenza di amminoacidi, dovrebbe essere possibile conoscere il modo in cui una proteina si ripiegherà. Dunque il problema si sposta dalle tecniche di imaging, laboriose, costose e non applicabili a tutte le strutture, a quelle di predizione. Per incoraggiare la ricerca in questo campo viene ideata la Critical Assessment of Protein Structure Prediction (CASP), una competizione ad anni alterni in cui i ricercatori di tutto il mondo vengono invitati a indovinare la struttura 3D di proteine a partire da sequenze date di amminoacidi. Nel 2018, la competizione viene portata a un altro livello.
Demis Hassabis, neuroscienziato, esperto giocatore di scacchi, sviluppatore e co-fondatore della DeepMind, nel 2014 acquisita da Google, entra nella competizione CASP forte del successo della sua compagnia nell’aver battuto per la prima volta, con un programma di AI, il campione umano del gioco del Go, che prevede infinite possibili combinazioni di mosse.
Con il modello di AI sviluppato dal suo team, AlphaFold, l’accuratezza di predizione della struttura delle proteine passa dal 40% al 60%. Un progresso inaspettato, ma ancora lontano dal 90% che occorre.
Il team continua a lavorare al modello ma senza grandi progressi. Pare arrivato a un binario morto. Finché John Jumper, uno scienziato assunto da poco con un solido background in fisica teorica e idee creative su come migliorare AlphaFold, non dà un nuovo impulso alle ricerche. Nasce così AlphaFold2, che sfrutta reti neurali chiamate transformers – capaci di trovare pattern in enormi moli di dati in modo più flessibile rispetto alle precedenti, e di capire su che cosa è bene concentrarsi per raggiungere un determinato obiettivo.
AlphaFold2 viene addestrato su una grande quantità di informazioni tratte da tutti i database noti di proteine, e, quando partecipa alla CASP, dimostra di saper risolvere la struttura delle proteine praticamente con la stessa precisione della cristallografia ai raggi X. Non c’è più gara.
Nel frattempo, David Baker aveva cominciato a produrre proteine del tutto nuove “da zero” (o de novo, come si dice in gergo) perché il numero di proteine presenti in natura è limitato, e per ottenere nuove funzioni è necessario fare tabula rasa dei modelli preesistenti.
Come egli stesso ha spiegato: «Se si vuole costruire un aeroplano, non si comincia col modificare un uccello; piuttosto, si comprendono i principi dell’aerodinamica e si costruiscono macchine volanti basate su quei principi».
La sua ricerca inizia negli anni ’90, e lo porta a sviluppare un software, chiamato “Rosetta”, che funziona così: si progetta una proteina e si chiede a Rosetta di calcolare quale tipo di sequenza di amminoacidi può dare origine alla proteina desiderata.
Il programma cerca in un database di tutte le strutture proteiche note sino a trovare frammenti di proteine che presentino somiglianze con la struttura che serve. E a quel punto propone una sequenza di amminoacidi.
Nel 2003, Baker pubblica i risultati del successo di Rosetta nel costruire la Top7, una proteina pensata, sviluppata e creata de novo con il software Rosetta, e con le caratteristiche desiderate.
Inoltre,rende pubblico il codice di Rosetta in modo che sia liberamente accessibile alla comunità scientifica. Un’altra decisione rivoluzionaria (lo stesso è stato fatto per AlphaFold2): ricerche che un tempo richiedevano anni sono, grazie agli sforzi e alle ricerche dei tre Nobel premiati, ora risolvibili in pochi minuti.
Un Premio Nobel che fa bene
Hassabis e Jumper hanno calcolato la struttura di tutte le proteine umane e predetto quella delle 200 milioni di proteine note sulla faccia della Terra.
Le predizioni di AlphaFold non sono perfette, ma il modello riesce anche a dire quanto è attendibile la struttura che ha previsto. Baker ha realizzato il potenziale dei modelli di AI basati su reti neurali transformer e l’ha sfruttato in Rosetta, migliorando di molto il design de novo delle proteine.
Conoscere meglio le strutture e le funzioni delle proteine, e saperne creare di nuove, permette di comprendere meglio i meccanismi di base della vita, di capire come si sviluppano le malattie, di ottenere nuovi farmaci e nuovi materiali, di usare la scienza per promuovere una crescita sostenibile.