FIORENZUOLA- D’ARDA, Italia – Come racconta Luigi Cattivelli, la storia del grano duro data a più di 10.000 anni fa, quando alcuni agricoltori neolitici iniziarono a coltivare una pianta selvatica chiamata farro.
Questi agricoltori selezionarono semi con caratteristiche che rendevano il farro più facile da raccogliere e mangiare. Nel corso delle generazioni, attraverso la coltivazione selettiva e l’incrocio, gli agricoltori selezionarono prima il grano duro e, successivamente, il grano tenero per il pane. Quando piccoli gruppi di persone migrarono dalla Mezzaluna Fertile, un’area del Medio Oriente dove si ritiene siano iniziate le prime forme di agricoltura, portarono con sé semi, adattando ulteriormente le piante ai climi e alle condizioni delle nuove terre – tra cui l’Italia, dove il grano duro divenne la materia prima alla base della pasta.
Cattivelli, un esperto del genoma del grano, dice che il prossimo capitolo della storia riguarda il nostro immediato futuro: gli scienziati devono sviluppare nuove varietà di grano e altre colture di base per affrontare il ritmo rapido dettato dai cambiamenti climatici.
“Dobbiamo adattarci al clima proprio come hanno fatto i nostri progenitori,” dice. “È fondamentalmente la stessa storia, solo che ora, il clima non cambia solo passando da una parte all’altra del pianeta ma anche nello stesso luogo da un decennio all’altro.”
Il cambiamento climatico porta un senso di urgenza
Cattivelli dirige il Centro di Ricerca Genomica a Fiorenzuola, istituto che fa parte del CREA, il Consiglio per la Ricerca in Agricoltura e l’Analisi dell’Economia Agraria del governo italiano. Cattivelli e i suoi colleghi, insieme a team di genetisti delle piante di altre parti del mondo, stanno facendo leva sulle capacità di calcolo e prestazioni del cloud Microsoft Azure per cercare di svelare i segreti del grano duro e di altre varietà di grano. Nel Progetto Pangenoma, in collaborazione con l’Università di Bologna e molti altri ricercatori in tutto il mondo, stanno studiando i genomi di circa 40 varietà di grano e dei suoi antichi antenati per individuare caratteristiche che aiuterebbero la coltura a prosperare in condizioni estreme, ad essere più efficiente nell’uso delle risorse naturali e resistente a malattie e parassiti, riducendo la necessità di fertilizzanti e pesticidi.
Non è solo una questione che riguarda la pasta per gli italiani; è una ricerca urgente a livello globale perché produrre abbastanza colture di base come grano, riso e mais è essenziale per la sopravvivenza umana.
Il grano costituisce circa il 20% delle calorie consumate dagli esseri umani in tutto il mondo. E il cambiamento climatico è una minaccia diretta alla produzione di colture a livello globale, a causa di siccità e calore, così come di piogge torrenziali e altri eventi meteorologici estremi, come le recenti alluvioni in Spagna orientale.
Attraverso un progetto di collaborazione con Microsoft, CREA ha costruito una piattaforma basata sul cloud Azure che può ospitare e analizzare una molteplicità di petabyte di dati genetici sui genomi di molte varietà di grano provenienti da più fonti. (Per avere un’idea di cosa significhi, un petabyte potrebbe contenere fino a 2.000 anni di musica digitale, se suonata ininterrottamente).
Curtis Pozniak, un genetista che dirige il Crop Development Center presso l’Università di Saskatchewan, Canada, è uno dei fondatori del Progetto Pangenoma.
“Stiamo generando petabyte di informazioni che dobbiamo filtrare in qualcosa di significativo,” dice. “L’unico modo efficiente per farlo è attraverso piattaforme basate su cloud dove gli stessi dati possono essere condivisi con una vasta gamma di esperti contemporaneamente.”
Questi dati, che sono memorizzati nel Data Center ItalyNorth di Microsoft in Italia, vengono elaborati e analizzati in quella che è conosciuta come una “pipeline”, anch’essa ospitata in Azure. Una pipeline è costituita da una serie di step di elaborazione dei dati, in questo caso gestiti con codici open-source. Questa particolare pipeline genomica è progettata per gestire miliardi di piccole sequenze che devono essere ordinate per definire i 14 cromosomi del genoma del grano duro. La pipeline è lo strumento che aiuta gli scienziati a mettere insieme quel complesso puzzle.
Questo puzzle genomico può essere visto ed utilizzato da team di scienziati ovunque si trovino nel mondo. Le conoscenze e le informazioni estratte dal puzzle genomico saranno incorporate in nuove varietà che verranno rese disponibili agli agricoltori nei prossimi anni.
“Lavorare nel cloud ci offre diversi vantaggi,” dice Cattivelli. “Ma ciò che più conta è come facciamo scienza. Ora i ricercatori di Canada, Australia, Giappone e Stati Uniti possono lavorare sugli stessi dati, con gli stessi strumenti, sullo stesso problema. È questo il vero progresso.”
Con i vantaggi del calcolo ad alta velocità e della collaborazione efficace, la velocità della ricerca è notevolmente accelerata, dice Pozniak, professore oltre che selezionatore di grano.
Dice di essere entusiasta per i ricercatori che sono agli inizi della loro carriera perché hanno strumenti che non erano disponibili quando lui stava lavorando al suo dottorato di ricerca 20 anni fa.
“Mi ci è voluta la maggior parte del mio dottorato di ricerca per clonare un singolo gene che era importante per una caratteristica del grano,” ricorda Pozniak. “Con il tipo di dati e strumenti di analisi che abbiamo ora a disposizione, lo stiamo facendo in poche settimane o mesi. È un momento emozionante per uno scienziato.”
L’evoluzione del grano
Il grano fa parte della storia personale di Cattivelli: è cresciuto in una fattoria nella Valle del Po a circa 20 chilometri dal suo ufficio al centro di ricerca. Suo padre coltivava, tra le altre colture, il grano.
I ricercatori del CREA stanno utilizzando un approccio multidisciplinare chiamato genomica per ottenere una comprensione granulare del grano (gioco di parole intenzionale). La genomica combina biologia, bioinformatica e tecnologia dell’informazione per analizzare e interpretare dati biologici. Gli strumenti sono diversi, ma gli obiettivi sono gli stessi di sempre – selezionare le caratteristiche per garantire il miglior raccolto possibile.
“La bioinformatica è solo l’ultimo capitolo della storia,” dice Cattivelli.
Una delle sue colleghe al Centro di Ricerca Genomica, Primetta Faccioli, ha guidato il gruppo impegnato nel creare il sistema nel cloud Microsoft Azure per memorizzare e analizzare i dati genomici. Faccioli ha iniziato la sua carriera come biologa di laboratorio, ma da oltre vent’anni si occupa esclusivamente di analisi dati.
Come Cattivelli, Faccioli è cresciuta in una fattoria vicino al centro di ricerca a Fiorenzuola e come lui si è innamorata della genetica – la storia dietro le piante che la sua famiglia coltivava.
“Qualche anno fa, pensavamo che la produzione di dati fosse più difficile della loro analisi, ma non è così,” dice. “Abbiamo bisogno di entrambi allo stesso modo. Le biologie wet e dry devono lavorare sinergicamente.”
Scienziati che lavorano a livello globale per decifrare i codici genomici
Il genoma del grano per il pane (grano tenero) è stato completato, con grande clamore, nel 2017. Ma questo è solo un passo. Il genoma, essenzialmente una lista di geni che compongono un essere vivente, contiene miliardi di basi di DNA in sequenze specifiche (se ricordate la vostra lezione introduttiva di biologia, quelle sequenze sono composte da un alfabeto di quattro lettere, A, C, G e T).
Quelle sequenze sono codici elaborati che descrivono il funzionamento di un essere vivente nei dettagli più intricati e minuti. Il grano ha un genoma particolarmente elaborato – il grano duro ha 10,5 miliardi di basi (il grano tenero ha circa 15 miliardi di basi) – più di tre volte il genoma umano, dicono gli scienziati del CREA.
“L’idea è trovare i geni che controllano caratteristiche specifiche nella pianta, rendendo possibile creare nuove varietà con le caratteristiche desiderate e con maggiore velocità,” dice Faccioli.
Per tornare alla metafora del puzzle, il cloud Azure crea il tavolo dove gli scienziati possono mettere insieme tutti i pezzi. “Ma con molte persone che lavorano contemporaneamente, deve esserci controllo di qualità, riproducibilità e portabilità,” dice Faccioli. (Prima del cloud, molte istituzioni spedivano valigie piene di hard disk per condividere i dati.)
Faccioli, Mario Giorgioni, specialista ICT presso CREA, e Wolfgang De Salvador, specialista Microsoft dell’high-perfomance computing e infrastruttura AI, hanno lavorato insieme per costruire quella che è conosciuta come una pipeline.
Hanno costruito questa serie di passaggi di calcolo utilizzando un orchestratore di workflow chiamato Nextflow, creato e supportato dal partner Microsoft Seqera. Questo sistema nel cloud Azure ha consentito ai team di lavorare insieme, utilizzando la stessa sequenza di programmi open-source per raggiungere risultati riproducibili. Giorgioni dice che hanno costruito questa piattaforma di ricerca centralizzata con strumenti che supportano i tre pilastri principali di qualsiasi sistema di calcolo ad alte prestazioni: archiviazione condivisa veloce, risorse di calcolo ad alte prestazioni e interconnessioni di rete veloci.
“L’infrastruttura, costruita utilizzando Azure CycleCloud e sfruttando i servizi HPC di Azure, consente ai ricercatori di scalare facilmente le risorse computazionali come necessario” dice. L’archiviazione condivisa basata su Azure Blob funge da backbone, offrendo la larghezza di banda e la scalabilità necessarie per progetti di ricerca intensivi in termini di dati.
“I ricercatori hanno accesso a una vasta gamma di risorse di calcolo per affrontare le sfide più intricate nel loro lavoro quotidiano,” dice.
“Le pipeline basate su Nextflow stanno aiutando gli scienziati del progetto a convertire i dati grezzi sul genoma del grano in informazioni utili” dice Faccioli.
“Per dirlo in termini semplici,” aggiunge Faccioli, che spesso incontra gli studenti in visita al centro CREA, spiego che c’è una grande differenza tra dati e informazioni. Come esempio fornisco ai ragazzi un numero, e quello è solo un dato, non dice nulla. Ma se dico loro che quel numero è il numero di telefono di questo ufficio, quella è un’informazione.”
Elisabetta Mazzucotelli è una delle ricercatrici a Fiorenzuola che lavorano al Progetto Pangenoma. Parte del suo lavoro consiste nel setacciare i genomi di molte varietà di grano duro e dei suoi antenati per riscoprire antiche, ma utili caratteristiche genetiche.
Quando una specie viene messa in coltura (o come si dice “addomesticata”) e poi selezionata per avere varietà più produttive, alcune caratteristiche genetiche utili rimangono nelle popolazioni locali o nelle forme selvatiche con il rischio che si perdano per sempre.
“Dobbiamo trovare e registrare tutta la diversità genetica che esiste perché ora stiamo affrontando nuove sfide a causa dei cambiamenti climatici,” dice. “Potrebbero esserci caratteristiche di resistenza alle malattie, o in generale una migliore capacità di crescita, che sono rimaste nella biodiversità selvatica ma che sarebbero molto utili nelle moderne varietà di grano duro.”
Mazzucotelli dice che la capacità di supercalcolo nel cloud Azure permette di gestire e confrontare quantità di dati che sarebbero stati impossibili prima. Per lei, è un altro strumento nella ricerca della conoscenza.
“Sono molto curiosa, e quando vedo una pianta verde in un campo pieno di altre piante gialle e suscettibili alle malattie, mi chiedo perché ci sia questa differenza,” dice. “E nella maggior parte dei casi, il risultato è a livello genetico. Questo significa che possiamo usare questa differenza per portare innovazione e creare una nuova soluzione. Possiamo usare le caratteristiche di questa pianta verde per far sì che molte, molte altre piante siano verdi e sane come questa.”