Mappa del genoma umano è completa, impresa compiuta dopo 21 anni
5 min di letturaMaxi consorzio di scienziati ha sequenziato l’8% mancante, niente più lacune nei 3 miliardi di lettere del Dna
Quando nel 2001 vennero annunciati i primi risultati ottenuti nell’impresa di decifrare il genoma umano, la portata della scoperta fu paragonata allo sbarco sulla Luna. Oggi quell’impresa si compie.
Un maxi consorzio di scienziati annuncia che la sequenza del genoma umano è ora completa. Circa 20 anni dopo l’inizio dell’avventura alla scoperta del Dna dell’uomo, quell’8% mancante che non era ancora stato pienamente sequenziato, soprattutto perché costituito da frammenti altamente ripetitivi difficili da allineare con il resto, è stato riempito, è andato al suo posto. Niente più lacune nei 3 miliardi di basi (o ‘lettere’) del genoma, esultano gli autori dello studio che segnerà per sempre la storia della medicina, pubblicato su ‘Science’.
T2T-CHM13: è il codice che nella comunità scientifica nessuno dimenticherà. Così è stato soprannominato il genoma appena completato. E questo, spiegano gli esperti, è un aggiornamento molto importante rispetto all’attuale genoma di riferimento, chiamato GRCh38, che viene utilizzato dai medici durante la ricerca di mutazioni legate alle malattie, nonché dagli scienziati che osservano l’evoluzione della variazione genetica umana.
In 20 anni si è passati dunque dalla prima ‘bozza’ – quella prodotta dallo Human Genome Project – all’opera definitiva, cioè la prima sequenza completa e priva di interruzioni di un genoma umano. A firmare l’impresa il consorzio Telomere to Telomere (T2T), che comprende la leadership dei ricercatori di National Human Genome Research Institute (Nhgri, realtà dei National Institutes of Health-Nih statunitensi), che è stato il principale finanziatore dello studio, Università della California a Santa Cruz e Università di Washington a Seattle.
“La generazione di una sequenza del genoma umano veramente completa rappresenta un incredibile risultato scientifico”, commenta il direttore del Nhgri, Eric Green. “Queste informazioni fondamentali – prosegue – rafforzeranno i numerosi sforzi in corso per comprendere tutte le sfumature funzionali del genoma umano, che a loro volta rafforzeranno gli studi genetici sulle malattie umane”.
Le regioni su cui sono stati colmati gli ultimi vuoti erano difficili da posizionare sui cromosomi. L’analisi della sequenza completa del genoma permetterà di approdare a mappe più accurate per 5 bracci cromosomici, e tutto questo aprirà nuovi filoni di ricerca. Si potrà rispondere così alle domande di biologia di base su come i cromosomi si segregano e si dividono correttamente. Il consorzio T2T ha utilizzato la sequenza del genoma ora completa come riferimento per scoprire oltre 2 milioni di varianti aggiuntive nel genoma umano. Questi studi forniscono informazioni più accurate sulle varianti genomiche all’interno di 622 geni clinicamente rilevanti. E ancora: queste informazioni saranno particolarmente preziose per studi mirati a comprendere come il Dna delle persone differisce. Sono intuizioni vitali per comprendere i contributi genetici a determinate malattie e per utilizzare la sequenza del genoma come parte di routine dell’assistenza clinica in futuro.
Molti gruppi di ricerca hanno già iniziato a utilizzare una versione preliminare della sequenza completa del genoma umano per le loro ricerche. Migliaia di ricercatori hanno sviluppato strumenti di laboratorio, metodi computazionali e approcci strategici migliori per decifrare la sequenza complessa. Sei articoli che comprendono la sequenza completata appaiono su ‘Science’, insieme ad articoli complementari in molte altre riviste.
Questo, osservano gli autori, non è solo un traguardo, ma una partenza per molti altre esplorazioni scientifiche. Da questo fusto gemmeranno nuovi lavori. E dietro questa impresa si nascondono storie di vita. Come quella di Evan Eichler, che è sempre stato attratto dalle regioni più complesse del genoma dell’umanità: quelle più bizzarre con tratti lunghi di Dna ripetuto o con copie extra di geni. Sospettava che queste regioni potessero svolgere ruoli cruciali nell’evoluzione e nella malattia. Ecco perché, più di 20 anni fa, è diventato parte del Progetto Genoma umano, un programma da 3 miliardi di dollari per ‘leggere’ ogni lettera del Dna di una persona.
Nel 2003 questo maxi sforzo di sequenziamento non era riuscito a leggere più dell’8% del genoma. Gli scienziati sapevano che questi pezzi mancanti contenevano sequenze altamente ripetitive e in gran parte li hanno liquidati come ‘spazzatura’. Non è così, dice Eichler, ricercatore dell’Howard Hughes Medical Institute all’Università di Washington. “Si è scoperto che molte delle regioni a cui ero interessato erano proprio in quei vuoti” non ancora riempiti. E così Eichler si è impegnato a finire il lavoro, insieme al team di circa 100 scienziati guidati da Adam Phillippy del Nhgri e Karen Miga dell’Università della California, Santa Cruz (Ucsc).
Nel manoscritto genetico della vita “stiamo vedendo capitoli che non sono mai stati letti prima”, racconta Eichler. Sapere che “non ci sono più parti nascoste o sconosciute”, aggiunge il genetista dell’Università di Washington Robert Waterston, leader nell’originale Human Genome Project e non coinvolto nel nuovo lavoro, “penso che psicologicamente sia una cosa importante”. I dati, afferma Miga, offrono “le basi per una nuova era” nello studio dei centromeri, le parti che tengono insieme i due filamenti di cromosomi e svolgono ruoli cruciali nella divisione cellulare. Le regioni ripetitive includono questi e il Dna ribosomiale, che fornisce istruzioni per le fabbriche proteiche della cellula. In passato, tutta quella ripetizione rendeva impossibile assemblare alcuni pezzi spezzettati nell’ordine corretto. E’ come avere pezzi identici di un puzzle: gli scienziati non sapevano dove andassero. Oggi con l’avanzamento della tecnologia è stato possibile risolvere l’enigma. “Ora abbiamo una stele di Rosetta per osservare la variazione completa in centinaia di migliaia di altri genomi in futuro”, conclude Eichler.