La visione più completa del genoma umano fino ad oggi: gli scienziati scoprono nuove varianti che potrebbero essere alla base di malattie come il cancro.

Nel 2003, il Progetto Genoma Umano ci ha fornito la prima sequenza del genoma umano. Quell'anno, il consorzio che ha ideato il progetto ha annunciato di aver assemblato l'85% della sequenza del codice genetico di un essere umano – la ricetta genetica che ci rende ciò che siamo – sebbene si basasse solo sul DNA di un piccolo gruppo di persone .
Da questo evento di successo, nel 2007 è nato il Progetto 1000 Genomi, con l'ambizioso obiettivo di sequenziare 1.000 genomi umani. Un obiettivo ampiamente superato quando, nel 2015, sono stati pubblicati i risultati ottenuti da oltre 2.500 individui di diverse origini. Insieme, entrambi i progetti hanno contribuito ad ampliare la conoscenza dell'umanità sulla genetica che ci rende unici e che è alla base della nostra biologia.
Ora, dieci anni dopo i primi risultati del progetto 1000 Genomes, gli scienziati dell'European Molecular Biology Laboratory (EMBL) e i collaboratori delle istituzioni partner hanno svelato nuove intuizioni sulla biologia umana grazie a un'analisi approfondita dei dati resa possibile solo dall'avvento di nuovi metodi e tecnologie rivoluzionari sviluppati nell'ultimo decennio.
I risultati, pubblicati in due pubblicazioni consecutive sulla rivista Nature , costituiscono quella che potrebbe essere la visione più completa del genoma umano fino ad oggi . E come spiega Jan Korbel, responsabile del gruppo e direttore ad interim dell'EMBL Heidelberg, nonché coautore senior dei nuovi studi, 15 anni fa la maggior parte del sequenziamento del genoma umano si basava su "letture" di piccoli frammenti di DNA, insufficienti per ricostruire un genoma completo, ma sufficienti a consentire lo studio della variazione genetica in porzioni più ampie del genoma.
Il cambiamento è avvenuto circa cinque anni fa, quando è stata introdotta sul mercato una nuova tecnologia che ha reso possibile il sequenziamento sistematico dei genomi umani e la decodifica di tratti di DNA molto più lunghi. " Questo ci consente di assemblare l'intero genoma degli individui e di valutarne la variazione genetica in tutte le sue parti ", afferma Korbel.

La nuova analisi fornisce una visione più completa della variazione genetica umana. Foto: Daniela Velasco/EMBL
Queste tecnologie sono note come metodi di sequenziamento a lettura lunga e gli scienziati dell'EMBL le hanno utilizzate per migliorare la nostra comprensione dello sviluppo del cancro e per la ricerca ambientale . "Volevamo sfruttare la potenza di queste nuove e innovative tecniche di sequenziamento per saperne di più sulla variabilità genetica umana", ha affermato Korbel.
Queste variazioni – differenze nella sequenza del DNA tra individui – non solo contribuiscono all'unicità di ogni persona, ma svolgono anche un ruolo importante nella salute e nelle malattie genetiche, incluso il cancro. Queste alterazioni genetiche vanno da piccole differenze in una o più "lettere" del codice genetico a differenze molto più profonde, con interi tratti di DNA cancellati, invertiti, ripetuti o aggiunti in alcuni individui .
Visioni più raffinate I due nuovi studi utilizzano tecnologie di sequenziamento a lettura lunga per approfondire queste variazioni strutturali nel genoma . Il primo studio ha analizzato 1.019 genomi dal dataset del 1000 Genomes Project, distribuiti in 26 popolazioni di cinque continenti, da cui i ricercatori hanno creato mappe dettagliate di questi cambiamenti nei genomi di questi individui.
Le variazioni strutturali consistono in grandi frammenti di DNA che sono stati cancellati, duplicati, inseriti, invertiti o riorganizzati. Le differenze tra individui possono comportare modifiche a migliaia di lettere di DNA contemporaneamente, spesso causando la distruzione di geni e l'insorgenza di numerose malattie rare e tumori.
Il team ha trovato e categorizzato oltre 167.000 varianti strutturali nei 1.019 individui, raddoppiando la quantità nota di variazione strutturale nel pangenoma umano, un riferimento che unisce il DNA di molte persone anziché basarsi su un singolo genoma. Ogni persona presentava una mediana di 7,5 milioni di lettere di cambiamenti strutturali, evidenziando le vaste capacità di editing del genoma che la natura può eseguire da sola.
Oltre a generare nuove conoscenze biologiche, queste nuove informazioni potrebbero ampliare di oltre venti volte il grafico di riferimento di 44 genomi pubblicato dall'Human Pangenome Reference Project nel 2023. "Con questa tecnologia siamo stati in grado di rilevare una grande quantità di informazioni genetiche rare, presenti in meno dell'1% della popolazione mondiale e precedentemente sconosciute", ha spiegato a EL TIEMPO Bernardo Rodríguez Martín, del Center for Genomic Regulation (Spagna), uno degli autori dello studio.
Rodríguez-Martín ha iniziato a lavorare al progetto nel laboratorio di Jan Korbel all'EMBL e lo ha completato dopo essersi trasferito al CRG per fondare il proprio gruppo. Da lì, ha sviluppato Svan, un software che classifica ogni cambiamento nel DNA come "pezzo extra copiato" o "frammento cancellato", aiutando il team ad analizzare i dati genetici per identificare nuovi modelli.

Bernardo Rodríguez-Martin (a sinistra) ed Emiliano Sotelo-Fonseca al Centro di Ricerca per la Regolazione Genomica di Barcellona. Foto: Omar Jamshed/Centro per la Regolazione Genomica
Questo software ha rivelato che oltre la metà della diversità appena mappata nel genoma umano si trovava in frammenti di DNA altamente ripetitivi, parti del genoma precedentemente considerate spazzatura o troppo difficili da studiare. "Gli elementi ripetitivi rappresentano una riserva ricca e precedentemente ignorata di diversità genetica. Sono attori chiave nella diversità umana, nelle malattie e nell'evoluzione", ha affermato Emiliano Sotelo-Fonseca, dottorando presso il CRG e coautore del primo studio.
Queste mappe delle variazioni nel genoma umano sono di grande rilevanza clinica, poiché servono da riferimento per comprendere cosa non funziona in determinate condizioni patologiche. "Attraverso una proof of concept, abbiamo visto che questi risultati facilitano la diagnosi di malattie rare, perché per rilevare queste patologie con una base genetica di tutte le varianti presenti in un individuo, dovremmo esaminarne circa 25.000. Utilizzando la nostra nuova risorsa genomica di variazione genetica, possiamo ridurre lo spazio di ricerca a poche centinaia di varianti e persino a meno di 200 varianti strutturali", spiega Rodríguez Martín.
Un campione più piccolo Il secondo studio, d'altra parte, ha utilizzato un campione molto più piccolo di soli 65 individui, ma ha combinato diversi metodi di sequenziamento più potenti per creare genomi più completi di qualsiasi altro sequenziato fino ad oggi . Per diversi cromosomi, i ricercatori hanno assemblato sequenze end-to-end, un'impresa notevole considerando che i cromosomi umani possono avere centinaia di milioni di coppie di basi (o "lettere").
Ciò ha permesso ai ricercatori di decodificare sezioni particolarmente difficili da leggere, come i centromeri . Avendo a disposizione assemblaggi quasi completi e privi di lacune di ciascun cromosoma degli individui analizzati, gli scienziati sono stati in grado di rilevare ampie varianti genetiche in regioni che non erano state rilevate nel primo articolo o in altri studi.
Questi risultati hanno dimostrato agli esperti che combinare l'approccio del primo articolo, con molti genomi sequenziati a una profondità moderata, con l'approccio del secondo articolo, con pochi genomi sequenziati in grande dettaglio, è la strada più rapida per ottenere una mappa completa e inclusiva della diversità genetica umana.
eltiempo