Cada 25 d’abril celebrem el Dia Internacional de l’ADN, una data que commemora dues fites fonamentals: el descobriment de la seva estructura l’any 1953, i la culminació del primer esborrany del Projecte Genoma Humà el 2003. Aquestes fites van obrir una nova etapa en la biologia, i avui sabem que per entendre completament la biodiversitat de la Terra cal anar més enllà de l’ADN humà: cal seqüenciar el genoma de totes les espècies. I en aquest gran repte, els genomes de referència hi tenen un paper central.
Què és un genoma de referència?
Un genoma de referència és una versió completa, acurada i anotada del genoma d’una espècie, obtinguda a partir de la seqüenciació d’un o diversos individus. Conté totes les regions del genoma —tant les codificants com les no codificants— i ofereix una representació coherent de la seva estructura i contingut. La importància dels genomes de referència, rau en en el fet que com el seu nom indica, s’utilitzen com a referència estàndard, un model sobre el qual es comparen totes les dades genètiques posteriors d’aquella espècie o d’espècies properes.
Quan es seqüencia l’ADN d’un nou individu, aquest no s’analitza aïlladament, sinó que es mapeja sobre el genoma de referència per identificar les diferències. Això permet detectar mutacions, estudiar la variació entre poblacions, localitzar gens amb funcions conegudes o desconegudes, i entendre com es regulen o interaccionen aquests gens. Sense un genoma de referència de qualitat, totes aquestes anàlisis serien molt menys precises, i en molts casos, directament inviables.
Per això, els genomes de referència són recursos fonamentals per a l’ecologia molecular, l’estudi de l’adaptació a l’entorn, la bioprospecció o la identificació de marcadors útils per a la conservació genètica.
El repte de crear un genoma de referència
Generar un genoma de referència és una tasca complexa que requereix de precisió tècnica, recursos avançats i una planificació molt acurada. El procés comença amb la selecció de l’espècie i, dins d’aquesta, dels individus que es seqüenciaran. És important que aquests individus tinguin una baixa heterozigositat, és a dir, poca variació entre les dues còpies del seu genoma, per evitar ambigüitats durant l’assemblatge posterior.
Un cop seleccionats, cal extreure l’ADN. A més, cal que aquest material genètic sigui d’alta qualitat i amb un pes molecular elevat. Aquest requisit és essencial per poder aplicar tecnologies que permetin llegir fragments molt llargs de DNA. Aquestes tecnologies de lectura llarga, permeten reconstruir regions del genoma que abans eren inaccessibles, com ara repeticions llargues, centròmers o estructures cromosòmiques complexes.
El pas següent és l’assemblatge bioinformàtic, un procés que utilitza algoritmes per reconstruir el genoma complet a partir de milions o milers de milions de fragments de seqüència. L’objectiu és obtenir una representació coherent i contigua del genoma, preferiblement a escala de cromosomes sencers. Aquesta etapa pot esdevenir especialment difícil en genomes amb moltes repeticions, regions estructuralment complexes o una mida molt gran.
Finalment, cal fer l’anotació funcional, és a dir, identificar i descriure les diferents parts del genoma: gens, exons, introns, regions reguladores, i altres elements que tenen una funció biològica coneguda o potencial.
Una eina clau per al futur de la biodiversitat
En el context de la crisi de biodiversitat, els genomes de referència s’han convertit en una eina clau per a la conservació. La recerca actual demostra que disposar d’un bon genoma de referència pot ajudar a detectar reduccions de la variabilitat genètica, a identificar mutacions associades a la salut o a l’adaptació, i a dissenyar estratègies de conservació més precises i eficients. Tal com assenyalen Formenti i els seus col·laboradors (2022), la genòmica de la conservació només pot avançar si disposa d’una base genòmica sòlida.
El Catalan BioGenome Project, en el marc del Earth BioGenome Project, treballa precisament per construir aquests recursos de referència per a espècies representatives de la biodiversitat catalana, tant marina com terrestre. Amb aquest objectiu, impulsa la generació de genomes de referència d’alta qualitat per a espècies clau pel seu valor ecològic, científic o patrimonial, contribuint així a una gestió més informada del nostre entorn natural.
Referències
- Lewin, H.A., et al. (2018). Earth BioGenome Project: Sequencing life for the future of life. Proceedings of the National Academy of Sciences, 115(17), 4325–4333. https://doi.org/10.1073/pnas.1720115115
- Formenti, G., et al. (2022). The era of reference genomes in conservation genomics. Trends in Ecology & Evolution, 37(3), 197–202. https://doi.org/10.1016/j.tree.2021.11.008
- Corominas, M., et al. (2024). The Catalan initiative for the Earth BioGenome Project: contributing local data to global biodiversity genomics. NAR Genomics and Bioinformatics, 6(3), lqae075. DOI: https://doi.org/10.1093/nargab/lqae075