El genoma humano está almacenado en 23 pares de cromosomas del núcleo celular y en el pequeño ADN mitocondrial. En la actualidad se sabe mucho sobre las secuencias de ADN que se encuentran en nuestros cromosomas. Ahora se sabe en parte lo que hace el ADN. La aplicación de estos conocimientos en la práctica no ha hecho más que empezar.

El Proyecto Genoma Humano (PGH) produjo una secuencia de referencia que se utiliza en todo el mundo en biología y medicina. Nature publicó el informe del proyecto, financiado con fondos públicos, y Science publicó el artículo de Celera. Estos artículos describen cómo se produjo el borrador de la secuencia y ofrecen un análisis de la misma. En 2003 y 2005 se anunciaron borradores mejorados que completaron hasta ≈92% de la secuencia.

El último proyecto ENCODE estudia la forma en que se controlan los genes.

Qué entendemos por genoma humano

El genoma humano es el conjunto completo de información genética de una persona, expresada en moléculas de ADN. En términos prácticos se suele hablar de la secuencia de referencia —una versión representativa del genoma que sirve para comparar y mapear datos genómicos—, pero cada individuo tiene pequeñas diferencias respecto a esa referencia (variantes genéticas).

Estructura física y tamaño

Organización: la mayor parte del material genético se encuentra en el núcleo, distribuido en 23 pares de cromosomas (22 autosomas más los cromosomas sexuales). Además existe ADN mitocondrial (ADNmt), una molécula circular más pequeña que reside en las mitocondrias y que se hereda mayoritariamente por vía materna.

  • Tamaño: la secuencia haploide del genoma humano contiene aproximadamente 3.200 millones de pares de bases (≈3,2 Gb). En una célula diploide hay el doble de bases.
  • Genes: hay entre ≈20.000 y 25.000 genes que codifican proteínas; además existen miles de genes que producen ARN no codificante (microARN, lncRNA, etc.).
  • Porcentaje codificante: sólo alrededor del 1–2% del genoma codifica proteínas. El resto incluye regiones reguladoras, intrones, secuencias repetitivas (transposones, LINEs, SINEs), telómeros y centrómeros.
  • ADN mitocondrial: tiene ~16.6 kb (≈16.569 pares de bases) y codifica genes esenciales para la respiración celular.

Funciones principales del genoma

  • Coding: los exones de genes codifican las proteínas que realizan funciones estructurales, enzimáticas y regulatorias en la célula.
  • Regulación génica: promotores, enhancers, silencers y otros elementos controlan cuándo, dónde y cuánto se expresa un gen. Proyectos como ENCODE han identificado y caracterizado muchos de estos elementos regulatorios.
  • ARN no codificante: ARN con funciones regulatorias y estructurales (p. ej., microARNs que regulan traducción, lncRNAs implicados en control de cromatina).
  • Estructura y estabilidad cromosómica: telómeros protegen los extremos cromosómicos; los centrómeros son esenciales para la separación cromosómica en la mitosis.
  • Variación genética: polimorfismos de un solo nucleótido (SNPs), variantes estructurales y deleciones/duplicaciones generan diversidad entre individuos y pueden influir en la salud y en rasgos fenotípicos.
  • Epigenética: modificaciones químicas del ADN (metilación) y de las histonas regulan la accesibilidad del ADN y la expresión génica sin cambiar la secuencia.

Proyectos clave y avances históricos

  • Proyecto Genoma Humano (PGH): iniciativa pública (1990–2003) que produjo la primera secuencia de referencia y un borrador público amplio; sus resultados se publicaron, entre otras, en Nature.
  • Celera Genomics: empresa privada que publicó un análisis complementario en Science, usando una estrategia diferente de ensamblaje y secuenciación.
  • Mejoras posteriores (2003–2005): se anunciaron versiones más completas que alcanzaron aproximadamente ≈92% de la secuencia, corrigiendo y rellenando huecos del borrador inicial.
  • ENCODE: proyecto dedicado a identificar elementos funcionales y regulatorios del genoma; ha revelado que gran parte del ADN tiene actividad bioquímica o papel regulador.
  • Telomere-to-Telomere (T2T): consorcio que, en 2021–2022, publicó una versión prácticamente completa (CHM13) que resolvió regiones muy repetitivas y centrómeros que faltaban en la referencia original.
  • Human Pangenome Reference Consortium (HPRC): proyecto para construir una referencia que represente mejor la diversidad genética humana, evitando el sesgo de usar una única secuencia de referencia.

Herramientas y tecnologías

  • Sanger: método clásico usado en el PGH para secuenciar fragmentos largos con alta precisión.
  • Secuenciación masiva (NGS): tecnologías de segunda generación (p. ej. Illumina) que abarataron enormemente el coste y permitieron secuenciar muchos genomas.
  • Lecturas largas: tecnologías como PacBio y Oxford Nanopore permiten resolver regiones repetitivas y ensamblar genomas más completos (clave para el proyecto T2T).
  • Bioinformática: herramientas para ensamblaje, alineamiento, anotación y análisis de variantes son esenciales para convertir datos de secuencia en conocimiento biológico y clínico.

Aplicaciones, beneficios y retos éticos

El conocimiento del genoma ha impulsado la medicina (diagnóstico genético, pruebas prenatales, oncología de precisión, farmacogenómica), la biotecnología y la investigación sobre el origen y la evolución humana. Sin embargo, plantea retos:

  • Privacidad y seguridad de los datos genómicos: riesgos de reidentificación y uso indebido.
  • Desigualdad en el acceso a pruebas y terapias basadas en genómica.
  • Implicaciones éticas de la edición genética (CRISPR), selección genética y manipulación germinal.
  • Necesidad de referencias más diversas para evitar sesgos en investigación y medicina.

Perspectivas futuras

La genómica avanza hacia referencias más completas y representativas (pangenomas), mayor integración de datos epigenómicos y de expresión, y aplicaciones clínicas más precisas. El reto es traducir este conocimiento en beneficios sanitarios equitativos, manteniendo altos estándares éticos y de protección de datos.