Proyecto ENCODE: Enciclopedia de elementos funcionales del genoma humano

Proyecto ENCODE: la enciclopedia del genoma humano que revela elementos funcionales y reguladores clave, desmonta el mito del "ADN basura" y guía la investigación genética.

Autor: Leandro Alegsa

ENCODE (Enciclopedia de Elementos de ADN) es un proyecto internacional lanzado en 2003 cuyo objetivo fue identificar y catalogar los elementos funcionales del genoma humano. El esfuerzo se realizó mediante la cooperación de más de 400 científicos en 32 laboratorios de Estados Unidos, Reino Unido, España, Singapur y Japón. Sus resultados principales se publicaron en 30 artículos de libre acceso en varias revistas, entre ellas Nature, Genome Biology y Genome Research, y constituyen hasta la fecha uno de los análisis más detallados del genoma humano.

Principales hallazgos

A continuación se resumen, en términos sencillos, las conclusiones más destacadas del proyecto:

  1. Sólo ~1% del genoma codifica proteínas. Esto corresponde a aproximadamente 21.000 genes codificadores de proteínas, cifra consistente con otros proyectos como el del genoma humano.
  2. Un gran número de promotores. Se identificaron alrededor de 70.000 secuencias que actúan como regiones promotoras: se localizan aguas arriba de los genes y son sitios donde se unen proteínas que controlan la expresión de los genes.
  3. Centenares de miles de potenciadores. El proyecto detectó cerca de 400.000 regiones con actividad de potenciador (enhancers), elementos que regulan la expresión de genes a distancia.
  4. Millones de interruptores regulatorios. Se detectaron alrededor de cuatro millones de secuencias candidatas a funcionar como "interruptores" o elementos reguladores que controlan la activación o represión de genes, frecuentemente situadas lejos del gen que regulan.
  5. Amplia evidencia de actividad bioquímica. Cerca del 80% del genoma mostró alguna señal de función bioquímica —por ejemplo, unión de proteínas, marcas de histonas o transcripción— lo que desafía la idea de que la mayor parte del ADN sea simple "ADN basura". En palabras del consorcio: "La gran mayoría del genoma humano no codifica proteínas y, hasta ahora, no parecía contener elementos reguladores de genes definidos. La razón por la que la evolución mantendría grandes cantidades de ADN 'inútil' seguía siendo un misterio, y parecía un derroche. Sin embargo, resulta que hay buenas razones para conservar este ADN. Los resultados del proyecto ENCODE muestran que la mayoría de estos tramos de ADN albergan regiones que se unen a proteínas y moléculas de ARN, llevándolas a posiciones desde las que cooperan entre sí para regular la función y el nivel de expresión de los genes que codifican proteínas".
  6. La evolución y la regulación génica. Los resultados apoyan la idea de que la evolución no sólo modifica las secuencias que codifican proteínas, sino también las secuencias que controlan cuándo, dónde y cuánto se expresan esos genes: "La evolución está causada tanto por cambios en los genes que codifican las proteínas como en el ADN que codifica el control regulador."

Métodos y experimentos clave

Para generar este repertorio funcional se emplearon múltiples técnicas de biología molecular y genómica a gran escala, entre ellas:

  1. Secuenciación del ARN transcrito. Aislaron y secuenciaron el ARN transcrito del genoma (transcrito), utilizando tecnologías de RNA‑seq para mapear qué partes del genoma se transcriben en distintos tipos celulares.
  2. Mapeo de unión de factores de transcripción. Identificaron los sitios de unión de alrededor de 120 factores de transcripción y otros productos reguladores mediante técnicas como ChIP‑seq, lo que permitió localizar regiones funcionales asociadas a control génico.
  3. Marcadores de cromatina y modificaciones de histonas. Fueron examinados los patrones de modificación química de las histonas (por ejemplo, metilaciones y acetilaciones) que señalan regiones activas o reprimidas del genoma; estos marcadores ayudan a distinguir promotores, potenciadores y regiones heterocromáticas.
  4. Accesibilidad de la cromatina y otras señales. Se realizaron experimentos para detectar regiones con cromatina abierta (p. ej., DNase‑seq, ATAC‑seq) y otros ensayos funcionales que indican sitios con actividad reguladora.
  5. Escala experimental. El consorcio completó más de 1.600 experimentos en 147 tipos celulares, lo que proporcionó una vista amplia y comparativa de la actividad genómica en diferentes contextos celulares.

Interpretación y matices importantes

El resultado de que "cerca del 80% del genoma tiene una función bioquímica" generó debate científico. Es importante distinguir dos conceptos:

  • Función bioquímica: señales experimentales de actividad (transcripción, unión de proteínas, marcas de histonas, accesibilidad de cromatina). Estas señales indican que una región participa en procesos moleculares detectables.
  • Función biológica (evolutiva): una región cuyo cambio afecta la supervivencia o la reproducción y por tanto está sujeta a conservación o selección evolutiva. Muchas regiones con actividad bioquímica no muestran evidencia clara de conservación evolutiva y su relevancia funcional en organismos completos puede ser variable.

Varios grupos señalaron que el uso de "función" en ENCODE se refería principalmente a actividad bioquímica, no necesariamente a un papel esencial o claramente seleccionable en la biología del organismo. El propio debate ayudó a clarificar definiciones y a orientar trabajos posteriores para distinguir señales útiles de ruido experimental.

Aplicaciones y relevancia

Los datos y anotaciones de ENCODE son valiosos para:

  • Interpretar variantes genéticas asociadas a enfermedades identificadas por estudios de asociación genética (GWAS), ya que muchas variantes se encuentran en regiones reguladoras no codificantes.
  • Diseñar experimentos funcionales para validar elementos reguladores y comprender mecanismos de regulación génica.
  • Desarrollar recursos y herramientas (visores genómicos, portales de datos) que permiten a investigadores y clínicos consultar anotaciones funcionales del genoma.

Críticas, respuestas y evolución del proyecto

Tras la publicación inicial, surgieron críticas sobre la interpretación de "función" y sobre posibles sesgos o ruido en algunos ensayos. El consorcio y la comunidad científica han trabajado desde entonces para refinar métodos, aumentar repetibilidad y combinar evidencias (bioquímica, conservación evolutiva y ensayos funcionales) para priorizar elementos con probabilidad real de impacto biológico. ENCODE también continuó en fases posteriores (ENCODE‑3, etc.), ampliando tipos celulares, técnicas y análisis integrativos.

Futuro

Las líneas futuras incluyen integrar datos de interacción cromosómica (p. ej., Hi‑C), ensayos en más tipos celulares y estados (desarrollo, enfermedades), y realizar estudios funcionales sistemáticos (edición génica, ensayos de reporte) para validar la función de elementos reguladores. La información generada por ENCODE sigue siendo una base esencial para la genómica funcional y la medicina genómica.

"Uno de los grandes retos de la

biología evolutiva es comprender cómo las diferencias en la secuencia de ADN entre especies determinan las diferencias en sus fenotipos. El cambio evolutivo puede producirse tanto a través de cambios en las secuencias que codifican proteínas como a través de cambios en la secuencia que alteran la regulación de los genes".

Recursos y noticias

Los datos de ENCODE están disponibles públicamente y continúan alimentando recursos como visores genómicos y bases de datos funcionales. Las noticias relacionadas con este trabajo son numerosas: desde la cobertura de las publicaciones iniciales hasta debates sobre metodología y actualizaciones de fases posteriores. Para profundizar, conviene consultar los artículos originales y los portales oficiales del consorcio, así como revisiones críticas sobre la definición de "función" en genómica.

Preguntas y respuestas

P: ¿Qué es ENCODE?


R: ENCODE son las siglas de Enciclopedia de Elementos de ADN. Se puso en marcha en 2003 para identificar todos los elementos funcionales (bits de trabajo) del genoma humano.

P: ¿Quién realizó el trabajo para ENCODE?


R: El trabajo fue realizado por más de 400 científicos en 32 laboratorios de EE.UU., Reino Unido, España, Singapur y Japón.

P: ¿Qué descubrieron sobre el genoma humano?


R: Descubrieron que sólo el 1% del genoma codifica proteínas, lo que equivale a unos 21.000 genes. Además, descubrieron que 70.000 secuencias codifican regiones "promotoras" aguas arriba de los genes donde las proteínas se unen para controlar la expresión genética; 400.000 regiones "potenciadoras" que regulan genes distantes; y cuatro millones de "interruptores" genéticos, que son secuencias de ADN que controlan cuándo se activan o desactivan los genes. Además, se determinó que el 80% del genoma tiene una función bioquímica definida.

P: ¿Cómo llevaron a cabo su investigación?


R: Los métodos utilizados incluyeron el aislamiento y la secuenciación del ARN transcrito del genoma; la identificación de los sitios de unión de los productos de la transcripción; el examen de los patrones de modificación química realizados en las histonas para encontrar las regiones en las que se potencia o suprime la expresión de los genes; y la realización de 1648 experimentos en 147 tipos de células.

P: ¿Qué sugiere esta investigación sobre la evolución?


R: Esta investigación sugiere que la evolución está causada tanto por cambios en los genes que codifican las proteínas como por cambios en el ADN que codifica el control regulador. También indica que el cambio evolutivo puede producirse a través de cambios en las secuencias que alteran la regulación de los genes, así como a través de cambios en las secuencias que codifican proteínas.

P: ¿Dónde se publicaron sus hallazgos?


R: Sus hallazgos se publicaron en 30 artículos de acceso abierto en tres revistas - Nature, Genome Biology y Genome Research


Buscar dentro de la enciclopedia
AlegsaOnline.com - 2020 / 2025 - License CC3