Banco de Datos de Proteínas (PDB): referencia global de estructuras 3D
Descubre el PDB: referencia global gratuita de estructuras 3D de proteínas y ácidos nucleicos para investigación en biología estructural, genómica y desarrollo de fármacos.
El Banco de Datos de Proteínas (PDB) es una colección de información sobre la estructura tridimensional (3-D) de grandes moléculas biológicas, como las proteínas y los ácidos nucleicos. Biólogos y bioquímicos de todo el mundo envían los datos. La mayoría de los datos proceden de la cristalografía de rayos X o la espectroscopia de RMN. Cualquiera puede acceder al PDB de forma gratuita en línea. El Worldwide Protein Data Bank, wwPDB, gestiona el PDB.
El PDB es útil para los científicos que estudian la biología estructural y la genómica estructural. Muchos científicos tienen que enviar su información a la base de datos. Las principales revistas científicas y algunos organismos de financiación, como los Institutos Nacionales de Salud de Estados Unidos, tienen normas que obligan a los científicos a enviar los datos al PDB. La PDB tiene los datos originales o primarios. Otros cientos de bases de datos reutilizan los datos. Estas bases de datos secundarias organizan la información de diferentes maneras. Por ejemplo, tanto SCOP como CATH colocan las estructuras en grupos organizados por tipo de estructura e ideas sobre cómo se relacionan a través de la evolución. La ontología genética agrupa los datos en función de los genes.
Qué contiene el PDB
El PDB almacena los archivos que describen coordenadas atómicas de macromoléculas y metadatos asociados. Entre los elementos que habitualmente se incluyen están:
- Coordenadas atómicas (posición XYZ de cada átomo).
- Información experimental, como factores de estructura (para cristalografía), mapas electrónicos o de densidad, y restricciones de RMN.
- Metadatos: organismo de origen, condiciones de cristalización o medición, resoluciones, autores y referencias bibliográficas.
- Modelos de ensamblaje biológico (la forma funcional de la macromolécula en solución o en la célula).
- Ligandos y cofactors, incluidos fármacos, iones y moléculas pequeñas ligados a la macromolécula.
Métodos experimentales y nuevos desarrollos
Tradicionalmente las dos principales técnicas han sido la cristalografía de rayos X y la espectroscopía de RMN, pero en las últimas décadas la criomicroscopía electrónica (cryo-EM) se ha convertido en una fuente importante de estructuras de alta resolución, especialmente para complejos grandes y flexibles. Otros métodos que también aparecen en la base de datos son la microcristalografía electrónica y técnicas hibridas que combinan datos de distintas fuentes.
Gestión y acceso
El PDB es gestionado por el consorcio wwPDB, que agrupa organismos como RCSB PDB (Estados Unidos), PDBe (Europa), PDBj (Japón) y el BMRB (para datos de RMN). El acceso es abierto y gratuito: cualquiera puede descargar archivos individuales o conjuntos completos, usar interfaces web para búsquedas, o acceder mediante API y FTP para análisis a gran escala.
Identificadores y formatos
Cada entrada del PDB recibe un identificador único de cuatro caracteres (por ejemplo, 1ABC). Históricamente se usó el formato PDB plano, pero hoy en día el estándar recomendado es PDBx/mmCIF, que permite describir estructuras más complejas y metadatos extensos. Además, los mapas de densidad electrónica suelen depositarse en el Electron Microscopy Data Bank (EMDB) y se vinculan a las entradas del PDB.
Depósito, validación y requisitos editoriales
Los autores que determinan nuevas estructuras suelen depositar los datos en el PDB antes de la publicación. El wwPDB ofrece herramientas de validación que generan un informe de validación sobre la calidad de la estructura (resolución, R-factors, geometría, correspondencia con los datos experimentales, etc.). Muchas revistas y agencias financiadoras exigen el depósito como condición para publicar o para recibir fondos; esto garantiza que los datos primarios sean accesibles y reproducibles.
Usos y aplicaciones
- Diseño de fármacos: conocer la estructura de dianas y complejos proteína-ligando ayuda a diseñar compuestos más selectivos y potentes.
- Biología molecular y enzimología: analizar mecanismos catalíticos, sitios activos y cambios conformacionales.
- Ingeniería de proteínas: rediseño de estabilidad, especificidad y nuevas funciones.
- Investigación evolutiva y anotación funcional: comparación estructural entre familias mediante bases de datos secundarias como SCOP y CATH.
- Docencia y divulgación: visualización de estructuras en 3D para la enseñanza.
Herramientas para visualizar y analizar
Existen numerosas aplicaciones y visores web para explorar las estructuras del PDB: PyMOL, UCSF Chimera/ChimeraX, Jmol, Mol* (el visualizador moderno usado por muchos portales PDB) y otros paquetes de análisis estructural que permiten medir distancias, ángulos, superponer estructuras y preparar figuras para publicaciones.
Bases de datos secundarias y reutilización
Los datos del PDB alimentan cientos de recursos secundarios que organizan y enriquecen la información: clasificación de dominios (SCOP, CATH), anotaciones funcionales (Gene Ontology), repositorios de modelos homólogos, y bases de datos de interacciones. Esta reutilización facilita búsquedas por secuencia, estructura, función o ligando.
Consejos rápidos para usuarios
- Para buscar estructuras use palabras clave, número de PDB, búsqueda por secuencia (BLAST) o por ligando.
- Revise siempre el informe de validación de la entrada antes de usar la estructura en modelos o diseño.
- Si publica una estructura, deposite los datos experimentales y coordénelos con la entrada PDB para facilitar la reproducibilidad.
En resumen, el PDB es la referencia global y abierta para estructuras 3D de macromoléculas biológicas. Su papel en la investigación biomolecular, el desarrollo farmacéutico y la educación es fundamental, y su constante actualización y validación garantizan que la comunidad científica disponga de datos de calidad.
Páginas relacionadas
- Base de datos de movimientos moleculares
- The Worldwide Protein Data Bank (wwPDB) - sitio principal de los hosts regionales (abajo)
- Banco de datos de proteínas RCSB (EE.UU.)
- PDBe (Europa)
- PDBj (Japón)
- BMRB, Banco de Datos de Resonancia Magnética Biológica (EEUU)
- wwPDB Documentation - documentación sobre los formatos de archivo PDB y PDBML
- Mirando las estructuras - La introducción del RCSB a la cristalografía
- Página de inicio de PDBsum - Extrae datos de otras bases de datos sobre estructuras PDB.
- Base de datos de ácidos nucleicos, NDB - una réplica de la PDB especialmente para la búsqueda de ácidos nucleicos
- Tutorial de introducción al PDB patrocinado por el PDB
Preguntas y respuestas
P: ¿Qué es el Banco de Datos de Proteínas (PDB)?
R: El Banco de Datos de Proteínas (PDB) es una colección de información sobre la estructura tridimensional (3-D) de grandes moléculas biológicas, como las proteínas y los ácidos nucleicos.
P: ¿De dónde proceden los datos del PDB?
R: La mayoría de los datos proceden de la cristalografía de rayos X o de la espectroscopia de RMN.
P: ¿Quién envía los datos para la PDB?
R: Biólogos y bioquímicos de todo el mundo envían los datos.
P: ¿Cualquiera puede acceder a la PDB?
R: Sí, cualquiera puede acceder al PDB gratuitamente en línea.
P: ¿Quién gestiona el PDB?
R: El Banco Mundial de Datos de Proteínas (wwPDB) gestiona el PDB.
P: ¿Por qué es útil el PDB para los científicos?
R: El PDB es útil para los científicos que estudian la biología estructural y la genómica estructural.
P: ¿Quién envía su información al PDB?
R: Muchos científicos tienen que enviar su información a la base de datos. Las principales revistas científicas y algunos organismos de financiación, como los Institutos Nacionales de Salud de Estados Unidos, tienen normas que obligan a los científicos a enviar los datos al PDB.
Buscar dentro de la enciclopedia