PDB — Protein Data Bank
Aprender e investigar cómo somos a nivel atómico
Autora: Lissy Z. F. Gross (lissy.gross@gmail.com)
Editores: Paola Guadalupe, Samantha Vargas, David Cuaspud.
Hace 50 años, se creaba entre el Laboratorio Nacional de Brookhaven (USA) y el Centro de Datos Cristalográficos de Cambridge (UK), la base de datos más importante en Biología Estructural: PDB — Protein Data Bank (RCSB PDB, 2021).
¿De qué se trata esto?
Hacia mediados de siglo pasado, los avances de bioquímica, química, física y computación permitieron que grandes pioneros resuelvan las primeras estructuras atómicas de macromoléculas biológicas. Algunos ejemplos son el ADN (Rosalind Franklin, James Watson, Francis Crick y Maurice Wilkins), proteínas como la Hemoglobina o Mioglobina (Max Perutz y John Kendrew), así como otras moléculas de importancia biológica (Dorothy Crowfoot Hodgkin) (Jaskolski et al., 2014). La técnica que se utilizó para resolver estas estructuras es la Difracción o Cristalografía de Rayos X, de la cual ya hemos hablado en más detalle en nuestro artículo de la biografía de Dorothy Hodgkin (https://ubiqusciencia.medium.com/dorothy-crowfoot-hodgkin-9e681f13cab9).
Con el correr de las décadas se resolvían más estructuras y dicha información se empezaba a acumular, pero el acceso a ella no era muy fácil para los científicos. Es por esto que, en 1971, la comunidad de Biología Estructural se puso de acuerdo para crear una única base de datos que sirva como archivo de los modelos atómicos de todas las macromoléculas que se iban resolviendo. Con tan solo 7 estructuras se creaba el Protein Data Bank (PDB), un banco de datos de proteínas de acceso abierto para toda la comunidad académica y el primer repositorio de datos digitales del campo de las ciencias biológicas (RSCB PDB, 2021; Goodsell et al, 2020).
Hoy, a 50 años de su creación, PDB cuenta con más de 175.000 estructuras atómicas de macromoléculas de importancia biomédica y biológica, y su información se utiliza tanto con fines académicos como educativos (RSCB PDB, 2021; The Bumbling Biochemist, 2021). Las estructuras son accesibles de forma gratuita a cualquier persona, a través de sus 3 páginas web: RCSB PDB (con servidores en Estados Unidos); PDBe (situada en Europa); y PDBj (ubicada en Japón).
Recordemos que la Biología Estructural es la rama de la ciencia que se dedica a estudiar la estructura de las proteínas y de otras biomoléculas, lo cual es de suma importancia para poder comprender su función, así como su mal funcionamiento en caso de enfermedades. Es por eso que tener acceso libre y gratuito a todas las estructuras resueltas hasta el momento le permite a la comunidad científica utilizar esa información para avanzar en sus investigaciones. Además, las estructuras de proteínas y otras macromoléculas son de suma importancia para el proceso de desarrollo de fármacos por parte de compañías farmacéuticas, ya que permite comprender a qué parte de la proteína se une la droga, y cómo debe modificarse la droga para aumentar la selectividad o afinidad por su blanco molecular. Los archivos depositados en PDB ayudaron a descubrir alrededor del 90% de las nuevas drogas aprobadas por la FDA entre 2010 y 2016 (Goodsell et al, 2020).
Hoy en día, la mayoría de las estructuras que hay en PDB fueron resueltas por Cristalografía. Sin embargo, existen algunas resueltas por Resonancia Magnética Nuclear (RMN o NMR) y más recientemente por Criomicroscopía Electrónica (CryoEM). (La Resonancia Magnética Nuclear es una técnica que observa los campos magnéticos locales alrededor de los núcleos atómicos y permite obtener información de la estructura y dinámica de proteínas). Por otro lado, ya hemos hablado en más detalle de que se trata la Criomicroscopía Electrónica, la cual se está convirtiendo en la principal técnica y pronto superará en importancia a la Cristalografía, ya que permite estudiar grandes complejos proteicos y máquinas moleculares difíciles de cristalizar. Te invitamos a leer el artículo que escribimos al respecto hace un tiempo: https://ubiqusciencia.medium.com/cryo-em-o-criomicroscop%C3%ADa-electr%C3%B3nica-45d424bc2808.
Entonces, ¿cómo funciona el PDB?
Cuando un grupo de investigación (o una empresa privada) obtiene mediante las técnicas mencionadas arriba un modelo estructural atómico de su molécula de estudio (ya sea de una proteína, ADN, ARN o combinaciones entre ellos), tiene que depositar las coordenadas de su modelo en la base de datos PDB (TheBumblingBiochemist, 2021). Esto es requisito si se quiere publicar dicho modelo en una revista científica o “paper”. Las coordenadas son la información espacial de cada uno de los átomos del modelo estructural. Para poder ser depositadas y estar accesibles a cualquiera, primero son revisadas por expertos de la comunidad que lo validan y se aseguran de que el modelo cumpla ciertos estándares de calidad y sea plausible.
Las estructuras se depositan con códigos de 4 letras y números únicos e irrepetibles, que funcionan como su “número de identidad”. Una vez disponibles en la base de datos, los modelos estructurales pueden ser descargados por cualquiera de forma gratuita y ser visualizados por programas como SwissPDB, PyMOL o Chimera, entre otros. Tener estos modelos también permite utilizarlos en experimentos y simulaciones computacionales como “docking” de pequeños compuestos y potenciales drogas, dinámicas moleculares y muchas cosas más. Por ejemplo, el archivo PDB 6LZG corresponde a una estructura obtenida por cristalografía de rayos X del complejo entre una parte de la proteína Spike del Coronavirus con el receptor humano ACE2 (Wang et al. 2020).
Sin embargo, la página web que conocemos hoy en día se creó recién en el 2003 como www.PDB, donde descargar un modelo atómico está a tan solo un clic de distancia. Durante las primeras décadas, para poder tener acceso al modelo atómico de interés, había que solicitar el envío por correo de cintas magnéticas o tarjetas perforadas con las coordenadas.
La página de PDB cuenta también con un portal educativo que recomiendo fuertemente visitar (https://pdb101.rcsb.org/), ya que cuenta con mucha información divulgativa y material didáctico para todas las edades y niveles, además de una reciente sección con recursos útiles para comprender la biología molecular y estructural del SARS-CoV-2.
Para quienes trabajamos con macromoléculas biológicas, PDB es sin dudas una herramienta infaltable en nuestro trabajo. Por otro lado, su creación y temprana filosofía de “open access” (acceso abierto) ha traído grandes beneficios para toda la humanidad, ya que permitió grandes avances en biomedicina. Sin más, solo me queda decir: ¡Felices 50 años Protein Data Bank!
Referencias:
RCSB PDB (2021). History. RCSB PDB. https://www.rcsb.org/pages/about-us/history
Jaskolski, M., Dauter, Z. and Wlodawer, A. (2014), A brief history of macromolecular crystallography, illustrated by a family tree and its Nobel fruits. FEBS J, 281: 3985–4009. https://doi.org/10.1111/febs.12796
Goodsell, D. S., Zardecki, C., Di Costanzo, L., Duarte, J. M., Hudson, B. P., Persikova, I., Segura, J., Shao, C., Voigt, M., Westbrook, J. D., Young, J. Y., & Burley, S. K. (2020). RCSB Protein Data Bank: Enabling biomedical research and drug discovery. Protein science : a publication of the Protein Society, 29(1), 52–65. https://doi.org/10.1002/pro.3730
Brianna Bibel (2021). The PDB (Protein Data Bank). The Bumbling Biochemist. https://thebumblingbiochemist.com/365-days-of-science/the-pdb-protein-data-bank/
Wang Q, Zhang Y, Wu L, Niu S, Song C, Zhang Z, Lu G, Qiao C, Hu Y, Yuen KY, Wang Q, Zhou H, Yan J, Qi J. (2020). Structural and Functional Basis of SARS-CoV-2 Entry by Using Human ACE2. Cell. DOI: 10.1016/j.cell.2020.03.045