Protein Data Bank

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Protein Data Bank, PDB — банк данных трёхмерных структур белков и нуклеиновых кислот. Информация, полученная методами рентгеновской кристаллографии или ЯМР-спектроскопии, и, всё чаще, методом криоэлектронной микроскопии вносится в базу данных биологами и биохимиками со всего мира, и доступна бесплатно через интернет сайты организаций-членов (PDBe[1], PDBj[2], RCSB[3]).

PDB является одним из важнейших ресурсов для учёных, работающих в области структурной биологии. Большинство научных журналов и некоторые фонды финансирования исследований, например, NIH в США требуют от авторов статей и получателей грантов, чтобы все структурные данные были размещены в PDB. Protein Data Bank содержит в основном первичные данные о структуре биологических молекул, в то время как существуют сотни других банков данных, категоризирующих первичные данные или выявляющие закономерности между строением молекул и эволюционным родством.[4]

История[править | править код]

Protein Data Bank был создан обычными учёными.[4] В 1971 году Уолтер Хэмилтон (англ. Walter Hamilton) в Национальной лаборатории Брукхавена создал банк данных для Брукхавена. После смерти Хэмилтона в 1973 году PDB управлял Том Кэцтл (англ. Tom Koeztle). В январе 1994 года главой Protein Data Bank стал Джол Суссман (англ. Joel Sussman).

В октябре 1998 года[5] Protein Data Bank был перенесён в Research Collaboratory for Structural Bioinformatics (RCSB); перенос информации был закончен в июне 1999 года. Новым директором стала Хелен Берман (англ. Helen M. Berman) из Университета Рутгерса.[6] В 2003 году, после образования wwPDB (англ. Worldwide Protein Data Bank), Protein Data Bank стал международной организацией. Помимо RCSB, основателями wwPDB являются Protein Data Bank in Europe (PDBe), Protein Data Bank in Japan (PDBj) и Bilogical Margnetic Resonance Bank (BMRB).

База данных[править | править код]

База данных Protein Data Bank обновляется еженедельно (в 0:00 часов по всемирному координированному времени, UTC, по средам). По состоянию на 14 марта 2017 года база данных содержит[7]:

Метод
исследования
Белки Нуклеиновые кислоты Комплексы белков
и нуклеиновых кислот
Другое Всего
Дифракция рентгеновских лучей 106595 1820 5471 4 113890
ЯМР 10296 1190 241 8 11735
Электронная микроскопия 1021 30 367 0 1418
Смешанный 99 3 2 1 105
Другое 181 4 6 13 204
Всего: 118192 3047 6087 26 127352
103 514 структуры в PDB содержат файл со структурным фактором
9057 структуры имеют файл ЯМР с геометрическими ограничениями
2826 структур имеют файл ЯМР, содержащий экспериментально определенные химические сдвиги
1403 структур имеют файл с 3DEM-картой

Преобладающая часть структур получена при помощи метода диффракции рентгеновских лучей, около 15 % — при помощи ЯМР белков, и лишь малая часть — при помощи крио-электронной микроскопии.

Некоторое время количество структур в PDB росло экспоненциально, но с 2007 года прирост несколько пригас.


Каждая структура, опубликованная в PDB получает четырёхзначный идентификатор (комбинация цифр и букв латинского алфавита). Данный шифр не может служить идентификатором биомолекул, так как часто разные структуры одной и той же молекулы, например, в различной среде, могут иметь различные PDB ID.

Программное обеспечение[править | править код]

Структуры могут быть просмотрены при помощи нескольких компьютерных программ (как бесплатных и распространяющихся по лицензии open source, так и платных, распространяющихся не с открытым кодом) и плагинов к веб-браузерам.[8]

  • Программа QuteMol позволяет открывать и просматривать файлы с расширением *.pdb и *.vdb

Примечания[править | править код]

  1. PDBe — Европейский Protein Data Bank
  2. PDBj — японский Protein Data Bank
  3. Research Collaboratory for Structural Bioinformatics (Rutgers и UCSD/SDSC (англ.) )
  4. 1 2 Berman, H. M. (January 2008). “The Protein Data Bank: a historical perspective” (PDF). Acta Crystallographica Section A: Foundations of Crystallography. A64 (1): 88—95. DOI:10.1107/S0108767307035623. Используется устаревший параметр |month= (справка)
  5. Berman, H. M.; et al. (January 2000). “The Protein Data Bank”. Nucleic Acids Res. 28 (1): 235—242. DOI:10.1093/nar/28.1.235. PMC 102472. PMID 10592235. Используется устаревший параметр |month= (справка)
  6. RCSB PDB Newsletter Archive. RCSB Protein Data Bank. Архивировано 13 апреля 2012 года.
  7. http://www.rcsb.org/pdb/statistics/holdings.do
  8. см. en:Category:Molecular modelling software

Внешние ссылки[править | править код]