Макромолекулярный докинг

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Макромолекулярный докинг — это метод молекулярного моделирования четвертичной структуры комплексов, образованных двумя или более взаимодействующими биологическими макромолекулами. Чаще всего исследуются белок-белковые комплексы, реже — белок-нуклеиновые.

Конечной целью докинга является предсказание трёхмерной структуры изучаемого макромолекулярного комплекса в естественной среде. Результатом докинга является набор моделей комплекса (структур). Они могут быть ранжированы различными методами, такими как оценочная (скоровая, скоринг, скор-) функция для отбора наиболее правдоподобных (с большей долей вероятности встречающихся в организме).

Термин «докинг» или «стыковка» появился в конце 1970-х в значении моделирования стыковки двух молекул, при котором ориентация последних не менялась (менялось только положение). С увеличением компьютерных мощностей стало возможно разрешить изменение ориентации партнёров, такой вариант докинга называется «rigid docking» или докинг жёстких тел («rigid body»). Следующим шагом стал переход к «гибкому докингу» («flexible docking»), при котором изменяется внутренняя геометрия (конформация) партнёров.

Биологические роли большинства белков, описываемые тем, с какими молекулами они могут взаимодействовать известны в лучшем случае по меньшей мере неполностью. Даже белки, участвующие в хорошо изученных биологических процессах (напр. ЦТК) могут иметь неожиданных интерактантов или новые биологические функции.

В случае белок-белковых взаимодействий возникают дополнительные вопросы. Считается, что генетические заболевания (напр. муковисцидоз) вызываются неправильно свернутыми (мутированными) белками и возникает желание понять какие аномальные белок-белковые взаимодействия могут быть вызваны той или иной мутацией. Если в будущем появится возможность дизайна белков для проведения биологических функций, важно будет определить круг их возможных взаимодействий.

Для некоторого набора белков может решаться следующий спектр задач:

  • Связываются ли белки in vivo?

Если связываются,

  • Какую конформацию имеет белок в связанном состоянии?
  • Насколько сильным можно считать их взаимодействие?

Если не связываются,

  • Можно ли получить связывание путём внедрение мутаций в белки?

Для решения этих проблем может применяться белок-белковый докинг.

Более того докинг может помочь в исследовании белков с неизвестной функцией (относительно мало изученная сфера). Если нет модели пространственной структуры, её можно моделировать (см. предсказание структуры белка).

Белок-нуклеиновые взаимодействия играют важную роль в живой клетке. Транскрипционные факторы регулируют экспрессию генов, а полимеразы, которые осуществляют репликацию суть белковые комплексы, а генетический материал, с которым они связываются состоят из нуклеиновых кислот. Моделирование белок-нуклеиновых взаимодействий имеет некоторые сложности, описанные далее.

В 1970-х годах сложное моделирование заключалось в ручной идентификации элементов на поверхностях интерактантов (партнёров) и интерпретации последствий для связывания, функции и активности; любые компьютерные программы обычно использовались в конце процесса моделирования чтобы различать относительно немногочисленные конфигурации, которые остались после того, как были наложены все эвристические ограничения. Впервые компьютеры были использованы в исследовании взаимодействия гемоглобина в серповидно-клеточных волокнах.[1] Затем в 1978 году появилась работа с комплексом трипсин-Апротинин.[2] Компьютеры использовались для отличия «плохих» и «хороших» моделей, посредством оценочной функции. «Вознаграждалась» большая площадь интерфейса (поверхность связывания), а за перекрывающиеся участки накладывались штрафы. Компьютер использовал упрощённое представление взаимодействующих белков: каждый остаток представлялся в виде одного центра связывания. Электростатические взаимодействия, такие как водородные связи, анализировались вручную.

К началу 1990-х годов было определено больше структур комплексов, тогда как доступные вычислительные мощности значительно возросли. С появлением биоинформатики основное внимание уделялось разработке методов, применимых к произвольным интерактантам при приемлемых вычислительных затратах и в отсутствие дополнительных филогенетических или экспериментальных данных.

В 1992 году был опубликован метод[3], в котором использовалось быстрое преобразование Фурье. В этом методе имело место «грубое» представление партнёров докинга: в виде трёхмерных матриц, числа в которых соответствовали положениям атомов. Быстрое преобразование Фурье помогало находить расположение этих матриц, соответствующее контакту партнёров гораздо быстрее других методов докинга. В 1997 в этот метод стал учитывать электростатические взаимодействия.

В 1996 году были опубликованы результаты первого исследования[4], в котором шесть исследовательских групп пытались предсказать структуру комплекса бета-лактамазы TEM-1 с белком-ингибитором бета-лактамазы (BLIP). В исследовании была отмечена необходимость учёта конформационных изменений и трудности различения конформеров.

Основной механизм докинга схож с молекулярным докингом. Также применяются методы типа Монте-Карло, в которых в ходе итеративных изменений набора параметров уточняется исходная конфигурация. На каждом шаге конфигурация принимается или отвергается, исходя из значения оценочной функции.

Каждый из белков может быть представлен в виде простой кубической решётки. Для моделей комплекса, переводимых друг в друга путём изменения положения белка может быть практически мгновенно вычислена некая оценочная функция применением теоремы свёртки[англ.]. Можно построить осмысленные, хотя и приблизительные, «сверточные» скоринговые функции, учитывающие как стереохимические, так и электростатические взаимодействия.

Методы обратного пространства широко использовались благодаря их способности оценивать огромное количество структур. Они теряют преимущество в скорости, если имеют место торсионные изменения. Другой недостаток заключается в том, что невозможно эффективно использовать накопленные знания. Остается также вопрос, не являются ли этот метод достаточно точным для надёжного выявления структуры лучшего комплекса.

Оценочные функции (скоринг-функции)

[править | править код]

Для поиска скора (некоторого показателя), позволяющего отличить лучшие модели была разработана специальная тестовая выборка (Benchmark, см. Ниже) белок-белковых структур. Скоры оцениваются по рангу, который они присваивают наилучшей структуре (в идеале ранжирование по скору должно вывести «экспериментально» лучшую структуру на первое место), и по их покрытию (доля контрольных случаев, для которых они достигают приемлемого результата). Скоры разделяют на несколько категорий, включающих:

Обычно гибридные оценки (собственно скор-функции) создаются путём объединения одной или нескольких вышеупомянутых категорий (далее «термы» скор-функции) в взвешенную сумму, веса которой оптимизируются используя тестовые выборки (т. н. Бенчмарки). Чтобы избежать статистических искажений (biases) тестовые модели, используемые для оптимизации весов, не должны пересекаться с тестовыми моделями, используемыми для финальной проверки гибридной оценки.

В задаче белок-белкового докинга важно найти скоровую функцию, достоверно отражающую информацию об аффинности партнеров. Такая функция значительно ускорила бы развитие in silico белковой инженерии, разработку лекарств а также высокопроизводительную аннотацию интерактома (то есть какие белки связываются, а какие нет). Для оценки аффинности связывания / свободной энергии было предложено много оценочных функций.[5][6][7][8][9] Однако корреляция между экспериментально установленным сродством связывания и предсказаниями девяти популярных скор-функций оказалась почти ортогональной (R 2 ~ 0).[10][11] Было также замечено, что некоторые термы лучше коррелируют с экспериментальными энергиями связи, чем полная оценка, что позволяет предположить, что можно найти и улучшить скор-функцию, пересмотрев веса её компонентов (термов). Среди экспериментальных методов определения аффинности связывания выделяют поверхностный плазмонный резонанс (SPR), передачу энергии резонанса Фёрстера[англ.], методы с применением радиолигандов, калориметрия изотермического титрования[англ.] (ITC), микроскопический термофорез[англ.] (MST) или спектроскопические измерения и другие методы флуоресценции. Информация из научных статей также может служить хорошим источником для улучшения скоринга.[12]

Тестовые выборки (Бенчмарки)

[править | править код]

Для тестирования методов докинга была сделана тестовая выборка (Бенчмарк) из 84 структур белок-белковых комплексов.[13] Структуры в тестовой выборке специально подобраны так, что охватывают широкий спектр типов взаимодействий, и максимально разнородны (содержат как можно меньше повторяющихся особенностей, таких как профили семейств партнёров в базе данных SCOP[англ.]). Тестовые элементы подразделяются на три уровня сложности (самый сложный содержит наибольшее изменение конформации остова). Примерами тестовых моделей для белок-белкового докинга могут служить структуры фермент-ингибитор, антиген-антитело и гомомультимерные комплексы.

Новейшая версия бенчмарка для белок-белкового докинга состоит из 230 комплексов,[14] а для ДНК-белкового — из 47.[15] Новейшая тестовая выборка на РНК-белковый докинг включает 126 элементов.[16] Существуют объединенные тестовые выборки, насчитывающие 209 комплексов.[17]

Тестовая выборка для оценки аффинности была основана на тестовой выбоке для белок-белкового докинга.[10] В неё были включены 81 белок-белковых комплекса с экспериментально измеренной аффинностью. Эти комплексы охватывают 11 порядков по значению аффинности.

Эта выборка была в дальнейшем подвергнута экспертной оценке и значительно расширена.[18] Новая тестовая выборка включает белки с различными биологическими функциями. В её состав входят G-белки и внеклеточные домены рецепторов, а также комплексы антиген / антитело, фермент / ингибитор и фермент / субстрат. Она также разнообразна с точки зрения аффинности партнёров друг к другу, с K d в диапазоне от 10 −5 до 10 −14 M. Девять элементов представляют собой близкородственные комплексы, которые имеют сходную структуру, но очень различную аффинность. Поскольку известны структуры компонентов комплекса по отдельности, можно оценить изменения конформации партнёров при его образовании. В большинстве комплексов они весьма значительны. Данная тестовая выборка может применяться и для биофизических моделей, направленных на установление связи аффинности со структурой в белок-белковых взаимодействиях, учитывая данные о реагентах и их конформационных изменениях, а не только о продукте (комплексе).[18]

CAPRI (англ. Critical Assessment of PRediction of Interactions, критическая оценка предсказания взаимодействий)[19] — это регулярно проводимые мероприятия, в ходе которых исследователям по всему миру предлагается получить структуру белок-белкового комплекса если даны только структуры реагентов методом докинга. Мероприятия (раунды) проходят примерно каждые 6 месяцев. Во время каждого тура участником даются структуры реагентов комплекса, структура которого была недавно определена экспериментально. Координаты комплекса хранятся в тайне. Оценка CAPRI является двойным слепым методом, так как участники не знают структуры комплекса, а организаторы не знают кто из участников предложил конкретную модель комплекса.

В настоящее время CAPRI обретает популярность (37 групп приняли участие во всем мире в седьмом раунде). Несмотря на то, что результаты CAPRI имеют небольшое статистическое значение из-за небольшого количества целей в каждом раунде, роль CAPRI является весьма значительной. Оценка CASP является аналогичным упражнением в области предсказания структуры белка.

Примечания

[править | править код]
  1. C. Levinthal, S. J. Wodak, P. Kahn, A. K. Dadivanian. Hemoglobin interaction in sickle cell fibers. I: Theoretical approaches to the molecular contacts. (англ.) // Proceedings of the National Academy of Sciences. — National Academy of Sciences, 1975-04-01. — Vol. 72, iss. 4. — P. 1330—1334. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.72.4.1330.
  2. Shoshana J. Wodak, Joël Janin. Computer analysis of protein-protein interaction // Journal of Molecular Biology. — 1978-09. — Т. 124, вып. 2. — С. 323—342. — ISSN 0022-2836. — doi:10.1016/0022-2836(78)90302-9.
  3. E. Katchalski-Katzir, I. Shariv, M. Eisenstein, A. A. Friesem, C. Aflalo. Molecular surface recognition: determination of geometric fit between proteins and their ligands by correlation techniques. (англ.) // Proceedings of the National Academy of Sciences. — National Academy of Sciences, 1992-03-15. — Vol. 89, iss. 6. — P. 2195—2199. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.89.6.2195.
  4. N.C.J. Strynadka, M. Eisenstein, E. Katchalski-Katzir, B.K. Shoichet, I.D. Kuntz. Molecular docking programs successfully predict the binding of a β-lactamase inhibitory protein to TEM-1 β-lactamase // Nature Structural Biology. — 1996-03. — Т. 3, вып. 3. — С. 233—239. — ISSN 1072-8368. — doi:10.1038/nsb0396-233.
  5. Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D (2003). "Protein–protein docking with simultaneous optimization of rigid-body displacement and side-chain conformations". J. Mol. Biol. 331 (1): 281—299. doi:10.1016/S0022-2836(03)00670-3. PMID 12875852.
  6. Camacho C. J., Vajda S. Protein docking along smooth association pathways (англ.) // Proceedings of the National Academy of Sciences of the United States of America : journal. — 2008. — Vol. 98, no. 19. — P. 10636—10641. — doi:10.1073/pnas.181147798. — PMID 11517309. — PMC 58518.
  7. Camacho C. J., Vajda S. In silico screening of mutational effects on enzyme-proteic inhibitor affinity: a docking-based approach (англ.) // BMC Structural Biology[англ.] : journal. — 2007. — Vol. 7. — P. 37. — doi:10.1186/1472-6807-7-37. — PMID 17559675. — PMC 1913526.
  8. Zhang C., Liu S., Zhu Q., Zhou Y. A knowledge-based energy function for protein–ligand, protein–protein, and protein–DNA complexes (англ.) // Journal of Medicinal Chemistry[англ.] : journal. — 2005. — Vol. 48, no. 7. — P. 2325—2335. — doi:10.1021/jm049314d. — PMID 15801826.
  9. Esmaielbeiki R., Nebel J. C. Scoring docking conformations using predicted protein interfaces (англ.) // BMC Bioinformatics[англ.] : journal. — 2014. — Vol. 15. — P. 171. — doi:10.1186/1471-2105-15-171. — PMID 24906633. — PMC 4057934.
  10. 1 2 Kastritis P. L., Bonvin A. M. Are scoring functions in protein–protein docking ready to predict interactomes? Clues from a novel binding affinity benchmark (англ.) // J. Proteome Res.[англ.] : journal. — 2010. — May (vol. 9, no. 5). — P. 2216—2225. — doi:10.1021/pr9009854. — PMID 20329755.
  11. Rosato A., Fuentes G., Verma C. Faculty of 1000 Biology: evaluations for Kastritis PL & Bonvin AM J Proteome Res 2010 May 7 9 (5) :2216-25 (англ.) // Faculty of 1000 Biology : journal. — 2010. — Vol. 9, no. 5. — P. 2216—2225. — doi:10.1021/pr9009854. — PMID 20329755.
  12. Badal, V. D., Kundrotas, P. J., Vakser, I. A. Natural language processing in text mining for structural modeling of protein complexes (англ.) // BMC Bioinformatics[англ.] : journal. — 2018. — Vol. 19, no. 1. — P. 84. — doi:10.1186/s12859-018-2079-4. — PMID 29506465. — PMC 5838950.
  13. Mintseris J., Wiehe K., Pierce B., Anderson R., Chen R., Janin J., Weng Z. Protein-Protein Docking Benchmark 2.0: an update (неопр.) // Proteins. — 2005. — Т. 60, № 2. — С. 214—216. — doi:10.1002/prot.20560. — PMID 15981264.
  14. Vreven T., Moal I. H., Vangone A., Pierce B. G., Kastritis P. L., Torchala M., Chaleil R., Jiménez-García B., Bates P. A., Fernandez-Recio J., Bonvin A. M., Weng Z. Updates to the Integrated Protein-Protein Interaction Benchmarks: Docking Benchmark Version 5 and Affinity Benchmark Version 2 (англ.) // Journal of Molecular Biology[англ.] : journal. — 2015. — September (vol. 427, no. 19). — P. 3031—3041. — doi:10.1016/j.jmb.2015.07.016. — PMID 26231283. — PMC 4677049.
  15. van Dijk M., Bonvin A. M. A protein-DNA docking benchmark (англ.) // Nucleic Acids Research : journal. — 2008. — August (vol. 36, no. 14). — P. e88. — doi:10.1093/nar/gkn386. — PMID 18583363. — PMC 2504314.
  16. Nithin C., Mukherjee S., Bahadur R. P. A non-redundant protein-RNA docking benchmark version 2.0 (англ.) // Proteins : journal. — 2016. — November (vol. 85, no. 2). — P. 256—267. — doi:10.1002/prot.25211. — PMID 27862282.
  17. Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz; Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz M. Bioinformatics Tools and Benchmarks for Computational Docking and 3D Structure Prediction of RNA-Protein Complexes (англ.) // Genes : journal. — 2018. — 25 August (vol. 9, no. 9). — P. 432. — doi:10.3390/genes9090432. — PMID 30149645. — PMC 6162694.
  18. 1 2 Kastritis P. L., Moal I. H., Hwang H., Weng Z., Bates P. A., Bonvin A. M., Janin J. A structure-based benchmark for protein-protein binding affinity (англ.) // Protein Science[англ.] : journal. — 2011. — March (vol. 20, no. 3). — P. 482—491. — doi:10.1002/pro.580. — PMID 21213247. — PMC 3064828.
  19. Janin J., Henrick K., Moult J., Eyck L. T., Sternberg M. J., Vajda S., Vakser I., Wodak S. J. CAPRI: a Critical Assessment of PRedicted Interactions (англ.) // Proteins : journal. — 2003. — Vol. 52, no. 1. — P. 2—9. — doi:10.1002/prot.10381. — PMID 12784359.