Молекулярный докинг: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Нет описания правки
Строка 85: Строка 85:
== Макромолекулярный докинг ==
== Макромолекулярный докинг ==
{{основная статья|Макромолекулярный докинг}}
{{основная статья|Макромолекулярный докинг}}
Макромолекулярный докинг — это метод [[Молекулярное моделирование|молекулярного моделирования]] [[Четвертичная структура|четвертичной структуры]] комплексов, образованных двумя или более взаимодействующими [[Макромолекула|биологическими макромолекулами]]. Чаще всего исследуются [[Белки|белок]]-белковые комплексы, реже — белок-[[Нуклеиновые кислоты|нуклеиновые]].

Конечной целью докинга является предсказание трехмерной структуры изучаемого макромолекулярного комплекса в естественной среде. Результатом докинга является набор моделей комплекса (структур). Они могут быть ранжированы различными методами, такими как [[Скоринг функции для докинга|оценочная (скоровая, скоринг, скор-) функция]] для отбора наиболее правдоподобных (с большей долей вероятности встречающихся в организме).

Термин "докинг" или "стыковка" появился в конце 1970х в значении моделирования стыковки двух молекул, при котором ореинтация последних не менялась (менялось только положение). С увеличением компьютерных мощностей стало возможно разрешить изменение ореинтации партнеров, такой вариант докинга называется "rigid docking" или докинг жестких тел ("rigid body"). Следующим шагом стал переход к "гибкому докингу" ("flexible docking"), при котором изменяется внутренняя геометрия (конформация) партнеров.
<br />
<br />
=== Введение ===
[[Биология|Биологические]] роли большинства белков, описываемые тем, с [[Белок-белковые взаимодействия|какими молекулами они могут взаимодействовать]] известны в лучшем случае по меньшей мере неполностью. Даже белки, участвующие в хорошо изученных [[Биологический процесс|биологических процессах]] (напр. [[ЦТК]]) могут иметь неожиданных интерактантов или новые биологические функции.

В случае белок-белковых взаимодействий возникают дополнительные вопросы. Считается, что [[Наследственные заболевания|генетические заболевания]] (напр. [[Муковисцидоз]]) вызываются неправильно [[Фолдинг белка|свернутыми]] ([[Мутация|мутированными]]) белками и возникает желание понять какие анамальные белок-белковые взаимодействия могут быть вызваны той или иной мутацией. Если в будущем появится возможность дизайна белков для проведения биологических функций, важно будет определить круг их возможных взаимодействий.

Для некоторого набора белков может решаться следующий спектр задач:

* Связываются ли белки [[in vivo]]?

Если связываются,

* Какую конформацию имеет белок в связанном состоянии?
* Насколько сильным можно считать их взаимодействие?

Если не связываются,

* Можно ли получить связывание путем внедрение мутаций в белки?

Для решения этих проблем может применяться белок-белковый докинг.

Более того докинг может помочь в исследовании белков с неизвестной функцией (относительно мало изученная сфера). Если нет модели пространственной структуры, ее можно моделировать (см. [[предсказание структуры белка]]).

Белок-нуклеиновые взаимодействия играют важную роль в живой клетке. [[Факторы транскрипции|Транскрипционные факторы]] регулируют [[Экспрессия генов|экспрессию генов]], а [[Полимераза|полимеразы]], которые осуществляют [[Репликация ДНК|репликацию]] суть [[Белковые комплексы|белковые]] комплексы, а генетический материал, с которым они связываются состоят из [[Нуклеиновая кислота|нуклеиновых кислот]]. Моделирование белок-нуклеиновых взаимодействий имеет некоторые сложности, описанные далее.

=== История ===
В 1970-х годах сложное моделирование заключалось в ручной идентификации элементов на поверхностях интерактантов (партнеров) и интерпретации последствий для связывания, функции и активности; любые компьютерные программы обычно использовались в конце процесса моделирования чтобы различать относительно немногочисленные конфигурации, которые остались после того, как были наложены все эвристические ограничения. Впервые компьютеры были использованы в исследовании взаимодействия гемоглобина в серповидно-клеточных волокнах.<ref>{{Статья|автор=C. Levinthal, S. J. Wodak, P. Kahn, A. K. Dadivanian|год=1975-04-01|doi=10.1073/pnas.72.4.1330|issn=0027-8424, 1091-6490|выпуск=4|страницы=1330–1334|издание=Proceedings of the National Academy of Sciences|заглавие=Hemoglobin interaction in sickle cell fibers. I: Theoretical approaches to the molecular contacts.|ссылка=http://dx.doi.org/10.1073/pnas.72.4.1330|том=72}}</ref> Затем в 1978 году появилась работа с комплексом [[трипсин]]-[[Апротинин]]. <ref>{{Статья|автор=Shoshana J. Wodak, Joël Janin|год=1978-09|doi=10.1016/0022-2836(78)90302-9|issn=0022-2836|выпуск=2|страницы=323–342|издание=Journal of Molecular Biology|заглавие=Computer analysis of protein-protein interaction|ссылка=http://dx.doi.org/10.1016/0022-2836(78)90302-9|том=124}}</ref> Компьютеры использовались для отличия "плохих" и "хороших" моделей, посредством оценочной функции. "Вознаграждалась" большая площадь интерфейса (поверхность связывания), а за перекрывающиеся участки накладывались штрафы. Компьютер использовал упрощенное представление взаимодействующих белков: каждый остаток представлялся в виде одного центра связывания. [[Электростатика|Электростатические]] взаимодействия, такие как [[Водородная связь|водородные связи]], анализировались вручную.

К началу 1990-х годов было определено больше структур комплексов, тогда как доступные вычислительные мощности значительно возросли. С появлением [[Биоинформатика|биоинформатики]] основное внимание уделялось разработке методов, применимых к произвольным интерактантам при приемлемых вычислительных затратах и в отсутствие дополнительных филогенетических или экспериментальных данных.

В 1992 году был опубликован метод<ref>{{Статья|автор=E. Katchalski-Katzir, I. Shariv, M. Eisenstein, A. A. Friesem, C. Aflalo|год=1992-03-15|doi=10.1073/pnas.89.6.2195|issn=0027-8424, 1091-6490|выпуск=6|страницы=2195–2199|издание=Proceedings of the National Academy of Sciences|заглавие=Molecular surface recognition: determination of geometric fit between proteins and their ligands by correlation techniques.|ссылка=http://dx.doi.org/10.1073/pnas.89.6.2195|том=89}}</ref>, в котором использовалось быстрое преобразование Фурье. В этом методе имело место "грубое" представление партнеров докинга: в виде трехмерных матриц, числа в которх соответствовали положениям атомов. [[Быстрое преобразование Фурье]] помогало находить расположение этих матриц, соответсвующее контакту партнеров гораздо быстрее других методов докинга. В 1997 в этот метод стал учитывать электростатические взаимодействия.

В 1996 году были опубликованы результаты первого исследования<ref>{{Статья|автор=N.C.J. Strynadka, M. Eisenstein, E. Katchalski-Katzir, B.K. Shoichet, I.D. Kuntz|год=1996-03|doi=10.1038/nsb0396-233|issn=1072-8368|выпуск=3|страницы=233–239|издание=Nature Structural Biology|заглавие=Molecular docking programs successfully predict the binding of a β-lactamase inhibitory protein to TEM-1 β-lactamase|ссылка=http://dx.doi.org/10.1038/nsb0396-233|том=3}}</ref>, в котором шесть исследовательских групп пытались предсказать структуру комплекса [[бета-лактамазы]] TEM-1 с белком-ингибитором бета-лактамазы (BLIP). В исследовании была отмечена необходимость учета конформационных изменений и трудности различения конформеров.

=== "Твердотельный" докинг и "гибкий" докинг ===
"Твердотельным" называется докинг, при котором {{iw|Молекулярная геометрия|длины связей, углы и торсионные углы партнеров|en|Molecular_geometry}} докинга остаются неизменными в процессе симуляции. Вопрос о том, является ли "Твердотельное" приближени приемлимым для большинства случаев остается пока дискуссионным. Когда происходит существенное конформационное изменение партнеров докинга во время образование комплекса, "твердотельное" приближение однозначно неприменимо. Однако подсчет всех возможных конформационных изменений на данном уровне развития компьютеров заняло бы астрономическое время. Поэтому процедуры докинга, которые допускают конформационные изменения, или процедуры «гибкой стыковки», рационально выбирать небольшое подмножество возможных конформационных изменений для проведения симуляций.

=== Методы ===
Успешный докинг требует выполнения двух условий:
* Создание набора конформаций, который надежно включает, по крайней мере, хотя бы одну "достоверную".
* Надежно отличает "достоверные" конформаций от других.

Для многих случаях, к примеру для [[антитело | антител]] и [[Конкурентный антагонист|конкурентных ингибиторов]] сайт связывания известен. В других случаях сайт связывания может быть определен по данным [[Мутагенез|мутагенеза]] или [[Филогения|филогении]]. Конфигурации, в которых атомы белков перекрываются (т.н. клеш, clash) всегда исключаются.

После отсеивания комплексов с клешами, измеряется энергия каждой структуры (модели комплекса) т.н. скоровой (оценочной) функцией. Последняя должна различить "достоверную" структуру выше как минимум 100 000 альтернатив. Это сложная вычислительная задача, поэтому было разработано множество методов ее решения. Алгоритмы можно разделить на [[Детерминированный алгоритм|детерминированные]] и [[Стохастичность|стохастические]].

==== Переход в [[обратное пространство]]====

Каждый из белков может быть представлен в виде простой кубической решетки. Для моделей комплекса, переводимых друг в друга путем изменения положения белка может быть практически мгновенно вычислена некая оценочная функция применением {{iw|Теорема свертки|теоремы свертки|en|Convolution_theorem}}. Можно построить осмысленные, хотя и приблизительные, "сверточные" скоринговые функции, учитывающие как стереохимические, так и электростатические взаимодействия.

Методы обратного пространства широко использовались благодаря их способности оценивать огромное количество структур. Они теряют преимущество в скорости, если имеют место торсионные изменения. Другой недостаток заключается в том, что невозможно эффективно использовать накопленные знания. Остается также вопрос, не являются ли этот метод достаточно точным для надежного выявления структуры лучшего комплекса.

==== Методы Монте-Карло ====

В [[Метод Монте-Карло |методах типа Монте-Карло]] исходная конфигурация уточняется путем принятия или отвергания шагов (итеративных изменений некого набора параметров), в зависимости от значения оценочной функции (т.е. скора структуры) (см. [[Алгоритм Метрополиса — Гастингса|Критерий Метрополиса]]), пока не будет предпринято определенное количество шагов. Предполагается, что сходимость к наилучшей структуре будет происходить из большого класса начальных, только одну из которых необходимо учитывать. Исходные структуры могут быть гораздо быстрее семплированы "грубыми" (coarsed) методами. Трудно найти скоровую функцию, которая бы одновременно хорошо отличала "хорошую" структуру и сходилась ней с большого расстояния (в семплируемом пространстве). Поэтому было предложено использование двух уровней приближения ("грубое" и "точное") с различными функциями оценки. <ref name="pmid12875852">{{cite journal |vauthors=Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D | title = Protein–protein docking with simultaneous optimization of rigid-body displacement and side-chain conformations | journal = J. Mol. Biol. | volume = 331 | issue = 1 | pages = 281–299 | year = 2003 | pmid = 12875852 | doi = 10.1016/S0022-2836(03)00670-3 }}</ref> Вращение может быть введено в Монте-Карло как дополнительный параметр для шага.

Методы Монте-Карло являются стохастическим и не гарантируют исчерпывающий поиск, следовательно лучшая конфигурация может быть пропущена даже при использовании оценочной функции, которая в теории ее отличает. Насколько серьезно влияет эта проблема на результаты докинга пока точно не установлено.

=== Оценка ===

====Оценочные функции (скоринг-функции) ====
{{основная статья|Скоринг_функции_для_докинга}}
Для поиска скора (некоторого показателя), позволяющего отличить лучшие модели была разработана специальная тестовая выборка (Benchmark, см. Ниже) белок-белковых структур. Скоры оцениваются по рангу, который они присваивают наилучшей структуре (в идеале ранжирование по скору должно вывести "экспериментально" лучшую структуру на первое место), и по их покрытию (доля контрольных случаев, для которых они достигают приемлемого результата).
Скоры разделяют на несколько категорий, включающих:
*[[Эвристический алгоритм|Эвристические]] скор-функции, основанные на экспериментальных данных о контактах [[Аминокислоты|аминокислотных остатков]].
* Комплиментарность формы {{iw|Молекулярная поверхность|молекулярных поверхностей|en|Accessible_surface_area}} взаимодействующих партнеров.
* Свободные энергии, оцененные с использованием параметров из {{iw|Молекулярная механика|молекулярно механических|en|Molecular_mechanics}} {{iw|силовое поле (химия)|силовых полей|en|Force_field_(chemistry)}}, таких как {{iw|CHARMM|CHARMM|en|CHARMM}} или {{iw|AMBER|AMBER|en|AMBER}}.
* Филогенетические подтверждение взаимодействующих областей.
* Коэффициенты кластеризации.

Обычно гибридные оценки (собственно скор-функции) создаются путем объединения одной или нескольких вышеупомянутых категорий (далее "термы" скор-функции) в взвешенную сумму, веса которой оптимизируются используя тестовые выборки (т.н. Бенчмарки). Чтобы избежать статистических искажений (biases) тестовые модели, используемые для оптимизации весов, не должны пересекаться с тестовыми моделями, используемыми для финальной проверки гибридной оценки.

В задаче белок-белкового докинга важно найти скоровую функцию, достоверно отражающую информацию об аффинности партнеров. Такая функция значительно ускорила бы развитие in silico [[Белковая инженерия|белковой инженерии]], разработку лекарств а также высокопроизводительную аннотацию [[Интерактом|интерактома]] (т.е. какие белки связываются, а какие нет).
Для оценки аффинности связывания / свободной энергии было предложено много оценочных функций. <ref name="pmid12875852" /><ref name="pmid11517309">{{cite journal | doi = 10.1073/pnas.181147798 |vauthors=Camacho CJ, Vajda S | title = Protein docking along smooth association pathways | journal = Proceedings of the National Academy of Sciences | volume = 98 | issue = 19 | pages = 10636–10641 | year = 2008 | pmid = 11517309 | pmc = 58518 }}</ref> <ref name="pmid17559675">{{cite journal | doi = 10.1186/1472-6807-7-37 |vauthors=Camacho CJ, Vajda S | title = In silico screening of mutational effects on enzyme-proteic inhibitor affinity: a docking-based approach | journal = BMC Structural Biology | volume = 7 | pages = 37 | year = 2007 | pmid = 17559675 | pmc = 1913526 }}</ref> <ref name="pmid15801826">{{cite journal |vauthors=Zhang C, Liu S, Zhu Q, Zhou Y | title = A knowledge-based energy function for protein–ligand, protein–protein, and protein–DNA complexes | journal = Journal of Medicinal Chemistry | volume = 48 | issue = 7 | pages = 2325–2335 | year = 2005 | pmid = 15801826 | doi = 10.1021/jm049314d }}</ref> <ref>{{cite journal|vauthors=Esmaielbeiki R, Nebel JC |year=2014|title=Scoring docking conformations using predicted protein interfaces|journal=BMC Bioinformatics|volume=15|page=171|doi= 10.1186/1471-2105-15-171|pmid=24906633|pmc=4057934}}</ref> Однако корреляция между экспериментально установленным сродством связывания и предсказаниями девяти популярных скор-функций окозалась почти [[Ортогональность|ортогональной]] (R <sup> 2 </sup> ~ 0). <ref name="pmid20329755"/><ref name="evaluation">{{cite journal |vauthors=Rosato A, Fuentes G, Verma C | title = Faculty of 1000 Biology: evaluations for Kastritis PL & Bonvin AM J Proteome Res 2010 May 7 9 (5) :2216-25 | journal = Faculty of 1000 Biology | volume = 9 | issue = 5 | pages = 2216–2225 | year = 2010 | url = http://f1000biology.com/article/id/3437978/evaluation | doi = 10.1021/pr9009854 | pmid = 20329755 | hdl = 1874/202590 }}</ref> Было также замечено, что некоторые термы лучше коррелируют с экспериментальными энергиями связи, чем полная оценка, что позволяет предположить, что можно найти улучшить скор-функцию, пересмотрев веса её компонетнтов (термов).
Среди экспериментальных методов определения аффинности связывания выделяют [[поверхностный плазмонный резонанс]] (SPR), {{iw|Передача энергии резонанса Фёрстера|передачу энергии резонанса Фёрстера|en|Förster_resonance_energy_transfer}}, методы с применением радиолигандов, {{iw|Калориметрия изотермического титрования|калориметрия изотермического титрования|en|Isothermal_titration_calorimetry}} (ITC), {{iw|Микроскопический термофорез|микроскопический термофорез|en|Microscale_thermophoresis}} (MST) или спектроскопические измерения и другие методы флуоресценции. Информация из научных статей также может служить хорошим источником для улучшения скоринга. <ref name="pmid29506465">{{cite journal|doi= 10.1186/s12859-018-2079-4|vauthors= Badal, VD, Kundrotas, PJ, Vakser, IA | title = Natural language processing in text mining for structural modeling of protein complexes|journal = BMC Bioinformatics |volume= 19 |issue= 1 |pages= 84 |year=2018|pmid = 29506465 |pmc= 5838950 }}</ref>

==== Тестовые выборки (Бенчмарки) ====
Для тестирования методов докинга была сделана тестовая выборка (Бенчмарк) из 84 структур белок-белковых комплексов.<ref name="pmid15981264">{{cite journal |vauthors=Mintseris J, Wiehe K, Pierce B, Anderson R, Chen R, Janin J, Weng Z | title = Protein-Protein Docking Benchmark 2.0: an update | journal = Proteins | volume = 60 | issue = 2 | pages = 214–216 | year = 2005 | pmid = 15981264 | doi = 10.1002/prot.20560 }}</ref> Структуры в тестовой выборке специально подобраны так, что охватывают широкий спектр типов взаимодействий, и максимально разнородны (содержат как можно меньше повторяющихся особенностей, таких как профили семейств партнеров в базе данных {{iw|SCOP|SCOP|en|Structural_Classification_of_Proteins_database}}). Тестовые элементы подразделяются на три уровня сложности (самый сложный содержит наибольшее изменение конформации остова). Примерами тестовых моделей для белок-белкового докинга могут служить структуры фермент-ингибитор, антиген-антитело и гомомультимерные комплексы.

Новейшая версия бенчмарка для белок-белкового докинга состоит из 230 комплексов, <ref>{{cite journal | vauthors = Vreven T, Moal IH, Vangone A, Pierce BG, Kastritis PL, Torchala M, Chaleil R, Jiménez-García B, Bates PA, Fernandez-Recio J, Bonvin AM, Weng Z | title = Updates to the Integrated Protein-Protein Interaction Benchmarks: Docking Benchmark Version 5 and Affinity Benchmark Version 2 | journal = Journal of Molecular Biology | volume = 427 | issue = 19 | pages = 3031–41 | date = September 2015 | pmid = 26231283 | pmc = 4677049 | doi = 10.1016/j.jmb.2015.07.016 }}</ref> а для днк-белкового — из 47. <ref>{{cite journal | vauthors = van Dijk M, Bonvin AM | title = A protein-DNA docking benchmark | journal = Nucleic Acids Research | volume = 36 | issue = 14 | pages = e88 | date = August 2008 | pmid = 18583363 | pmc = 2504314 | doi = 10.1093/nar/gkn386 }}</ref> Новейшая тестовая выборка на РНК-белковый докинг включает 126 элементов. <ref>{{cite journal | vauthors = Nithin C, Mukherjee S, Bahadur RP | title = A non-redundant protein-RNA docking benchmark version 2.0 | journal = Proteins | pages = 256–267 | date = November 2016 | pmid = 27862282 | doi = 10.1002/prot.25211 | volume=85| issue = 2 }}</ref> Существуют объединенные тестовые выборки, насчитывающие 209 комплексов. <ref>{{Cite journal|last=Nithin|first=Chandran|last2=Ghosh|first2=Pritha|last3=Bujnicki|first3=Janusz|last4=Nithin|first4=Chandran|last5=Ghosh|first5=Pritha|last6=Bujnicki|first6=Janusz M.|date=2018-08-25|title=Bioinformatics Tools and Benchmarks for Computational Docking and 3D Structure Prediction of RNA-Protein Complexes|journal=Genes|language=en|volume=9|issue=9|pages=432|doi=10.3390/genes9090432|pmid=30149645|pmc=6162694}}</ref>

Тестовая выборка для оценки [[Аффинность|аффинности]] была основана на тестовой выбоке для белок-белкового докинга. <ref name="pmid20329755">{{cite journal |vauthors=Kastritis PL, Bonvin AM | title = Are scoring functions in protein–protein docking ready to predict interactomes? Clues from a novel binding affinity benchmark | journal = J. Proteome Res. | volume = 9 | issue = 5 | pages = 2216–2225 |date=May 2010 | pmid = 20329755 | doi = 10.1021/pr9009854 | issn = | hdl = 1874/202590 }}</ref> В неё были включены 81 белок-белковых комплекса с экспериментально измеренной аффинностью. Эти комплексы охватывают 11 порядков по значению аффинности.

Эта выборка была в дальнейшем подвергнута экспертной оценке и значительно расширена. <ref name="pmid21213247">{{cite journal |vauthors=Kastritis PL, Moal IH, Hwang H, Weng Z, Bates PA, Bonvin AM, Janin J | title = A structure-based benchmark for protein-protein binding affinity | journal = Protein Science | volume = 20 | issue = 3 | pages = 482–491 |date=March 2011 | pmid = 21213247 | doi = 10.1002/pro.580 | url = | issn = | pmc = 3064828 }}</ref> Новая тестовая выборка включает белки, с различными биологическими функциями. В её состав входят G-белки и внеклеточные домены рецепторов, а также комплексы антиген / антитело, фермент / ингибитор и фермент / субстрат. Она также разнообразна с точки зрения аффинности партнеров друг к другу, с K <sub> d </sub> в диапазоне от 10 <sup> −5 </sup> до 10 <sup> −14 </sup> M. Девять элементов представляют собой близкородственные комплексы, которые имеют сходную структуру, но очень различную аффинность. Поскольку известны структуры компонентов комплекса по отдельности, можно оценить изменения конформации партнеров при его образовании. В большинстве комплексов они весьма значительны. Данная тестовая выбока может применяться и для биофизических моделей, направленных на установление связи аффинности со структурой в белок-белковых взаимодействиях, учитывая данные о реагентах и их конформационных изменениях, а не только о продукте (комплексе). <Ref name = "pmid21213247" />

==== CAPRI ====
{{основная статья|Критическая оценка предсказания взаимодействий}}
CAPRI (англ. Critical Assessment of PRediction of Interactions, критическая оценка предсказания взаимодействий) <ref name="pmid12784359">{{cite journal |vauthors=Janin J, Henrick K, Moult J, Eyck LT, Sternberg MJ, Vajda S, Vakser I, Wodak SJ | title = CAPRI: a Critical Assessment of PRedicted Interactions | journal = Proteins | volume = 52 | issue = 1 | pages = 2–9 | year = 2003 | pmid = 12784359 | doi = 10.1002/prot.10381 | citeseerx = 10.1.1.461.3355 }}</ref> - это регулярно проводимые мероприятия, в ходе которых исследователям по всему миру предлагается получить структуру белок белкового комплекса если даны только структуры реагентов методом докинга. Мероприятия (раунды) проходят примерно каждые 6 месяцев. Во время каждого тура участником даются структуры реагентов комплекса, структура которого была недавно определена экспериментально. Координаты комплекса хранятся в тайне. Оценка CAPRI является [[Слепой метод|двойным слепым методом]], т.к. участники не знают структуры комплекса, а организаторы не знают кто из участников предложил конкретную модель комплекса.


В настоящее время CAPRI обретает популярность (37 групп приняли участие во всем мире в седьмом раунде). Не смотря на то, что результаты CAPRI имеют небольшое статистическое значение из-за небольшого количества целей в каждом раунде, роль CAPRI является весьма значительной. Оценка [[CASP]] является аналогичным упражнением в области предсказания структуры белка.
== См. также ==
== См. также ==



Версия от 07:59, 23 апреля 2019


Шаблон:Docking glossary

Схематическая диаграмма, иллюстрирующая докинг малой молекулы лиганда (синяя) с белковым рецептором (красная).
Малая молекула стыкуется с белком.
Докинг лиганда (зеленый) в модель бета-2 адренергического рецептора (PDB 3SN6), полученную методом РСА .

Молекулярный докинг (или молекулярная стыковка) — это метод молекулярного моделирования, который позволяет предсказать наиболее выгодную для образования устойчивого комплекса ориентацию и конформацию одной молекулы (лиганда) в центре связывания другой (рецептора). Данные о положении и конформации партнеров используются для предсказания силы взаимодействия посредством т.н. оценочных функций.

Концепция "ключ-замок"

Молекулярный докинг можно представлять себе как поиск оптимального положения "ключа" (лиганда) в "замке" (рецепторе). [1] В этой аналогии партнеры докинга − жесткие тела, что неверно для молекулярных систем. В реальности, в процессе стыковки лиганд и белок изменяют конформации для достижения наилучшего связывания. Изменения конформации белка могут включать движения петель и доменов. [1] Такой процесс, ведущий к успешному связыванию называют "индуцированным соответствием". [2]

Постановка задачи

Обычно необходимо рассчитать положения и конформации лиганда, при которых достигается минимум свободной энергии связывания.

Сферы применения

Комплексы таких биологически значимых молекул как белки, нуклеиновые кислоты, углеводы и липиды играют ключевую роль в передаче химического сигнала. К тому же, относительная ориентация двух взаимодействующих молекул может влиять на тип произведённого сигнала (будет он ингибирующим или каталитическим). Поэтому стыковка важна для предсказания как типа, так и силы производимого сигнала.

Стыковка часто используется для предсказания аффинности и активности небольшой молекулы лекарства по отношению к белку-мишени. Таким образом стыковка молекул играет важную роль в разработке лекарственных препаратов.

Подходы к моделированию докинга

Существуют два подхода при моделировании докинга (стыковки). Один подход использует технику соответствия, которая описывает белок и лиганд как дополнительные поверхности[3][4]. Второй подход моделирует фактический процесс стыковки, в котором вычисляются попарные энергии взаимодействия[5]. У обоих подходов есть существенные преимущества, а также некоторые ограничения.

Взаимозависимость формы

Геометрическое соответствие (методы взаимозависимости формы) описывается для белка и лиганда как ряд особенностей, которые позволяют их стыковать[6]. Эти особенности могут включать как саму молекулярную поверхность, так и описание дополнительных особенностей поверхности. В этом случае молекулярная поверхность рецептора описывается с точки зрения её доступности площади поверхности для растворителя, а молекулярная поверхность лиганда описывается с точки зрения её соответствия описанию поверхности рецептора. Взаимозависимость между двумя поверхностями составляет описание соответствия формы, которое может помочь обнаружению дополнительной позы стыковки цели и молекул лиганда. В другом подходе нужно описать гидрофобные особенности белка, используя повороты в атомах главной цепи. Еще один подход должен использовать дескрипторную технику формы Фурье[7][8][9].

Симуляция

В этом подходе белок и лиганд отделены некоторым физическим расстоянием, и лиганд находит своё положение в активный сайт белка после определенного числа «шагов». Шаги включают преобразования твердого тела, такие как перемещение и вращение, а также внутренние изменения структуры лиганда включая угловые вращения. Каждый из этих шагов в пространстве изменяет полную энергетическую оценку системы, и следовательно она вычисляется после каждого движения. Очевидное преимущество этого метода состоит в том, что это позволяет исследовать гибкость лиганда во время моделирования, тогда как методы взаимозависимости формы должны использовать некоторые другие методы, чтобы узнавать о гибкости лиганда. Другое преимущество состоит в том, что процесс физически ближе к тому, что происходит в действительности, когда белок и лиганд приближаются к друг другу после молекулярного распознавания. Неудобство этой техники — то, что она занимает время, чтобы оценить оптимальную позу закрепления, так как необходимо исследовать довольно большой энергетический ландшафт.

Программы для молекулярной стыковки

Существует много программ для теоретической стыковки белков. Большая часть работает по следующему принципу: один белок фиксируется в пространстве, а второй поворачивается вокруг него разнообразными способами. При этом, для каждой конфигурации поворотов производятся оценочные расчеты по оценочной функции. Оценочная функция основана на поверхностной комплементарности, электростатических взаимодействиях, Ван-дер-Ваальсовском отталкивании и так далее. Проблема при этом поиске в том, что вычисления по всему конфигурационному пространству требуют много времени на вычисления, редко приводя к единственному решению.[10]

Знания о предсказанной ориентации могут быть использованы для предсказания прочности комплекса или сродства связей между двумя молекулами с помощью использования отдельных вычислений.

  1. AutoDock (http://autodock.scripps.edu)
  2. FlexX (http://www.biosolveit.de/FlexX/)
  3. Dock (http://dock.compbio.ucsf.edu)
  4. Surflex (http://www.biopharmics.com, www.tripos.com)
  5. Fred (http://www.eyesopen.com/products/applications/fred.html)
  6. Gold (http://www.ccdc.cam.ac.uk/products/life_sciences/gold/)
  7. PLANTS (http://www.tcd.uni-konstanz.de/research/plants.php)
  8. 3DPL (http://www.chemnavigator.com/cnc/products/3dpl.asp)
  9. Lead Finder (https://web.archive.org/web/20110315203423/http://www.moltech.ru/)
  10. Molegro Virtual Docker (https://web.archive.org/web/20160807163250/http://www.molegro.com/)
  11. ICM Pro (http://www.molsoft.com/icm_pro.html)
  12. Ligand fit, Libdock and CDocker (http://accelrys.com/services/training/life-science/StructureBasedDesignDescription.html)
  13. DockSearch (http://www.ibmc.msk.ru)
  14. eHiTS (https://web.archive.org/web/20150908093043/http://www.simbiosys.ca/ehits/index.html)
  15. Glide (https://web.archive.org/web/20130514073838/http://www.schrodinger.com/productpage/14/5/)
  16. DockingShop (http://vis.lbl.gov/~scrivelli/Public/silvia_page/DockingShop.html)
  17. HADDOCK (http://www.nmr.chem.uu.nl/haddock/)

Оценка алгоритмов докинга

Несовершенство оценочной функции неизбежно приводит к необходимости оценки предсказательной способности конкретного алгоритма (к примеру AutoDock, ICM) докинга. Для этого необходимы дополнительные эксперементальные данные, к примеру референсная структура. Оценка может быть проведена несколькими способами:

  • Оценка точности докинга
  • Оценка фактора обогащения
  • Наличие моделей "индуцированного соответствия" в результатах докинга

Точность докинга (Docking accuracy)

Точность докинга[11] — одна из оценок применимости алгоритма, способность алгоритма воспроизводить экспериментальные данные.

Фактор обогащения (Enrichment factor)

Фактор обогащения оценивается как способность алгоритма выделить (представить в топе лучших) "истинные" лиганды от "ложных" в выборке, где количество "ложных" много больше количества "истинных". Под "истинными" понимаются лиганды, связывание которых экспериментально доказано, а под "ложными" — лиганды, связывание которых не доказано[12]. Часто проводится анализ ROC-кривой метода.

Сопоставительный анализ (Benchmarking)

Способность программ для докинга воспроизводить структуры, полученные методом РСА может быть оценена рядом Бенчмаркинг-методов.

В случае малых молекул для сопоставительного анализа могут быть взяты специальные референсные наборы, к примеру Astex Diverse Set[13], содержащий структуры белоков с лигандами, полученных методом РСА или Directory of Useful Decoys (DUD).[14]

В случае докинга пептидов можно использовать Lessons for Efficiency Assessment of Docking and Scoring (LEADS-PEP).[15]

Макромолекулярный докинг

Макромолекулярный докинг — это метод молекулярного моделирования четвертичной структуры комплексов, образованных двумя или более взаимодействующими биологическими макромолекулами. Чаще всего исследуются белок-белковые комплексы, реже — белок-нуклеиновые.

Конечной целью докинга является предсказание трехмерной структуры изучаемого макромолекулярного комплекса в естественной среде. Результатом докинга является набор моделей комплекса (структур). Они могут быть ранжированы различными методами, такими как оценочная (скоровая, скоринг, скор-) функция для отбора наиболее правдоподобных (с большей долей вероятности встречающихся в организме).

Термин "докинг" или "стыковка" появился в конце 1970х в значении моделирования стыковки двух молекул, при котором ореинтация последних не менялась (менялось только положение). С увеличением компьютерных мощностей стало возможно разрешить изменение ореинтации партнеров, такой вариант докинга называется "rigid docking" или докинг жестких тел ("rigid body"). Следующим шагом стал переход к "гибкому докингу" ("flexible docking"), при котором изменяется внутренняя геометрия (конформация) партнеров.

Введение

Биологические роли большинства белков, описываемые тем, с какими молекулами они могут взаимодействовать известны в лучшем случае по меньшей мере неполностью. Даже белки, участвующие в хорошо изученных биологических процессах (напр. ЦТК) могут иметь неожиданных интерактантов или новые биологические функции.

В случае белок-белковых взаимодействий возникают дополнительные вопросы. Считается, что генетические заболевания (напр. Муковисцидоз) вызываются неправильно свернутыми (мутированными) белками и возникает желание понять какие анамальные белок-белковые взаимодействия могут быть вызваны той или иной мутацией. Если в будущем появится возможность дизайна белков для проведения биологических функций, важно будет определить круг их возможных взаимодействий.

Для некоторого набора белков может решаться следующий спектр задач:

  • Связываются ли белки in vivo?

Если связываются,

  • Какую конформацию имеет белок в связанном состоянии?
  • Насколько сильным можно считать их взаимодействие?

Если не связываются,

  • Можно ли получить связывание путем внедрение мутаций в белки?

Для решения этих проблем может применяться белок-белковый докинг.

Более того докинг может помочь в исследовании белков с неизвестной функцией (относительно мало изученная сфера). Если нет модели пространственной структуры, ее можно моделировать (см. предсказание структуры белка).

Белок-нуклеиновые взаимодействия играют важную роль в живой клетке. Транскрипционные факторы регулируют экспрессию генов, а полимеразы, которые осуществляют репликацию суть белковые комплексы, а генетический материал, с которым они связываются состоят из нуклеиновых кислот. Моделирование белок-нуклеиновых взаимодействий имеет некоторые сложности, описанные далее.

История

В 1970-х годах сложное моделирование заключалось в ручной идентификации элементов на поверхностях интерактантов (партнеров) и интерпретации последствий для связывания, функции и активности; любые компьютерные программы обычно использовались в конце процесса моделирования чтобы различать относительно немногочисленные конфигурации, которые остались после того, как были наложены все эвристические ограничения. Впервые компьютеры были использованы в исследовании взаимодействия гемоглобина в серповидно-клеточных волокнах.[16] Затем в 1978 году появилась работа с комплексом трипсин-Апротинин. [17] Компьютеры использовались для отличия "плохих" и "хороших" моделей, посредством оценочной функции. "Вознаграждалась" большая площадь интерфейса (поверхность связывания), а за перекрывающиеся участки накладывались штрафы. Компьютер использовал упрощенное представление взаимодействующих белков: каждый остаток представлялся в виде одного центра связывания. Электростатические взаимодействия, такие как водородные связи, анализировались вручную.

К началу 1990-х годов было определено больше структур комплексов, тогда как доступные вычислительные мощности значительно возросли. С появлением биоинформатики основное внимание уделялось разработке методов, применимых к произвольным интерактантам при приемлемых вычислительных затратах и в отсутствие дополнительных филогенетических или экспериментальных данных.

В 1992 году был опубликован метод[18], в котором использовалось быстрое преобразование Фурье. В этом методе имело место "грубое" представление партнеров докинга: в виде трехмерных матриц, числа в которх соответствовали положениям атомов. Быстрое преобразование Фурье помогало находить расположение этих матриц, соответсвующее контакту партнеров гораздо быстрее других методов докинга. В 1997 в этот метод стал учитывать электростатические взаимодействия.

В 1996 году были опубликованы результаты первого исследования[19], в котором шесть исследовательских групп пытались предсказать структуру комплекса бета-лактамазы TEM-1 с белком-ингибитором бета-лактамазы (BLIP). В исследовании была отмечена необходимость учета конформационных изменений и трудности различения конформеров.

"Твердотельный" докинг и "гибкий" докинг

"Твердотельным" называется докинг, при котором длины связей, углы и торсионные углы партнеров?! докинга остаются неизменными в процессе симуляции. Вопрос о том, является ли "Твердотельное" приближени приемлимым для большинства случаев остается пока дискуссионным. Когда происходит существенное конформационное изменение партнеров докинга во время образование комплекса, "твердотельное" приближение однозначно неприменимо. Однако подсчет всех возможных конформационных изменений на данном уровне развития компьютеров заняло бы астрономическое время. Поэтому процедуры докинга, которые допускают конформационные изменения, или процедуры «гибкой стыковки», рационально выбирать небольшое подмножество возможных конформационных изменений для проведения симуляций.

Методы

Успешный докинг требует выполнения двух условий:

  • Создание набора конформаций, который надежно включает, по крайней мере, хотя бы одну "достоверную".
  • Надежно отличает "достоверные" конформаций от других.

Для многих случаях, к примеру для антител и конкурентных ингибиторов сайт связывания известен. В других случаях сайт связывания может быть определен по данным мутагенеза или филогении. Конфигурации, в которых атомы белков перекрываются (т.н. клеш, clash) всегда исключаются.

После отсеивания комплексов с клешами, измеряется энергия каждой структуры (модели комплекса) т.н. скоровой (оценочной) функцией. Последняя должна различить "достоверную" структуру выше как минимум 100 000 альтернатив. Это сложная вычислительная задача, поэтому было разработано множество методов ее решения. Алгоритмы можно разделить на детерминированные и стохастические.

Переход в обратное пространство

Каждый из белков может быть представлен в виде простой кубической решетки. Для моделей комплекса, переводимых друг в друга путем изменения положения белка может быть практически мгновенно вычислена некая оценочная функция применением теоремы свертки[англ.]. Можно построить осмысленные, хотя и приблизительные, "сверточные" скоринговые функции, учитывающие как стереохимические, так и электростатические взаимодействия.

Методы обратного пространства широко использовались благодаря их способности оценивать огромное количество структур. Они теряют преимущество в скорости, если имеют место торсионные изменения. Другой недостаток заключается в том, что невозможно эффективно использовать накопленные знания. Остается также вопрос, не являются ли этот метод достаточно точным для надежного выявления структуры лучшего комплекса.

Методы Монте-Карло

В методах типа Монте-Карло исходная конфигурация уточняется путем принятия или отвергания шагов (итеративных изменений некого набора параметров), в зависимости от значения оценочной функции (т.е. скора структуры) (см. Критерий Метрополиса), пока не будет предпринято определенное количество шагов. Предполагается, что сходимость к наилучшей структуре будет происходить из большого класса начальных, только одну из которых необходимо учитывать. Исходные структуры могут быть гораздо быстрее семплированы "грубыми" (coarsed) методами. Трудно найти скоровую функцию, которая бы одновременно хорошо отличала "хорошую" структуру и сходилась ней с большого расстояния (в семплируемом пространстве). Поэтому было предложено использование двух уровней приближения ("грубое" и "точное") с различными функциями оценки. [20] Вращение может быть введено в Монте-Карло как дополнительный параметр для шага.

Методы Монте-Карло являются стохастическим и не гарантируют исчерпывающий поиск, следовательно лучшая конфигурация может быть пропущена даже при использовании оценочной функции, которая в теории ее отличает. Насколько серьезно влияет эта проблема на результаты докинга пока точно не установлено.

Оценка

Оценочные функции (скоринг-функции)

Для поиска скора (некоторого показателя), позволяющего отличить лучшие модели была разработана специальная тестовая выборка (Benchmark, см. Ниже) белок-белковых структур. Скоры оцениваются по рангу, который они присваивают наилучшей структуре (в идеале ранжирование по скору должно вывести "экспериментально" лучшую структуру на первое место), и по их покрытию (доля контрольных случаев, для которых они достигают приемлемого результата). Скоры разделяют на несколько категорий, включающих:

Обычно гибридные оценки (собственно скор-функции) создаются путем объединения одной или нескольких вышеупомянутых категорий (далее "термы" скор-функции) в взвешенную сумму, веса которой оптимизируются используя тестовые выборки (т.н. Бенчмарки). Чтобы избежать статистических искажений (biases) тестовые модели, используемые для оптимизации весов, не должны пересекаться с тестовыми моделями, используемыми для финальной проверки гибридной оценки.

В задаче белок-белкового докинга важно найти скоровую функцию, достоверно отражающую информацию об аффинности партнеров. Такая функция значительно ускорила бы развитие in silico белковой инженерии, разработку лекарств а также высокопроизводительную аннотацию интерактома (т.е. какие белки связываются, а какие нет). Для оценки аффинности связывания / свободной энергии было предложено много оценочных функций. [20][21] [22] [23] [24] Однако корреляция между экспериментально установленным сродством связывания и предсказаниями девяти популярных скор-функций окозалась почти ортогональной (R 2 ~ 0). [25][26] Было также замечено, что некоторые термы лучше коррелируют с экспериментальными энергиями связи, чем полная оценка, что позволяет предположить, что можно найти улучшить скор-функцию, пересмотрев веса её компонетнтов (термов). Среди экспериментальных методов определения аффинности связывания выделяют поверхностный плазмонный резонанс (SPR), передачу энергии резонанса Фёрстера[англ.], методы с применением радиолигандов, калориметрия изотермического титрования[англ.] (ITC), микроскопический термофорез[англ.] (MST) или спектроскопические измерения и другие методы флуоресценции. Информация из научных статей также может служить хорошим источником для улучшения скоринга. [27]

Тестовые выборки (Бенчмарки)

Для тестирования методов докинга была сделана тестовая выборка (Бенчмарк) из 84 структур белок-белковых комплексов.[28] Структуры в тестовой выборке специально подобраны так, что охватывают широкий спектр типов взаимодействий, и максимально разнородны (содержат как можно меньше повторяющихся особенностей, таких как профили семейств партнеров в базе данных SCOP[англ.]). Тестовые элементы подразделяются на три уровня сложности (самый сложный содержит наибольшее изменение конформации остова). Примерами тестовых моделей для белок-белкового докинга могут служить структуры фермент-ингибитор, антиген-антитело и гомомультимерные комплексы.

Новейшая версия бенчмарка для белок-белкового докинга состоит из 230 комплексов, [29] а для днк-белкового — из 47. [30] Новейшая тестовая выборка на РНК-белковый докинг включает 126 элементов. [31] Существуют объединенные тестовые выборки, насчитывающие 209 комплексов. [32]

Тестовая выборка для оценки аффинности была основана на тестовой выбоке для белок-белкового докинга. [25] В неё были включены 81 белок-белковых комплекса с экспериментально измеренной аффинностью. Эти комплексы охватывают 11 порядков по значению аффинности.

Эта выборка была в дальнейшем подвергнута экспертной оценке и значительно расширена. [33] Новая тестовая выборка включает белки, с различными биологическими функциями. В её состав входят G-белки и внеклеточные домены рецепторов, а также комплексы антиген / антитело, фермент / ингибитор и фермент / субстрат. Она также разнообразна с точки зрения аффинности партнеров друг к другу, с K d в диапазоне от 10 −5 до 10 −14 M. Девять элементов представляют собой близкородственные комплексы, которые имеют сходную структуру, но очень различную аффинность. Поскольку известны структуры компонентов комплекса по отдельности, можно оценить изменения конформации партнеров при его образовании. В большинстве комплексов они весьма значительны. Данная тестовая выбока может применяться и для биофизических моделей, направленных на установление связи аффинности со структурой в белок-белковых взаимодействиях, учитывая данные о реагентах и их конформационных изменениях, а не только о продукте (комплексе). [33]

CAPRI

CAPRI (англ. Critical Assessment of PRediction of Interactions, критическая оценка предсказания взаимодействий) [34] - это регулярно проводимые мероприятия, в ходе которых исследователям по всему миру предлагается получить структуру белок белкового комплекса если даны только структуры реагентов методом докинга. Мероприятия (раунды) проходят примерно каждые 6 месяцев. Во время каждого тура участником даются структуры реагентов комплекса, структура которого была недавно определена экспериментально. Координаты комплекса хранятся в тайне. Оценка CAPRI является двойным слепым методом, т.к. участники не знают структуры комплекса, а организаторы не знают кто из участников предложил конкретную модель комплекса.

В настоящее время CAPRI обретает популярность (37 групп приняли участие во всем мире в седьмом раунде). Не смотря на то, что результаты CAPRI имеют небольшое статистическое значение из-за небольшого количества целей в каждом раунде, роль CAPRI является весьма значительной. Оценка CASP является аналогичным упражнением в области предсказания структуры белка.

См. также

Примечания

  1. 1 2 Jorgensen WL (Nov 1991). "Rusting of the lock and key model for protein-ligand binding". Science. 254 (5034): 954—5. doi:10.1126/science.1719636. PMID 1719636.
  2. Wei BQ, Weaver LH, Ferrari AM, Matthews BW, Shoichet BK (Apr 2004). "Testing a flexible-receptor docking algorithm in a model binding site". Journal of Molecular Biology. 337 (5): 1161—82. doi:10.1016/j.jmb.2004.02.015. PMID 15046985.
  3. Meng EC, Shoichet BK, Kuntz ID (2004). "Automated docking with grid-based energy evaluation". Journal of Computational Chemistry. 13 (4): 505—524. doi:10.1002/jcc.540130412.{{cite journal}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  4. Morris GM, Goodsell DS, Halliday RS, Huey R, Hart WE, Belew RK, Olson AJ (1998). "Automated docking using a Lamarckian genetic algorithm and an empirical binding free energy function". Journal of Computational Chemistry. 19 (14): 1639—1662. doi:10.1002/(SICI)1096-987X(19981115)19:14<1639::AID-JCC10>3.0.CO;2-B.{{cite journal}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  5. Feig M, Onufriev A, Lee MS, Im W, Case DA, Brooks CL (2004). "Performance comparison of generalized born and Poisson methods in the calculation of electrostatic solvation energies for protein structures". Journal of Computational Chemistry. 25 (2): 265—84. doi:10.1002/jcc.10378. PMID 14648625.{{cite journal}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  6. Shoichet BK, Kuntz ID, Bodian DL (2004). "Molecular docking using shape descriptors". Journal of Computational Chemistry. 13 (3): 380—397. doi:10.1002/jcc.540130311.{{cite journal}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  7. Cai W, Shao X, Maigret B (2002). "Protein-ligand recognition using spherical harmonic molecular surfaces: towards a fast and efficient filter for large virtual throughput screening". J. Mol. Graph. Model. 20 (4): 313—28. doi:10.1016/S1093-3263(01)00134-6. PMID 11858640. {{cite journal}}: Неизвестный параметр |month= игнорируется (справка)Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  8. Morris RJ, Najmanovich RJ, Kahraman A, Thornton JM (2005). "Real spherical harmonic expansion coefficients as 3D shape descriptors for protein binding pocket and ligand comparisons". Bioinformatics. 21 (10): 2347—55. doi:10.1093/bioinformatics/bti337. PMID 15728116. {{cite journal}}: Неизвестный параметр |month= игнорируется (справка)Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  9. Kahraman A, Morris RJ, Laskowski RA, Thornton JM (2007). "Shape variation in protein binding pockets and their ligands". J. Mol. Biol. 368 (1): 283—301. doi:10.1016/j.jmb.2007.01.086. PMID 17337005. {{cite journal}}: Неизвестный параметр |month= игнорируется (справка)Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  10. Cyril Dominguez, Rolf Boelens, and Alexandre M. J. J. Bonvin (2003). "HADDOCK: A Protein-Protein Docking Approach Based on Biochemical or Biophysical Information". J. AM. CHEM. SOC. 125: 1731–1737.{{cite journal}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  11. Badry D. Bursulaya, Maxim Totrov, Ruben Abagyan, Charles L. Brooks. Comparative study of several algorithms for flexible ligand docking (англ.) // Journal of Computer-Aided Molecular Design. — 2003-11-01. — Vol. 17, iss. 11. — P. 755–763. — ISSN 1573-4951. — doi:10.1023/B:JCAM.0000017496.76572.6f.
  12. Niu Huang, Brian K. Shoichet, John J. Irwin. Benchmarking Sets for Molecular Docking // Journal of Medicinal Chemistry. — 2006-11-16. — Т. 49, вып. 23. — С. 6789–6801. — ISSN 0022-2623. — doi:10.1021/jm0608356.
  13. Michael J. Hartshorn, Marcel L. Verdonk, Gianni Chessari, Suzanne C. Brewerton, Wijnand T. M. Mooij. Diverse, High-Quality Test Set for the Validation of Protein−Ligand Docking Performance // Journal of Medicinal Chemistry. — 2007-02. — Т. 50, вып. 4. — С. 726–741. — ISSN 1520-4804 0022-2623, 1520-4804. — doi:10.1021/jm061277y.
  14. Niu Huang, Brian K. Shoichet, John J. Irwin. Benchmarking Sets for Molecular Docking // Journal of Medicinal Chemistry. — 2006-11. — Т. 49, вып. 23. — С. 6789–6801. — ISSN 1520-4804 0022-2623, 1520-4804. — doi:10.1021/jm0608356.
  15. Alexander Sebastian Hauser, Björn Windshügel. LEADS-PEP: A Benchmark Data Set for Assessment of Peptide Docking Performance // Journal of Chemical Information and Modeling. — 2016-01-11. — Т. 56, вып. 1. — С. 188–200. — ISSN 1549-960X 1549-9596, 1549-960X. — doi:10.1021/acs.jcim.5b00234.
  16. C. Levinthal, S. J. Wodak, P. Kahn, A. K. Dadivanian. Hemoglobin interaction in sickle cell fibers. I: Theoretical approaches to the molecular contacts. // Proceedings of the National Academy of Sciences. — 1975-04-01. — Т. 72, вып. 4. — С. 1330–1334. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.72.4.1330.
  17. Shoshana J. Wodak, Joël Janin. Computer analysis of protein-protein interaction // Journal of Molecular Biology. — 1978-09. — Т. 124, вып. 2. — С. 323–342. — ISSN 0022-2836. — doi:10.1016/0022-2836(78)90302-9.
  18. E. Katchalski-Katzir, I. Shariv, M. Eisenstein, A. A. Friesem, C. Aflalo. Molecular surface recognition: determination of geometric fit between proteins and their ligands by correlation techniques. // Proceedings of the National Academy of Sciences. — 1992-03-15. — Т. 89, вып. 6. — С. 2195–2199. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.89.6.2195.
  19. N.C.J. Strynadka, M. Eisenstein, E. Katchalski-Katzir, B.K. Shoichet, I.D. Kuntz. Molecular docking programs successfully predict the binding of a β-lactamase inhibitory protein to TEM-1 β-lactamase // Nature Structural Biology. — 1996-03. — Т. 3, вып. 3. — С. 233–239. — ISSN 1072-8368. — doi:10.1038/nsb0396-233.
  20. 1 2 Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D (2003). "Protein–protein docking with simultaneous optimization of rigid-body displacement and side-chain conformations". J. Mol. Biol. 331 (1): 281—299. doi:10.1016/S0022-2836(03)00670-3. PMID 12875852.
  21. Camacho CJ, Vajda S (2008). "Protein docking along smooth association pathways". Proceedings of the National Academy of Sciences. 98 (19): 10636—10641. doi:10.1073/pnas.181147798. PMC 58518. PMID 11517309.
  22. Camacho CJ, Vajda S (2007). "In silico screening of mutational effects on enzyme-proteic inhibitor affinity: a docking-based approach". BMC Structural Biology. 7: 37. doi:10.1186/1472-6807-7-37. PMC 1913526. PMID 17559675.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  23. Zhang C, Liu S, Zhu Q, Zhou Y (2005). "A knowledge-based energy function for protein–ligand, protein–protein, and protein–DNA complexes". Journal of Medicinal Chemistry. 48 (7): 2325—2335. doi:10.1021/jm049314d. PMID 15801826.
  24. Esmaielbeiki R, Nebel JC (2014). "Scoring docking conformations using predicted protein interfaces". BMC Bioinformatics. 15: 171. doi:10.1186/1471-2105-15-171. PMC 4057934. PMID 24906633.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  25. 1 2 Kastritis PL, Bonvin AM (May 2010). "Are scoring functions in protein–protein docking ready to predict interactomes? Clues from a novel binding affinity benchmark". J. Proteome Res. 9 (5): 2216—2225. doi:10.1021/pr9009854. hdl:1874/202590. PMID 20329755.
  26. Rosato A, Fuentes G, Verma C (2010). "Faculty of 1000 Biology: evaluations for Kastritis PL & Bonvin AM J Proteome Res 2010 May 7 9 (5) :2216-25". Faculty of 1000 Biology. 9 (5): 2216—2225. doi:10.1021/pr9009854. hdl:1874/202590. PMID 20329755.
  27. Badal, VD, Kundrotas, PJ, Vakser, IA (2018). "Natural language processing in text mining for structural modeling of protein complexes". BMC Bioinformatics. 19 (1): 84. doi:10.1186/s12859-018-2079-4. PMC 5838950. PMID 29506465.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  28. Mintseris J, Wiehe K, Pierce B, Anderson R, Chen R, Janin J, Weng Z (2005). "Protein-Protein Docking Benchmark 2.0: an update". Proteins. 60 (2): 214—216. doi:10.1002/prot.20560. PMID 15981264.
  29. Vreven T, Moal IH, Vangone A, Pierce BG, Kastritis PL, Torchala M, Chaleil R, Jiménez-García B, Bates PA, Fernandez-Recio J, Bonvin AM, Weng Z (September 2015). "Updates to the Integrated Protein-Protein Interaction Benchmarks: Docking Benchmark Version 5 and Affinity Benchmark Version 2". Journal of Molecular Biology. 427 (19): 3031—41. doi:10.1016/j.jmb.2015.07.016. PMC 4677049. PMID 26231283.
  30. van Dijk M, Bonvin AM (August 2008). "A protein-DNA docking benchmark". Nucleic Acids Research. 36 (14): e88. doi:10.1093/nar/gkn386. PMC 2504314. PMID 18583363.
  31. Nithin C, Mukherjee S, Bahadur RP (November 2016). "A non-redundant protein-RNA docking benchmark version 2.0". Proteins. 85 (2): 256—267. doi:10.1002/prot.25211. PMID 27862282.
  32. Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz; Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz M. (2018-08-25). "Bioinformatics Tools and Benchmarks for Computational Docking and 3D Structure Prediction of RNA-Protein Complexes". Genes (англ.). 9 (9): 432. doi:10.3390/genes9090432. PMC 6162694. PMID 30149645.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  33. 1 2 Kastritis PL, Moal IH, Hwang H, Weng Z, Bates PA, Bonvin AM, Janin J (March 2011). "A structure-based benchmark for protein-protein binding affinity". Protein Science. 20 (3): 482—491. doi:10.1002/pro.580. PMC 3064828. PMID 21213247.
  34. Janin J, Henrick K, Moult J, Eyck LT, Sternberg MJ, Vajda S, Vakser I, Wodak SJ (2003). "CAPRI: a Critical Assessment of PRedicted Interactions". Proteins. 52 (1): 2—9. CiteSeerX 10.1.1.461.3355. doi:10.1002/prot.10381. PMID 12784359.