Макромолекулярный докинг: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
Строка 1: Строка 1:
== "Твердотельный" докинг и "гибкий" докинг ==
Макромолекулярный докинг — это метод [[Молекулярное моделирование|молекулярного моделирования]] четвертичной структуры комплексов, образованных двумя или более взаимодействующими биологическими макромолекулами. Чаще всего исследуются белок-белковые комплексы, реже — белок-нуклеиновые.
"Твердотельным" называется докинг, при котором длины связей, углы и торсионные углы партнеров докинга остаются неизменными в процессе симуляции. Вопрос о том, является ли "Твердотельное" приближени приемлимым для большинства случаев остается пока дискуссионным. Когда происходит существенное конформационное изменение партнеров докинга во время образование комплекса, "твердотельное" приближение однозначно неприменимо. Однако подсчет всех возможных конформационных изменений на данном уровне развития компьютеров заняло бы астрономическое время. Поэтому процедуры докинга, которые допускают конформационные изменения, или процедуры «гибкой стыковки», рационально выбирать небольшое подмножество возможных конформационных изменений для проведения симуляций.


== Методы ==
Конечной целью докинга является предсказание трехмерной структуры изучаемого макромолекулярного комплекса в естественной среде. Результатом докинга является набор моделей комплекса (структур). Они могут быть ранжированы различными методами, такими как оценочная (скоровая) функция для отбора наиболее правдоподобных (с большей долей вероятности встречающихся в организме).
Успешный докинг требует выполнения двух условий:
* Создание набора конформаций, который надежно включает, по крайней мере, хотя бы одну "достоверную".
* Надежно отличает "достоверные" конформаций от других.


Для многих случаях, к примеру для [[антитело | антител]] и [[конкурентных ингибиторов]] сайт связывания известен. В других случаях сайт связывания может быть определен по данным мутагенеза или [[филогенией | филогении]]. Конфигурации, в которых атомы белков перекрываются (т.н. клеш, clash) всегда исключаются.
Термин "докинг" или "стыковка" появился в конце 1970х в значении моделирования стыковки двух молекул, при котором ореинтация последних не менялась (менялось только положение). С увеличением компьютерных мощностей стало возможно разрешить изменение ореинтации партнеров, такой вариант докинга называется "rigid docking" или докинг жестких тел ("rigid body"). Следующим шагом стал переход к "гибкому докингу" ("flexible docking"), при котором изменяется внутренняя геометрия (конформация) партнеров.


После отсеивания комплексов с клешами, измеряется энергия каждой структуры (модели комплекса) т.н. скоровой (оценочной) функцией. Последняя должна различить "достоверную" структуру выше как минимум 100 000 альтернатив. Это сложная вычислительная задача, поэтому было разработано множество методов ее решения. Алгоритмы можно разделить на [[Детерминированный алгоритм|детерминированные]] и [[Стохастичность|стохастические]].
<br />

=== Переход в обратное пространство ===

Каждый из белков может быть представлен в виде простой кубической решетки. Для моделей комплекса, переводимых друг в друга путем изменения положения белка может быть практически мгновенно вычислена некая оценочная функция применением теоремы о свертке. Можно построить осмысленные, хотя и приблизительные, "сверточные" скоринговые функции, учитывающие как стереохимические, так и электростатические взаимодействия.

Методы обратного пространства широко использовались благодаря их способности оценивать огромное количество структур. Они теряют преимущество в скорости, если имеют место торсионные изменения. Другой недостаток заключается в том, что невозможно эффективно использовать накопленные знания. Остается также вопрос, не являются ли этот метод достаточно точным для надежного выявления структуры лучшего комплекса.

=== Методы Монте-Карло ===

В [[Метод Монте-Карло | методах типа Монте-Карло]] исходная конфигурация уточняется путем принятия или отвергания шагов (итеративных изменений некого набора параметров), в зависимости от значения оценочной функции (т.е. скора структуры) (см. [[Метрополис-Гастингс алгоритм | Критерий Метрополиса]]), пока не будет предпринято определенное количество шагов. Предполагается, что сходимость к наилучшей структуре будет происходить из большого класса начальных, только одну из которых необходимо учитывать. Исходные структуры могут быть гораздо быстрее семплированы "грубыми" (coarsed) методами. Трудно найти скоровую функцию, которая бы одновременно хорошо отличала "хорошую" структуру и сходилась ней с большого расстояния (в семплируемом пространстве). Поэтому было предложено использование двух уровней приближения ("грубое" и "точное") с различными функциями оценки. <ref name="pmid12875852">{{cite journal |vauthors=Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D | title = Protein–protein docking with simultaneous optimization of rigid-body displacement and side-chain conformations | journal = J. Mol. Biol. | volume = 331 | issue = 1 | pages = 281–299 | year = 2003 | pmid = 12875852 | doi = 10.1016/S0022-2836(03)00670-3 }}</ref> Вращение может быть введено в Монте-Карло как дополнительный параметр для шага.

Методы Монте-Карло являются стохастическим и не гарантируют исчерпывающий поиск, следовательно лучшая конфигурация может быть пропущена даже при использовании оценочной функции, которая в теории ее отличает. Насколько серьезно влияет эта проблема на результаты докинга пока точно не установлено.

== Оценка (скоринг) ==

===Оценочные функции (скоринг-функции) ===
Для поиска скора (некоторого показателя), позволяющего отличить лучшие модели была разработана специальная тестовая выборка (Benchmark, см. Ниже) белок-белковых структур. Скоры оцениваются по рангу, который они присваивают наилучшей структуре (в идеале ранжирование по скору должно вывести "экспериментально" лучшую структуру на первое место), и по их покрытию (доля контрольных случаев, для которых они достигают приемлемого результата).
Скоры разделяют на несколько категорий, включающих:
* [[эвристические]] скор-функции, основанные на экспериментальных данных о контактах аминокислотных остатков.
* Комплиментарность формы молекулярных поверхностей взаимодействующих партнеров.
* Свободные энергии, оцененные с использованием параметров из [[молекулярно механических]] [[Силовое поле (химия) | силовых полей]], таких как [[CHARMM]] или [[AMBER]].
* Филогенетические подтверждение взаимодействующих областей.
* Коэффициенты кластеризации.

Обычно гибридные оценки (собственно скор-функции) создаются путем объединения одной или нескольких вышеупомянутых категорий (далее "термы" скор-функции) в взвешенную сумму, веса которой оптимизируются используя тестовые выборки (т.н. Бенчмарки). Чтобы избежать статистических искажений (biases) тестовые модели, используемые для оптимизации весов, не должны пересекаться с тестовыми моделями, используемыми для финальной проверки гибридной оценки.

В задаче белок-белкового докинга важно найти скоровую функцию, достоверно отражающую информацию об аффинности партнеров. Такая функция значительно ускорила бы развитие in silico [[Белковая инженерия|белковой инженерии]], разработку лекарств а также высокопроизводительную аннотацию интерактома (т.е. какие белки связываются, а какие нет).
Для оценки аффинности связывания / свободной энергии было предложено много оценочных функций. <ref name="pmid12875852" /><ref name="pmid11517309">{{cite journal | doi = 10.1073/pnas.181147798 |vauthors=Camacho CJ, Vajda S | title = Protein docking along smooth association pathways | journal = Proceedings of the National Academy of Sciences | volume = 98 | issue = 19 | pages = 10636–10641 | year = 2008 | pmid = 11517309 | pmc = 58518 }}</ref> <ref name="pmid17559675">{{cite journal | doi = 10.1186/1472-6807-7-37 |vauthors=Camacho CJ, Vajda S | title = In silico screening of mutational effects on enzyme-proteic inhibitor affinity: a docking-based approach | journal = BMC Structural Biology | volume = 7 | pages = 37 | year = 2007 | pmid = 17559675 | pmc = 1913526 }}</ref> <ref name="pmid15801826">{{cite journal |vauthors=Zhang C, Liu S, Zhu Q, Zhou Y | title = A knowledge-based energy function for protein–ligand, protein–protein, and protein–DNA complexes | journal = Journal of Medicinal Chemistry | volume = 48 | issue = 7 | pages = 2325–2335 | year = 2005 | pmid = 15801826 | doi = 10.1021/jm049314d }}</ref> <ref>{{cite journal|vauthors=Esmaielbeiki R, Nebel JC |year=2014|title=Scoring docking conformations using predicted protein interfaces|journal=BMC Bioinformatics|volume=15|page=171|doi= 10.1186/1471-2105-15-171|pmid=24906633|pmc=4057934}}</ref> Однако корреляция между экспериментально установленным сродством связывания и предсказаниями девяти популярных скор-функций окозалась почти [[ортогональной]] (R <sup> 2 </ sup> ~ 0). <ref name="pmid20329755"/><ref name="evaluation">{{cite journal |vauthors=Rosato A, Fuentes G, Verma C | title = Faculty of 1000 Biology: evaluations for Kastritis PL & Bonvin AM J Proteome Res 2010 May 7 9 (5) :2216-25 | journal = Faculty of 1000 Biology | volume = 9 | issue = 5 | pages = 2216–2225 | year = 2010 | url = http://f1000biology.com/article/id/3437978/evaluation | doi = 10.1021/pr9009854 | pmid = 20329755 | hdl = 1874/202590 }}</ref> Было также замечено, что некоторые термы лучше коррелируют с экспериментальными энергиями связи, чем полная оценка, что позволяет предположить, что можно найти улучшить скор-функцию, пересмотрев веса её компонетнтов (термов).
Среди экспериментальных методов определения аффинности связывания выделяют [[поверхностный плазмонный резонанс]] (SPR), [[передачу энергии резонанса Фёрстера]], методы с применением радиолигандов, [[калориметрия изотермического титрования]] (ITC), [[микроскопический термофорез]] (MST) или спектроскопические измерения и другие методы флуоресценции. Информация из научных статей также может служить хорошим источником для улучшения скоринга. <ref name="pmid29506465">{{cite journal|doi= 10.1186/s12859-018-2079-4|vauthors= Badal, VD, Kundrotas, PJ, Vakser, IA | title = Natural language processing in text mining for structural modeling of protein complexes|journal = BMC Bioinformatics |volume= 19 |issue= 1 |pages= 84 |year=2018|pmid = 29506465 |pmc= 5838950 }}</ref>

=== Тестовые выборки (Бенчмарки) ===
Для тестирования методов докинга была сделана тестовая выборка (Бенчмарк) из 84 структур белок-белковых комплексов.<ref name="pmid15981264">{{cite journal |vauthors=Mintseris J, Wiehe K, Pierce B, Anderson R, Chen R, Janin J, Weng Z | title = Protein-Protein Docking Benchmark 2.0: an update | journal = Proteins | volume = 60 | issue = 2 | pages = 214–216 | year = 2005 | pmid = 15981264 | doi = 10.1002/prot.20560 }}</ref> Структуры в тестовой выборке специально подобраны так, что охватывают широкий спектр типов взаимодействий, и максимально разнородны (содержат как можно меньше повторяющихся особенностей, таких как профили семейств партнеров в базе данных [[Структурная классификация белков | SCOP]]). Тестовые элементы подразделяются на три уровня сложности (самый сложный содержит наибольшее изменение конформации остова). Примерами тестовых моделей для белок-белкового докинга могут служить структуры фермент-ингибитор, антиген-антитело и гомомультимерные комплексы.

Новейшая версия бенчмарка для белок-белкового докинга состоит из 230 комплексов, <ref>{{cite journal | vauthors = Vreven T, Moal IH, Vangone A, Pierce BG, Kastritis PL, Torchala M, Chaleil R, Jiménez-García B, Bates PA, Fernandez-Recio J, Bonvin AM, Weng Z | title = Updates to the Integrated Protein-Protein Interaction Benchmarks: Docking Benchmark Version 5 and Affinity Benchmark Version 2 | journal = Journal of Molecular Biology | volume = 427 | issue = 19 | pages = 3031–41 | date = September 2015 | pmid = 26231283 | pmc = 4677049 | doi = 10.1016/j.jmb.2015.07.016 }}</ref> а для днк-белкового — из 47. <ref>{{cite journal | vauthors = van Dijk M, Bonvin AM | title = A protein-DNA docking benchmark | journal = Nucleic Acids Research | volume = 36 | issue = 14 | pages = e88 | date = August 2008 | pmid = 18583363 | pmc = 2504314 | doi = 10.1093/nar/gkn386 }}</ref> Новейшая тестовая выборка на РНК-белковый докинг включает 126 элементов. <ref>{{cite journal | vauthors = Nithin C, Mukherjee S, Bahadur RP | title = A non-redundant protein-RNA docking benchmark version 2.0 | journal = Proteins | pages = 256–267 | date = November 2016 | pmid = 27862282 | doi = 10.1002/prot.25211 | volume=85| issue = 2 }}</ref> Существуют объединенные тестовые выборки, насчитывающие 209 комплексов. <ref>{{Cite journal|last=Nithin|first=Chandran|last2=Ghosh|first2=Pritha|last3=Bujnicki|first3=Janusz|last4=Nithin|first4=Chandran|last5=Ghosh|first5=Pritha|last6=Bujnicki|first6=Janusz M.|date=2018-08-25|title=Bioinformatics Tools and Benchmarks for Computational Docking and 3D Structure Prediction of RNA-Protein Complexes|journal=Genes|language=en|volume=9|issue=9|pages=432|doi=10.3390/genes9090432|pmid=30149645|pmc=6162694}}</ref>

Тестовая выборка для оценки [[аффинности]] была основана на тестовой выбоке для белок-белкового докинга. <ref name="pmid20329755">{{cite journal |vauthors=Kastritis PL, Bonvin AM | title = Are scoring functions in protein–protein docking ready to predict interactomes? Clues from a novel binding affinity benchmark | journal = J. Proteome Res. | volume = 9 | issue = 5 | pages = 2216–2225 |date=May 2010 | pmid = 20329755 | doi = 10.1021/pr9009854 | issn = | hdl = 1874/202590 }}</ref> В неё были включены 81 белок-белковых комплекса с экспериментально измеренной аффинностью. Эти комплексы охватывают 11 порядков по значению аффинности.

Эта выборка была в дальнейшем подвергнута экспертной оценке и значительно расширена. <ref name="pmid21213247">{{cite journal |vauthors=Kastritis PL, Moal IH, Hwang H, Weng Z, Bates PA, Bonvin AM, Janin J | title = A structure-based benchmark for protein-protein binding affinity | journal = Protein Science | volume = 20 | issue = 3 | pages = 482–491 |date=March 2011 | pmid = 21213247 | doi = 10.1002/pro.580 | url = | issn = | pmc = 3064828 }}</ref> Новая тестовая выборка включает белки, с различными биологическими функциями. В её состав входят G-белки и внеклеточные домены рецепторов, а также комплексы антиген / антитело, фермент / ингибитор и фермент / субстрат. Она также разнообразна с точки зрения аффинности партнеров друг к другу, с K <sub> d </ sub> в диапазоне от 10 <sup> −5 </ sup> до 10 <sup> −14 </ sup> M. Девять элементов представляют собой близкородственные комплексы, которые имеют сходную структуру, но очень различную аффинность. Поскольку известны структуры компонентов комплекса по отдельности, можно оценить изменения конформации партнеров при его образовании. В большинстве комплексов они весьма значительны. Данная тестовая выбока может применяться и для биофизических моделей, направленных на установление связи аффинности со структурой в белок-белковых взаимодействиях, учитывая данные о реагентах и их конформационных изменениях, а не только о продукте (комплексе). <Ref name = "pmid21213247" />

=== CAPRI ===
CAPRI (англ. Critical Assessment of PRediction of Interactions, критическая оценка предсказания взаимодействий) <ref name="pmid12784359">{{cite journal |vauthors=Janin J, Henrick K, Moult J, Eyck LT, Sternberg MJ, Vajda S, Vakser I, Wodak SJ | title = CAPRI: a Critical Assessment of PRedicted Interactions | journal = Proteins | volume = 52 | issue = 1 | pages = 2–9 | year = 2003 | pmid = 12784359 | doi = 10.1002/prot.10381 | citeseerx = 10.1.1.461.3355 }}</ref> - это регулярно проводимые мероприятия, в ходе которых исследователям по всему миру предлагается получить структуру белок белкового комплекса если даны только структуры реагентов методом докинга. Мероприятия (раунды) проходят примерно каждые 6 месяцев. Во время каждого тура участником даются структуры реагентов комплекса, структура которого была недавно определена экспериментально. Координаты комплекса хранятся в тайне. Оценка CAPRI является двойным-слепым методом, т.к. участники не знают структуры комплекса, а организаторы не знают кто из участников предложил конкретную модель комплекса.

В настоящее время CAPRI обретает популярность (37 групп приняли участие во всем мире в седьмом раунде). Не смотря на то, что результаты CAPRI имеют небольшое статистическое значение из-за небольшого количества целей в каждом раунде, роль CAPRI является весьма значительной. Оценка [[CASP]] является аналогичным упражнением в области предсказания структуры белка.


== Введение ==
== Введение ==

Версия от 19:21, 22 апреля 2019

"Твердотельный" докинг и "гибкий" докинг

"Твердотельным" называется докинг, при котором длины связей, углы и торсионные углы партнеров докинга остаются неизменными в процессе симуляции. Вопрос о том, является ли "Твердотельное" приближени приемлимым для большинства случаев остается пока дискуссионным. Когда происходит существенное конформационное изменение партнеров докинга во время образование комплекса, "твердотельное" приближение однозначно неприменимо. Однако подсчет всех возможных конформационных изменений на данном уровне развития компьютеров заняло бы астрономическое время. Поэтому процедуры докинга, которые допускают конформационные изменения, или процедуры «гибкой стыковки», рационально выбирать небольшое подмножество возможных конформационных изменений для проведения симуляций.

Методы

Успешный докинг требует выполнения двух условий:

  • Создание набора конформаций, который надежно включает, по крайней мере, хотя бы одну "достоверную".
  • Надежно отличает "достоверные" конформаций от других.

Для многих случаях, к примеру для антител и конкурентных ингибиторов сайт связывания известен. В других случаях сайт связывания может быть определен по данным мутагенеза или филогении. Конфигурации, в которых атомы белков перекрываются (т.н. клеш, clash) всегда исключаются.

После отсеивания комплексов с клешами, измеряется энергия каждой структуры (модели комплекса) т.н. скоровой (оценочной) функцией. Последняя должна различить "достоверную" структуру выше как минимум 100 000 альтернатив. Это сложная вычислительная задача, поэтому было разработано множество методов ее решения. Алгоритмы можно разделить на детерминированные и стохастические.

Переход в обратное пространство

Каждый из белков может быть представлен в виде простой кубической решетки. Для моделей комплекса, переводимых друг в друга путем изменения положения белка может быть практически мгновенно вычислена некая оценочная функция применением теоремы о свертке. Можно построить осмысленные, хотя и приблизительные, "сверточные" скоринговые функции, учитывающие как стереохимические, так и электростатические взаимодействия.

Методы обратного пространства широко использовались благодаря их способности оценивать огромное количество структур. Они теряют преимущество в скорости, если имеют место торсионные изменения. Другой недостаток заключается в том, что невозможно эффективно использовать накопленные знания. Остается также вопрос, не являются ли этот метод достаточно точным для надежного выявления структуры лучшего комплекса.

Методы Монте-Карло

В методах типа Монте-Карло исходная конфигурация уточняется путем принятия или отвергания шагов (итеративных изменений некого набора параметров), в зависимости от значения оценочной функции (т.е. скора структуры) (см. Критерий Метрополиса), пока не будет предпринято определенное количество шагов. Предполагается, что сходимость к наилучшей структуре будет происходить из большого класса начальных, только одну из которых необходимо учитывать. Исходные структуры могут быть гораздо быстрее семплированы "грубыми" (coarsed) методами. Трудно найти скоровую функцию, которая бы одновременно хорошо отличала "хорошую" структуру и сходилась ней с большого расстояния (в семплируемом пространстве). Поэтому было предложено использование двух уровней приближения ("грубое" и "точное") с различными функциями оценки. [1] Вращение может быть введено в Монте-Карло как дополнительный параметр для шага.

Методы Монте-Карло являются стохастическим и не гарантируют исчерпывающий поиск, следовательно лучшая конфигурация может быть пропущена даже при использовании оценочной функции, которая в теории ее отличает. Насколько серьезно влияет эта проблема на результаты докинга пока точно не установлено.

Оценка (скоринг)

Оценочные функции (скоринг-функции)

Для поиска скора (некоторого показателя), позволяющего отличить лучшие модели была разработана специальная тестовая выборка (Benchmark, см. Ниже) белок-белковых структур. Скоры оцениваются по рангу, который они присваивают наилучшей структуре (в идеале ранжирование по скору должно вывести "экспериментально" лучшую структуру на первое место), и по их покрытию (доля контрольных случаев, для которых они достигают приемлемого результата). Скоры разделяют на несколько категорий, включающих:

  • эвристические скор-функции, основанные на экспериментальных данных о контактах аминокислотных остатков.
  • Комплиментарность формы молекулярных поверхностей взаимодействующих партнеров.
  • Свободные энергии, оцененные с использованием параметров из молекулярно механических силовых полей, таких как CHARMM или AMBER.
  • Филогенетические подтверждение взаимодействующих областей.
  • Коэффициенты кластеризации.

Обычно гибридные оценки (собственно скор-функции) создаются путем объединения одной или нескольких вышеупомянутых категорий (далее "термы" скор-функции) в взвешенную сумму, веса которой оптимизируются используя тестовые выборки (т.н. Бенчмарки). Чтобы избежать статистических искажений (biases) тестовые модели, используемые для оптимизации весов, не должны пересекаться с тестовыми моделями, используемыми для финальной проверки гибридной оценки.

В задаче белок-белкового докинга важно найти скоровую функцию, достоверно отражающую информацию об аффинности партнеров. Такая функция значительно ускорила бы развитие in silico белковой инженерии, разработку лекарств а также высокопроизводительную аннотацию интерактома (т.е. какие белки связываются, а какие нет). Для оценки аффинности связывания / свободной энергии было предложено много оценочных функций. [1][2] [3] [4] [5] Однако корреляция между экспериментально установленным сродством связывания и предсказаниями девяти популярных скор-функций окозалась почти ортогональной (R 2 </ sup> ~ 0). [6][7] Было также замечено, что некоторые термы лучше коррелируют с экспериментальными энергиями связи, чем полная оценка, что позволяет предположить, что можно найти улучшить скор-функцию, пересмотрев веса её компонетнтов (термов). Среди экспериментальных методов определения аффинности связывания выделяют поверхностный плазмонный резонанс (SPR), передачу энергии резонанса Фёрстера, методы с применением радиолигандов, калориметрия изотермического титрования (ITC), микроскопический термофорез (MST) или спектроскопические измерения и другие методы флуоресценции. Информация из научных статей также может служить хорошим источником для улучшения скоринга. [8]

Тестовые выборки (Бенчмарки)

Для тестирования методов докинга была сделана тестовая выборка (Бенчмарк) из 84 структур белок-белковых комплексов.[9] Структуры в тестовой выборке специально подобраны так, что охватывают широкий спектр типов взаимодействий, и максимально разнородны (содержат как можно меньше повторяющихся особенностей, таких как профили семейств партнеров в базе данных SCOP). Тестовые элементы подразделяются на три уровня сложности (самый сложный содержит наибольшее изменение конформации остова). Примерами тестовых моделей для белок-белкового докинга могут служить структуры фермент-ингибитор, антиген-антитело и гомомультимерные комплексы.

Новейшая версия бенчмарка для белок-белкового докинга состоит из 230 комплексов, [10] а для днк-белкового — из 47. [11] Новейшая тестовая выборка на РНК-белковый докинг включает 126 элементов. [12] Существуют объединенные тестовые выборки, насчитывающие 209 комплексов. [13]

Тестовая выборка для оценки аффинности была основана на тестовой выбоке для белок-белкового докинга. [6] В неё были включены 81 белок-белковых комплекса с экспериментально измеренной аффинностью. Эти комплексы охватывают 11 порядков по значению аффинности.

Эта выборка была в дальнейшем подвергнута экспертной оценке и значительно расширена. [14] Новая тестовая выборка включает белки, с различными биологическими функциями. В её состав входят G-белки и внеклеточные домены рецепторов, а также комплексы антиген / антитело, фермент / ингибитор и фермент / субстрат. Она также разнообразна с точки зрения аффинности партнеров друг к другу, с K d </ sub> в диапазоне от 10 −5 </ sup> до 10 −14 </ sup> M. Девять элементов представляют собой близкородственные комплексы, которые имеют сходную структуру, но очень различную аффинность. Поскольку известны структуры компонентов комплекса по отдельности, можно оценить изменения конформации партнеров при его образовании. В большинстве комплексов они весьма значительны. Данная тестовая выбока может применяться и для биофизических моделей, направленных на установление связи аффинности со структурой в белок-белковых взаимодействиях, учитывая данные о реагентах и их конформационных изменениях, а не только о продукте (комплексе). [14]

CAPRI

CAPRI (англ. Critical Assessment of PRediction of Interactions, критическая оценка предсказания взаимодействий) [15] - это регулярно проводимые мероприятия, в ходе которых исследователям по всему миру предлагается получить структуру белок белкового комплекса если даны только структуры реагентов методом докинга. Мероприятия (раунды) проходят примерно каждые 6 месяцев. Во время каждого тура участником даются структуры реагентов комплекса, структура которого была недавно определена экспериментально. Координаты комплекса хранятся в тайне. Оценка CAPRI является двойным-слепым методом, т.к. участники не знают структуры комплекса, а организаторы не знают кто из участников предложил конкретную модель комплекса.

В настоящее время CAPRI обретает популярность (37 групп приняли участие во всем мире в седьмом раунде). Не смотря на то, что результаты CAPRI имеют небольшое статистическое значение из-за небольшого количества целей в каждом раунде, роль CAPRI является весьма значительной. Оценка CASP является аналогичным упражнением в области предсказания структуры белка.

Введение

Биологические роли большинства белков, описываемые тем, с какими молекулами они могут взаимодействовать известны в лучшем случае по меньшей мере неполностью. Даже белки, участвующие в хорошо изученных биологических процессах (напр. ЦТК) могут иметь неожиданных интерактантов или новые биологические функции.

В случае белок-белковых взаимодействий возникают дополнительные вопросы. Считается, что генетические заболевания (напр. Муковисцидоз) вызываются неправильно свернутыми (мутированными) белками и возникает желание понять какие анамальные белок-белковые взаимодействия могут быть вызваны той или иной мутацией. Если в будущем появится возможность дизайна белков для проведения биологических функций, важно будет определить круг их возможных взаимодействий.

Для некоторого набора белков может решаться следующий спектр задач:

  • Связываются ли белки in vivo?

Если связываются,

  • Какую конформацию имеет белок в связанном состоянии?
  • Насколько сильным можно считать их взаимодействие?

Если не связываются,

  • Можно ли получить связывание путем внедрение мутаций в белки?

Для решения этих проблем может применяться белок-белковый докинг.

Более того докинг может помочь в исследовании белков с неизвестной функцией (относительно мало изученная сфера). Если нет модели пространственной структуры, ее можно моделировать (см. предсказание структуры белка).

Белок-нуклеиновые взаимодействия играют важную роль в живой клетке. Транскрипционные факторы регулируют экспрессию генов, а полимеразы, которые осуществляют репликацию суть белковые комплексы, а генетический материал, с которым они связываются состоят из нуклеиновых кислот. Моделирование белок-нуклеиновых взаимодействий имеет некоторые сложности, описанные далее.

История

В 1970-х годах сложное моделирование заключалось в ручной идентификации элементов на поверхностях интерактантов (партнеров) и интерпретации последствий для связывания, функции и активности; любые компьютерные программы обычно использовались в конце процесса моделирования чтобы различать относительно немногочисленные конфигурации, которые остались после того, как были наложены все эвристические ограничения. Впервые компьютеры были использованы в исследовании взаимодействия гемоглобина в серповидно-клеточных волокнах.[16] Затем в 1978 году появилась работа с комплексом трипсин-БПТИ. [17] Компьютеры использовались для отличия "плохих" и "хороших" моделей, посредством оценочной функции. "Вознаграждалась" большая площадь интерфейса (поверхность связывания), а за перекрывающиеся участки накладывались штрафы. Компьютер использовал упрощенное представление взаимодействующих белков: каждый остаток представлялся в виде одного центра связывания. Электростатические взаимодействия, такие как водородные связи, анализировались вручную.

К началу 1990-х годов было определено больше структур комплексов, тогда как доступные вычислительные мощности значительно возросли. С появлением биоинформатики основное внимание уделялось разработке методов, применимых к произвольным интерактантам при приемлемых вычислительных затратах и в отсутствие дополнительных филогенетических или экспериментальных данных.

В 1992 году был опубликован метод[18], в котором использовалось быстрое преобразование Фурье. В этом методе имело место "грубое" представление партнеров докинга: в виде трехмерных матриц, числа в которх соответствовали положениям атомов. Быстрое преобразование Фурье помогало находить расположение этих матриц, соответсвующее контакту партнеров гораздо быстрее других методов докинга. В 1997 в этот метод стал учитывать электростатические взаимодействия.

В 1996 году были опубликованы результаты первого исследования[19], в котором шесть исследовательских групп пытались предсказать структуру комплекса бета-лактамазы TEM-1 с белком-ингибитором бета-лактамазы (BLIP). В исследовании была отмечена необходимость учета конформационных изменений и трудности различения конформеров.

"Твердотельный" докинг и "гибкий" докинг

Введение

Биологические роли большинства белков, описываемые тем, с какими молекулами они могут взаимодействовать известны в лучшем случае по меньшей мере неполностью. Даже белки, участвующие в хорошо изученных биологических процессах (напр. ЦТК) могут иметь неожиданных интерактантов или новые биологические функции.

В случае белок-белковых взаимодействий возникают дополнительные вопросы. Считается, что генетические заболевания (напр. Муковисцидоз) вызываются неправильно свернутыми (мутированными) белками и возникает желание понять какие анамальные белок-белковые взаимодействия могут быть вызваны той или иной мутацией. Если в будущем появится возможность дизайна белков для проведения биологических функций, важно будет определить круг их возможных взаимодействий.

Для некоторого набора белков может решаться следующий спектр задач:

  • Связываются ли белки in vivo?

Если связываются,

  • Какую конформацию имеет белок в связанном состоянии?
  • Насколько сильным можно считать их взаимодействие?

Если не связываются,

  • Можно ли получить связывание путем внедрение мутаций в белки?

Для решения этих проблем может применяться белок-белковый докинг.

Более того докинг может помочь в исследовании белков с неизвестной функцией (относительно мало изученная сфера). Если нет модели пространственной структуры, ее можно моделировать (см. предсказание структуры белка).

Белок-нуклеиновые взаимодействия играют важную роль в живой клетке. Транскрипционные факторы регулируют экспрессию генов, а полимеразы, которые осуществляют репликацию суть белковые комплексы, а генетический материал, с которым они связываются состоят из нуклеиновых кислот. Моделирование белок-нуклеиновых взаимодействий имеет некоторые сложности, описанные далее.

История

В 1970-х годах сложное моделирование заключалось в ручной идентификации элементов на поверхностях интерактантов (партнеров) и интерпретации последствий для связывания, функции и активности; любые компьютерные программы обычно использовались в конце процесса моделирования чтобы различать относительно немногочисленные конфигурации, которые остались после того, как были наложены все эвристические ограничения. Впервые компьютеры были использованы в исследовании взаимодействия гемоглобина в серповидно-клеточных волокнах.[20] Затем в 1978 году появилась работа с комплексом трипсин-БПТИ. [21] Компьютеры использовались для отличия "плохих" и "хороших" моделей, посредством оценочной функции. "Вознаграждалась" большая площадь интерфейса (поверхность связывания), а за перекрывающиеся участки накладывались штрафы. Компьютер использовал упрощенное представление взаимодействующих белков: каждый остаток представлялся в виде одного центра связывания. Электростатические взаимодействия, такие как водородные связи, анализировались вручную.

К началу 1990-х годов было определено больше структур комплексов, тогда как доступные вычислительные мощности значительно возросли. С появлением биоинформатики основное внимание уделялось разработке методов, применимых к произвольным интерактантам при приемлемых вычислительных затратах и в отсутствие дополнительных филогенетических или экспериментальных данных.

В 1992 году был опубликован метод[22], в котором использовалось быстрое преобразование Фурье. В этом методе имело место "грубое" представление партнеров докинга: в виде трехмерных матриц, числа в которх соответствовали положениям атомов. Быстрое преобразование Фурье помогало находить расположение этих матриц, соответсвующее контакту партнеров гораздо быстрее других методов докинга. В 1997 в этот метод стал учитывать электростатические взаимодействия.

В 1996 году были опубликованы результаты первого исследования[23], в котором шесть исследовательских групп пытались предсказать структуру комплекса бета-лактамазы TEM-1 с белком-ингибитором бета-лактамазы (BLIP). В исследовании была отмечена необходимость учета конформационных изменений и трудности различения конформеров.

"Твердотельный" докинг и "гибкий" докинг

  1. 1 2 Gray JJ, Moughon S, Wang C, Schueler-Furman O, Kuhlman B, Rohl CA, Baker D (2003). "Protein–protein docking with simultaneous optimization of rigid-body displacement and side-chain conformations". J. Mol. Biol. 331 (1): 281—299. doi:10.1016/S0022-2836(03)00670-3. PMID 12875852.
  2. Camacho CJ, Vajda S (2008). "Protein docking along smooth association pathways". Proceedings of the National Academy of Sciences. 98 (19): 10636—10641. doi:10.1073/pnas.181147798. PMC 58518. PMID 11517309.
  3. Camacho CJ, Vajda S (2007). "In silico screening of mutational effects on enzyme-proteic inhibitor affinity: a docking-based approach". BMC Structural Biology. 7: 37. doi:10.1186/1472-6807-7-37. PMC 1913526. PMID 17559675.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  4. Zhang C, Liu S, Zhu Q, Zhou Y (2005). "A knowledge-based energy function for protein–ligand, protein–protein, and protein–DNA complexes". Journal of Medicinal Chemistry. 48 (7): 2325—2335. doi:10.1021/jm049314d. PMID 15801826.
  5. Esmaielbeiki R, Nebel JC (2014). "Scoring docking conformations using predicted protein interfaces". BMC Bioinformatics. 15: 171. doi:10.1186/1471-2105-15-171. PMC 4057934. PMID 24906633.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  6. 1 2 Kastritis PL, Bonvin AM (May 2010). "Are scoring functions in protein–protein docking ready to predict interactomes? Clues from a novel binding affinity benchmark". J. Proteome Res. 9 (5): 2216—2225. doi:10.1021/pr9009854. hdl:1874/202590. PMID 20329755.
  7. Rosato A, Fuentes G, Verma C (2010). "Faculty of 1000 Biology: evaluations for Kastritis PL & Bonvin AM J Proteome Res 2010 May 7 9 (5) :2216-25". Faculty of 1000 Biology. 9 (5): 2216—2225. doi:10.1021/pr9009854. hdl:1874/202590. PMID 20329755.
  8. Badal, VD, Kundrotas, PJ, Vakser, IA (2018). "Natural language processing in text mining for structural modeling of protein complexes". BMC Bioinformatics. 19 (1): 84. doi:10.1186/s12859-018-2079-4. PMC 5838950. PMID 29506465.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  9. Mintseris J, Wiehe K, Pierce B, Anderson R, Chen R, Janin J, Weng Z (2005). "Protein-Protein Docking Benchmark 2.0: an update". Proteins. 60 (2): 214—216. doi:10.1002/prot.20560. PMID 15981264.
  10. Vreven T, Moal IH, Vangone A, Pierce BG, Kastritis PL, Torchala M, Chaleil R, Jiménez-García B, Bates PA, Fernandez-Recio J, Bonvin AM, Weng Z (September 2015). "Updates to the Integrated Protein-Protein Interaction Benchmarks: Docking Benchmark Version 5 and Affinity Benchmark Version 2". Journal of Molecular Biology. 427 (19): 3031—41. doi:10.1016/j.jmb.2015.07.016. PMC 4677049. PMID 26231283.
  11. van Dijk M, Bonvin AM (August 2008). "A protein-DNA docking benchmark". Nucleic Acids Research. 36 (14): e88. doi:10.1093/nar/gkn386. PMC 2504314. PMID 18583363.
  12. Nithin C, Mukherjee S, Bahadur RP (November 2016). "A non-redundant protein-RNA docking benchmark version 2.0". Proteins. 85 (2): 256—267. doi:10.1002/prot.25211. PMID 27862282.
  13. Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz; Nithin, Chandran; Ghosh, Pritha; Bujnicki, Janusz M. (2018-08-25). "Bioinformatics Tools and Benchmarks for Computational Docking and 3D Structure Prediction of RNA-Protein Complexes". Genes (англ.). 9 (9): 432. doi:10.3390/genes9090432. PMC 6162694. PMID 30149645.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  14. 1 2 Kastritis PL, Moal IH, Hwang H, Weng Z, Bates PA, Bonvin AM, Janin J (March 2011). "A structure-based benchmark for protein-protein binding affinity". Protein Science. 20 (3): 482—491. doi:10.1002/pro.580. PMC 3064828. PMID 21213247.
  15. Janin J, Henrick K, Moult J, Eyck LT, Sternberg MJ, Vajda S, Vakser I, Wodak SJ (2003). "CAPRI: a Critical Assessment of PRedicted Interactions". Proteins. 52 (1): 2—9. CiteSeerX 10.1.1.461.3355. doi:10.1002/prot.10381. PMID 12784359.
  16. C. Levinthal, S. J. Wodak, P. Kahn, A. K. Dadivanian. Hemoglobin interaction in sickle cell fibers. I: Theoretical approaches to the molecular contacts. // Proceedings of the National Academy of Sciences. — 1975-04-01. — Т. 72, вып. 4. — С. 1330–1334. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.72.4.1330.
  17. Shoshana J. Wodak, Joël Janin. Computer analysis of protein-protein interaction // Journal of Molecular Biology. — 1978-09. — Т. 124, вып. 2. — С. 323–342. — ISSN 0022-2836. — doi:10.1016/0022-2836(78)90302-9.
  18. E. Katchalski-Katzir, I. Shariv, M. Eisenstein, A. A. Friesem, C. Aflalo. Molecular surface recognition: determination of geometric fit between proteins and their ligands by correlation techniques. // Proceedings of the National Academy of Sciences. — 1992-03-15. — Т. 89, вып. 6. — С. 2195–2199. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.89.6.2195.
  19. N.C.J. Strynadka, M. Eisenstein, E. Katchalski-Katzir, B.K. Shoichet, I.D. Kuntz. Molecular docking programs successfully predict the binding of a β-lactamase inhibitory protein to TEM-1 β-lactamase // Nature Structural Biology. — 1996-03. — Т. 3, вып. 3. — С. 233–239. — ISSN 1072-8368. — doi:10.1038/nsb0396-233.
  20. C. Levinthal, S. J. Wodak, P. Kahn, A. K. Dadivanian. Hemoglobin interaction in sickle cell fibers. I: Theoretical approaches to the molecular contacts. // Proceedings of the National Academy of Sciences. — 1975-04-01. — Т. 72, вып. 4. — С. 1330–1334. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.72.4.1330.
  21. Shoshana J. Wodak, Joël Janin. Computer analysis of protein-protein interaction // Journal of Molecular Biology. — 1978-09. — Т. 124, вып. 2. — С. 323–342. — ISSN 0022-2836. — doi:10.1016/0022-2836(78)90302-9.
  22. E. Katchalski-Katzir, I. Shariv, M. Eisenstein, A. A. Friesem, C. Aflalo. Molecular surface recognition: determination of geometric fit between proteins and their ligands by correlation techniques. // Proceedings of the National Academy of Sciences. — 1992-03-15. — Т. 89, вып. 6. — С. 2195–2199. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.89.6.2195.
  23. N.C.J. Strynadka, M. Eisenstein, E. Katchalski-Katzir, B.K. Shoichet, I.D. Kuntz. Molecular docking programs successfully predict the binding of a β-lactamase inhibitory protein to TEM-1 β-lactamase // Nature Structural Biology. — 1996-03. — Т. 3, вып. 3. — С. 233–239. — ISSN 1072-8368. — doi:10.1038/nsb0396-233.