Интерактом: различия между версиями

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску
[непроверенная версия][непроверенная версия]
Содержимое удалено Содержимое добавлено
→‎Характеристики узлов: добавил экспериментальные методы, больше про степенной закон и сделал крупные изменения в структуре статьи
→‎Валидация интерактомов: добавил валидацию интерактомов и предсказание связей
Строка 175: Строка 175:
* ''[[Drosophila melanogaster]]''
* ''[[Drosophila melanogaster]]''
* ''[[Homo sapiens]]''
* ''[[Homo sapiens]]''

== Базы интерактомных данных ==
Существует множество баз интерактомных данных, и существующие базы могут быть классифицированы по-разному.

Базы интерактомных данных можно разделить на<ref name=":1">{{Книга|автор=Cannataro M., Guzzi P. H.|заглавие=Data Management of Protein Interaction Networks|ответственный=|издание=Wiley Series on Bioinformatics: Computational Techniques and Engineering|место=|издательство=John Wiley and Sons|год=2011|страницы=|страниц=|isbn=|isbn2=}}</ref>:
# По способу получения данных: экспериментальные (литературно-курируемые ({{lang-en|literature-curated}}) и высокопроизводительные ({{lang-en|high-throughput }})), предсказание ''in silica'', метаагрегация;
# По исследуемому виду (видам);
# По типу связи: прямая бинарная связь (есть или нет прямого физического взаимодействия), небинарные связи возможно без прямого физического взаимодействия<ref>{{Статья|автор=Laura Bonetta|заглавие=Protein-protein interactions: Interactome under construction|ссылка=http://www.nature.com/nature/journal/v468/n7325/full/468851a.html|язык=en|издание=Nature|год=2010-12-09|том=468|выпуск=7325|страницы=851–854|issn=0028-0836|doi=10.1038/468851a}}</ref>, получаемые ко-комплексными ({{lang-en|co-complex}}) методами вроде ко-иммунопреципитации<ref>{{Cite web|url=https://www.thermofisher.com/ru/ru/home/life-science/protein-biology/protein-biology-learning-center/protein-biology-resource-library/pierce-protein-methods/co-immunoprecipitation-co-ip.html|title=Co-Immunoprecipitation (Co-IP)|publisher=www.thermofisher.com|lang=en|accessdate=2017-04-01}}</ref>, совмещенной с [[Масс-спектрометрия|масс-спектрометрией]], разные наборы сетей (для метаагрегаторов), бинарная связь, предсказываемая ''in silica.''
{| class="wikitable"
!Название базы
!Краткое описание базы
!Виды
!Тип сети
!Организация
!Статус
|-
|Human Reference Protein Interactome Project<ref>{{Cite web|url=http://interactome.baderlab.org/|title=HuRI {{!}} Home|publisher=interactome.baderlab.org|lang=en|accessdate=2017-03-31}}</ref>
|Проект референского интерактома человека
|[[Homo sapiens|''Homo sapiens'']]
|Бинарная, получаемая при помощи [[Двугибридный анализ|yeast two-hybrid]].
|Center for Cancer Systems Biology<ref>{{Cite web|url=http://ccsb.dfci.harvard.edu/web/www/ccsb/|title=CCSB|publisher=ccsb.dfci.harvard.edu|lang=en|accessdate=2017-03-31}}</ref>
|Активна, продолжаются эксперименты по получению новой версии человеческого протеинового интерактома (HI-III), что должно составить примерно 77% от всего пространства поиска
|-
|Molecular Interaction Database (MINT)<ref>{{Cite web|url=http://mint.bio.uniroma2.it/|title=mint|publisher=mint.bio.uniroma2.it|accessdate=2017-04-01}}</ref>
|Агрегатор литературно-курируемых экспериментальных данных о разных организмах
|На момент 01.04.2017 611 видов<ref>{{Cite web|url=http://mint.bio.uniroma2.it/cgi-bin/statistics.py|title=mint|publisher=mint.bio.uniroma2.it|accessdate=2017-04-01}}</ref>
|co-complex и бинарная
|Molecular Genetics Laboratory, University of Rome, "Tor Vergata"<ref>{{Cite web|url=http://www.moleculargenetics.it/|title=molecular genetics group|publisher=www.moleculargenetics.it|lang=en|accessdate=2017-04-01}}</ref>
|Активна
|-
|Database of Interacting Proteins<ref>{{Cite web|url=http://dip.doe-mbi.ucla.edu/|title=Database of Interacting Proteins|author=|website=|date=|publisher=}}</ref>
|Агрегатор литературно-курируемых экспериментальных данных о разных организмах
|''[[Escherichia coli O104:H4|Escherichia coli]] [[Rattus norvegicus]]''
''[[Homo sapiens]][[Saccharomyces cerevisiae]]''

''[[Mus musculus]] [[Drosophila melanogaster]]''

''[[Helicobacter pylori]]<ref name=":1" />''
|Разные виды связей (co-complex, бинарная)
|University of California, Los Angeles
|Не доступна (дата доступа 01.04.2017)
|-
|Biological Interaction Network Databank (или Database)<ref>{{Cite web|url=http://bind.ca|title=Biomolecular Interaction Network Database|author=|website=|date=|publisher=}}</ref>
|Агрегатор литературно-курируемых экспериментальных данных о разных организмах
|[[Homo sapiens|''Homo sapiens'']]
[[Saccharomyces cerevisiae|''Saccharomyces cerevisiae'']]

[[Mus musculus|''Mus musculus'']]

[[Helicobacter pylori|''Helicobacter pylori'']]
|Разные виды связей
|amuel Lunenfeld Research Institute at Mount Sinai Hospital, Toronto<ref>{{Статья|заглавие=Biomolecular Object Network Databank|ссылка=https://en.wikipedia.org/w/index.php?title=Biomolecular_Object_Network_Databank&oldid=750352351|язык=en|издание=Wikipedia|год=2016-11-19}}</ref>
|Не доступна из-за проблем с финансированием<ref>{{Статья|заглавие=Databases in peril|ссылка=http://www.nature.com/ncb/journal/v7/n7/full/ncb0705-639b.html|язык=en|издание=Nature Cell Biology|год=2005-07-01|том=7|выпуск=7|страницы=639–639|issn=1465-7392|doi=10.1038/ncb0705-639b}}</ref>
|-
|GeneMANIA<ref name=":2">{{Cite web|url=http://genemania.org/|title=GeneMANIA|publisher=genemania.org|accessdate=2017-04-01}}</ref>
|Сервис для предсказания функций генов ''in silica'' на основе агрегированных данных из других баз
|На момент 01.04.2017 9 видов<ref name=":2" />
|Разные виды связей
|University of Toronto<ref>{{Cite web|url=https://www.utoronto.ca/|title=University of Toronto|publisher=www.utoronto.ca|lang=en|accessdate=2017-04-01}}</ref>
|Активна
|-
|High-quality interactomes (HINT)<ref>{{Cite web|url=http://hint.yulab.org/|title=High-quality INTeractomes|publisher=hint.yulab.org|accessdate=2017-04-01}}</ref>
|Курируемый агрегатор экспериментальных данных
|На момент 01.04.2017 12 видов
|Разные виды связей
|Yu Lab, Cornell University<ref>{{Cite web|url=http://yulab.icmb.cornell.edu/|title=Yu Lab - Cornell University|publisher=yulab.icmb.cornell.edu|accessdate=2017-04-01}}</ref>
|Активна, обновляется каждый день
|-
|IntAct Molecular Interaction Database<ref>{{Cite web|url=http://www.ebi.ac.uk/intact/|title=http://www.ebi.ac.uk/intact/|author=IntAct|publisher=www.ebi.ac.uk|lang=en|accessdate=2017-04-01}}</ref>
|Курируемый агрегатор экспериментальных данных
|На момент 01.04.2017 7 основных видов<ref>{{Cite web|url=http://www.ebi.ac.uk/intact/about/statistics?conversationContext=8#it|title=http://www.ebi.ac.uk/intact/about/statistics?conversationContext=8#it|author=IntAct|publisher=www.ebi.ac.uk|lang=en|accessdate=2017-04-01}}</ref>
|Разные виды связей
|Cambridge<ref>{{Cite web|url=http://www.ebi.ac.uk/intact/about/overview;jsessionid=F9BA9ECD507219503D95BBB7E3B21128|title=http://www.ebi.ac.uk/intact/about/overview;jsessionid=F9BA9ECD507219503D95BBB7E3B21128|author=IntAct|publisher=www.ebi.ac.uk|lang=en|accessdate=2017-04-01}}</ref>
|Активна
|-
|Biological General Repository for Interaction Datasets (BioGRID)<ref>{{Cite web|url=https://thebiogrid.org/|title=BioGRID {{!}} Database of Protein, Chemical, and Genetic Interactions|author=Mike Tyers Lab|publisher=thebiogrid.org|lang=en|accessdate=2017-04-01}}</ref>
|Курируемый агрегатор экспериментальных и предсказанных ''in silica'' данных
|Список видов указан на <ref>{{Cite web|url=https://wiki.thebiogrid.org/doku.php/statistics|title=BioGRID Database Statistics {{!}} BioGRID|publisher=wiki.thebiogrid.org|lang=en|accessdate=2017-04-01}}</ref>
|Разные виды связей
|Princeton, Mount Sinai Hospital, University of Edinburgh, University of Montreal<ref>{{Cite web|url=https://wiki.thebiogrid.org/doku.php/aboutus|title=About the BioGRID {{!}} BioGRID|publisher=wiki.thebiogrid.org|lang=en|accessdate=2017-04-01}}</ref>
|Активна
|-
|Integrated Network Database (IntNetDB)<ref>{{Статья|автор=Kai Xia, Dong Dong, Jing-Dong J. Han|заглавие=IntNetDB v1.0: an integrated protein-protein interaction network database generated by a probabilistic model|ссылка=http://dx.doi.org/10.1186/1471-2105-7-508|издание=BMC Bioinformatics|год=2006-01-01|том=7|страницы=508|issn=1471-2105|doi=10.1186/1471-2105-7-508}}</ref>
|Предсказанная ''in silica'' сеть
|[[Homo sapiens|''Homo sapiens'']]
|Бинарная ''in silica''
|hanlab.genetics.ac.cn
|Не доступна (дата доступа 01.04.2017)
|-
|The Drosophila Interactions Database (DroID)<ref>{{Cite web|url=http://www.droidb.org/Index.jsp|title=Welcome to DroID: The Comprehensive Drosophila Interactions Database|publisher=www.droidb.org|accessdate=2017-04-01}}</ref>
|Курируемый агрегатор данных об интерактоме дрозофилы, как и экспериментальных, так и предсказанных ''in silica''
|[[Drosophila melanogaster|''Drosophila melanogaster'']]
|Разные виды связей (в том числе предсказанные in silica)
|Wayne State University School of Medicine<ref>{{Cite web|url=http://www.droidb.org/ContactUs.jsp|title=Drosophila Interactions database|publisher=www.droidb.org|accessdate=2017-04-01}}</ref>
|Активна
|-
|The Arabidopsis Infrormation Resource (TAIR)<ref>{{Cite web|url=https://www.arabidopsis.org/index.jsp|title=TAIR - Home Page|publisher=www.arabidopsis.org|lang=en|accessdate=2017-04-01}}</ref>
|База всех биологических данных по [[Резуховидка Таля|резуховидке Таля]], включая неинтерактомные (просеквенированный геном, генные карты и т.д.)
|[[Arabidopsis thaliana|''Arabidopsis thaliana'']]
|Разные виды связей (в том числе предсказанные in silica)
|Phoenix Bioinformatics Corporation<ref>{{Cite web|url=http://www.phoenixbioinformatics.org/|title=Phoenix Home|publisher=www.phoenixbioinformatics.org|lang=en-US|accessdate=2017-04-01}}</ref>
|Активна
|-
|Human Protein-Protein Interaction Prediction (PIPs)<ref>{{Cite web|url=http://www.compbio.dundee.ac.uk/www-pips/|title=PIPs: Human Protein-Protein Interaction Prediction|publisher=www.compbio.dundee.ac.uk|accessdate=2017-04-01}}</ref>
|База данных человеческих протеиновых связей, предсказанных ''in silica''
|''[[Homo sapiens]]''
|Предсказанные in silica при помощи [[Наивный байесовский классификатор|наивного Байесовского классификатора]]
|University of Dundee<ref>{{Cite web|url=https://www.dundee.ac.uk/|title=University of Dundee|author=University of Dundee|publisher=University of Dundee|lang=en|accessdate=2017-04-01}}</ref>
|Активна
|-
|Predicted Rice Interactome Network (PRIN)<ref>{{Cite web|url=http://bis.zju.edu.cn/prin/|title=Welcome to PRIN - Predicted Rice Interactome Network|publisher=bis.zju.edu.cn|accessdate=2017-04-01}}</ref>
|База данных предсказанных ''in silica'' белок-белковых взаимодействий риса
|''[[Oryza sativa]]''
|Предсказанные in silica на основе интерологов
|Zhejiang University<ref>{{Cite web|url=http://bis.zju.edu.cn/prin/contact.do|title=Contact Us|publisher=bis.zju.edu.cn|accessdate=2017-04-01}}</ref>
|Активна
|}


== Математические и информатические методы изучения интерактомов ==
== Математические и информатические методы изучения интерактомов ==

=== Валидация интерактомов ===
Прежде чем использовать собранный интерактом для анализа, следует проверить его на наличие ошибок. Если интерактом получен экспериментальным путем, то обязательно присутствует ошибка эксперимента, а если ''in silica'', то ошибка алгоритма предсказания. Ошибка высокопроизводительных экспериментальных методов вроде yeast two-hybrid, по разным оценкам<ref name=":3">{{Cite web|url=http://www.the-scientist.com/?articles.view/articleNo/15743/title/Validating-the-Interactome/|title=Validating the Interactome {{!}} The Scientist Magazine®|publisher=The Scientist|accessdate=2017-04-01}}</ref>, составляет где-то между 25% и 50%.

Для контроля качества используются, в основном следующие методы<ref name=":3" />:
# Использование предыдущих публикаций интерактомных данных в качестве референса;
# Сопоставление связей, имеющих различную природу. Если белки взаимодействуют (бинарно, как обнаруживает Y2H), то они, возможно, находятся в одном месте в клетке, соответствующие гены [[Экспрессия генов|коэкспрессируются]], а при проведении [[Нокаут гена|нокаутных]] опытов, наблюдаемые [[Фенотип|фенотипы]] должны быть похожи. Соответственно, наблюдение этих событий должно увеличивать оценку вероятности взаимодействия изучаемых генов;
# Предсказанные ''in silica'' связи могут быть валидизированы при помощи экспериментов.

=== Интерактомика как приложение теории сложных сетей к биологическим задачам ===
=== Интерактомика как приложение теории сложных сетей к биологическим задачам ===
Сетевая составляющая интерактомики исследует представление реальной биологической сети в виде графа. Граф ''G'' - [[упорядоченная пара]] двух [[Множество|множеств]] - вершин и пар вершин. Пара вершин из этого множества называется ребром. Подробнее про графы рассказано в статье [[Граф (математика)]], для понимания нижеизложенного материала более подробных сведений не требуется. К интерактомному графу в полной мере применим весь арсенал [[Комплексные сети|теории сложных сетей]].
Сетевая составляющая интерактомики исследует представление реальной биологической сети в виде графа. Граф ''G'' - [[упорядоченная пара]] двух [[Множество|множеств]] - вершин и пар вершин. Пара вершин из этого множества называется ребром. Подробнее про графы рассказано в статье [[Граф (математика)]], для понимания нижеизложенного материала более подробных сведений не требуется. К интерактомному графу в полной мере применим весь арсенал [[Комплексные сети|теории сложных сетей]].
Строка 459: Строка 333:
}}</ref>. В [[Дрожжи|дрожжах]] количество бинарных взаимодействий определенного белка коррелирует с числом [[фенотип]]ов, наблюдаемых при различных [[мутация]]х и [[физиологические условия|физиологических условиях]]<ref name="Yu2008" />.
}}</ref>. В [[Дрожжи|дрожжах]] количество бинарных взаимодействий определенного белка коррелирует с числом [[фенотип]]ов, наблюдаемых при различных [[мутация]]х и [[физиологические условия|физиологических условиях]]<ref name="Yu2008" />.


Важной задачей теории сложных сетей является поиск '''сообществ''' в сети. Если в социальной сети "сообщества" ({{lang-en|community}}) являются сообществами людей, то в контексте интерактомов "сообщества" - это группы взаимодействующих белков или геном, которые могут составлять метаболический путь или регуляционную подсистему.
Важной задачей теории сложных сетей является поиск '''сообществ''' в сети. Если в социальной сети "сообщества" ({{lang-en|community}}) являются сообществами людей, то в контексте интерактомов "сообщества" - это группы взаимодействующих белков или геном, которые могут составлять метаболический путь или регуляционную подсистему. Это применение является ключевым для интерактомики как для части предсказательной медицины<ref>{{Cite web|url=http://www.nature.com/subjects/predictive-medicine|title=Predictive medicine - Latest research and news {{!}} Nature|publisher=www.nature.com|lang=en|accessdate=2017-04-01}}</ref>, потому что многие болезни вызываются значительными нарушениями функционирования клеток, которые возможно обнаружить при помощи определения той части интерактома, которая начинает работать неправильно.


В этом направлении наблюдается прогресс, отдельно стоит отметить такие работы, как DIAMOnD<ref>{{Статья|автор=Susan Dina Ghiassian, Jörg Menche, Albert-László Barabási|заглавие=A DIseAse MOdule Detection (DIAMOnD) Algorithm Derived from a Systematic Analysis of Connectivity Patterns of Disease Proteins in the Human Interactome|ссылка=http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1004120|издание=PLOS Computational Biology|год=2015-04-08|том=11|выпуск=4|страницы=e1004120|issn=1553-7358|doi=10.1371/journal.pcbi.1004120}}</ref> - алгоритм определения болезненного модуля, основанный на систематическом анализе паттернов связей белков, участвующих в болезни, внутри человеческого интерактома. Авторы, группа под руководством одного из "отцов" теории сложных сетей [[Модель Барабаши — Альберт|Ласло Барабаши]], проанализировали белковые данные о 70 болезнях и обнаружили, что белки, участвующие в развитии болезней, действительно группируются в специфических для каждой болезни частях интерактома - болезненных модулях ({{lang-en|disease modules}}) и предложили алгоритм поиска таких модулей.
=== Предсказание связей в интерактомах ===


Помимо составления интерактомов из экспериментальных данных, возможно также '''предсказание связей в интерактомах [[In Silico|in silico]].''' Задачу предсказания связи можно поставить как задачу бинарной классификации<ref>{{Cite web|url=http://www.machinelearning.ru/wiki/index.php?title=%D0%9A%D0%BB%D0%B0%D1%81%D1%81%D0%B8%D1%84%D0%B8%D0%BA%D0%B0%D1%86%D0%B8%D1%8F|title=Классификация|publisher=www.machinelearning.ru|lang=ru|accessdate=2017-04-01}}</ref>. Связь в интерактоме может относиться к одному из двух классов:
== Интерактомика как составляющая предсказательной медицины ==
* Существующая связь (1)
* Отсутствующая связь (0)
Затем, при помощи информации о свойствах каждого из связанных генов или белков и [[Машинное обучение|методов машинного обучения]] можно определить для каждой связи, к какому классу она относится. Полученные связи можно взвесить, добавив информацию о вероятности существования такой связи, как это делается, например в нижеописанном проекте PIPs<ref name=":4">{{Cite web|url=http://www.compbio.dundee.ac.uk/www-pips/|title=PIPs: Human Protein-Protein Interaction Prediction|publisher=www.compbio.dundee.ac.uk|accessdate=2017-04-01}}</ref>, использующем [[Наивный байесовский классификатор|наивный Байесовский классификатор]].

Одна из нерешенных на данный момент проблем предсказания связей состоит в присутствии шума в данных, на которых обучается классификатор. Вышеописанные экспериментальные методы вносят свои ложноположительные и ложноотрицательные результаты, что может добавить систематическую ошибку в классификатор. Это можно поправить, например, при помощи детекции аномалий, как предлагают Сингх и Виг в своей работе "Improved prediction of missing protein interactome links via anomality detection"<ref>{{Статья|автор=Kushal Veer Singh, Lovekesh Vig|заглавие=Improved prediction of missing protein interactome links via anomaly detection|ссылка=http://appliednetsci.springeropen.com/articles/10.1007/s41109-017-0022-7|язык=En|издание=Applied Network Science|год=2017-01-28|том=2|выпуск=1|страницы=2|issn=2364-8228|doi=10.1007/s41109-017-0022-7}}</ref>. Однако, проблема неточности экспериментальных методов все еще сохраняется.

=== Валидация интерактомов ===
Прежде чем использовать собранный интерактом для анализа, следует проверить его на наличие ошибок. Если интерактом получен экспериментальным путем, то обязательно присутствует ошибка эксперимента, а если ''in silico'', то ошибка алгоритма предсказания. Ошибка высокопроизводительных экспериментальных методов вроде yeast two-hybrid, по разным оценкам<ref name=":3">{{Cite web|url=http://www.the-scientist.com/?articles.view/articleNo/15743/title/Validating-the-Interactome/|title=Validating the Interactome {{!}} The Scientist Magazine®|publisher=The Scientist|accessdate=2017-04-01}}</ref>, составляет где-то между 25% и 50%.

Для контроля качества используются, в основном следующие методы<ref name=":3" />:
# Использование предыдущих публикаций интерактомных данных в качестве референса;
# Сопоставление связей, имеющих различную природу. Если белки взаимодействуют (бинарно, как обнаруживает Y2H), то они, возможно, находятся в одном месте в клетке, соответствующие гены [[Экспрессия генов|коэкспрессируются]], а при проведении [[Нокаут гена|нокаутных]] опытов, наблюдаемые [[Фенотип|фенотипы]] должны быть похожи. Соответственно, наблюдение этих событий должно увеличивать оценку вероятности взаимодействия изучаемых генов;
# Предсказанные ''in silico'' связи могут быть валидизированы при помощи экспериментов.
В интерактомике (при валидации, при применении в поиске причин заболеваний и т.д.) встречается важная задача выравнивания графов ({{lang-en|graph alighment}}). Суть задачи в отображении одного графа на другой таким образом, чтобы графы были как можно более "похожи". Трудности начинаются уже на этапе определения степени "похожести" двух графов. Поскольку можно по-разному определить, что значит похожесть графов, то для выравнивания графов тоже может быть несколько разных определений, но они будут отличаться в принципе только разными определениями похожести и постановка задачи выравнивания графов выглядит примерно следующим образом<ref>{{Книга|автор=Christoph Doepmann|заглавие=Survey on the Graph Alignment Problem and a Benchmark of Suitable Algorithms. Expose for Bachelor's Thesis.|ссылка=https://www.informatik.hu-berlin.de/de/forschung/gebiete/wbi/teaching/studienDiplomArbeiten/finished/2013/2013/doepmann_expose_130513.pdf|ответственный=Ulf Leser, Andre Koschmieder|издание=|место=Humboldt-Universitaet zu Berlin, Institut fuer Informatik|издательство=|год=2013|страницы=|страниц=|isbn=|isbn2=}}</ref>:

Даны два графа <math>G_1 (V_1, E_1)</math> и <math>G_2 (V_2, E_2)</math>. Задана [[функционал]] качества выравнивания <math>Q (G_1, G_1, f)</math> Требуется найти функцию выравнивания <math>f: V_1 \rightarrow V_2</math>, которая максимизирует функционал качества.

Существует развитое решение именно для задач интерактомики - NetAligner<ref>{{Cite web|url=http://netaligner.irbbarcelona.org/|title=NetAligner - fast and accurate alignment of protein interaction networks|author=Roland A. Pache|publisher=netaligner.irbbarcelona.org|accessdate=2017-04-01}}</ref>, разрабатываемое Institute for Research in Biomedicine Barcelona<ref>{{Cite web|url=https://www.irbbarcelona.org/en|title=IRB Barcelona|publisher=www.irbbarcelona.org|lang=en|accessdate=2017-04-01}}</ref>. NetAligner предоставляет исследователям следующие возможности для видов ''[[Homo sapiens]], [[Mus musculus|Mus muscusus]], [[Drosophila melanogaster]], [[Arabidopsis thaliana]], [[Saccharomyces cerevisiae|Saccharomyces Cerevisiae]], [[Escherichia coli]]'' и ''[[Caenorhabditis elegans]]'':
* Выравнивание белкового комплекса на интерактом;
* Выравнивание метаболического пути на интерактом;
* Выравнивание интерактома на интерактом;

== Базы интерактомных данных ==
Существует множество баз интерактомных данных, и существующие базы могут быть классифицированы по-разному.

Базы интерактомных данных можно разделить на<ref name=":1">{{Книга|автор=Cannataro M., Guzzi P. H.|заглавие=Data Management of Protein Interaction Networks|ответственный=|издание=Wiley Series on Bioinformatics: Computational Techniques and Engineering|место=|издательство=John Wiley and Sons|год=2011|страницы=|страниц=|isbn=|isbn2=}}</ref>:
# По способу получения данных: экспериментальные (литературно-курируемые ({{lang-en|literature-curated}}) и высокопроизводительные ({{lang-en|high-throughput }})), предсказание ''in silico'', метаагрегация;
# По исследуемому виду (видам);
# По типу связи: прямая бинарная связь (есть или нет прямого физического взаимодействия), небинарные связи возможно без прямого физического взаимодействия<ref>{{Статья|автор=Laura Bonetta|заглавие=Protein-protein interactions: Interactome under construction|ссылка=http://www.nature.com/nature/journal/v468/n7325/full/468851a.html|язык=en|издание=Nature|год=2010-12-09|том=468|выпуск=7325|страницы=851–854|issn=0028-0836|doi=10.1038/468851a}}</ref>, получаемые ко-комплексными ({{lang-en|co-complex}}) методами вроде ко-иммунопреципитации<ref>{{Cite web|url=https://www.thermofisher.com/ru/ru/home/life-science/protein-biology/protein-biology-learning-center/protein-biology-resource-library/pierce-protein-methods/co-immunoprecipitation-co-ip.html|title=Co-Immunoprecipitation (Co-IP)|publisher=www.thermofisher.com|lang=en|accessdate=2017-04-01}}</ref>, совмещенной с [[Масс-спектрометрия|масс-спектрометрией]], разные наборы сетей (для метаагрегаторов), бинарная связь, предсказываемая ''in silico.''
{| class="wikitable"
!Название базы
!Краткое описание базы
!Виды
!Тип сети
!Организация
!Статус
|-
|Human Reference Protein Interactome Project<ref>{{Cite web|url=http://interactome.baderlab.org/|title=HuRI {{!}} Home|publisher=interactome.baderlab.org|lang=en|accessdate=2017-03-31}}</ref>
|Проект референского интерактома человека
|[[Homo sapiens|''Homo sapiens'']]
|Бинарная, получаемая при помощи [[Двугибридный анализ|yeast two-hybrid]].
|Center for Cancer Systems Biology<ref>{{Cite web|url=http://ccsb.dfci.harvard.edu/web/www/ccsb/|title=CCSB|publisher=ccsb.dfci.harvard.edu|lang=en|accessdate=2017-03-31}}</ref>
|Активна, продолжаются эксперименты по получению новой версии человеческого протеинового интерактома (HI-III), что должно составить примерно 77% от всего пространства поиска
|-
|Molecular Interaction Database (MINT)<ref>{{Cite web|url=http://mint.bio.uniroma2.it/|title=mint|publisher=mint.bio.uniroma2.it|accessdate=2017-04-01}}</ref>
|Агрегатор литературно-курируемых экспериментальных данных о разных организмах
|На момент 01.04.2017 611 видов<ref>{{Cite web|url=http://mint.bio.uniroma2.it/cgi-bin/statistics.py|title=mint|publisher=mint.bio.uniroma2.it|accessdate=2017-04-01}}</ref>
|co-complex и бинарная
|Molecular Genetics Laboratory, University of Rome, "Tor Vergata"<ref>{{Cite web|url=http://www.moleculargenetics.it/|title=molecular genetics group|publisher=www.moleculargenetics.it|lang=en|accessdate=2017-04-01}}</ref>
|Активна
|-
|Database of Interacting Proteins<ref>{{Cite web|url=http://dip.doe-mbi.ucla.edu/|title=Database of Interacting Proteins|author=|website=|date=|publisher=}}</ref>
|Агрегатор литературно-курируемых экспериментальных данных о разных организмах
|''[[Escherichia coli O104:H4|Escherichia coli]] [[Rattus norvegicus]]''
''[[Homo sapiens]][[Saccharomyces cerevisiae]]''

''[[Mus musculus]] [[Drosophila melanogaster]]''

''[[Helicobacter pylori]]<ref name=":1" />''
|Разные виды связей (co-complex, бинарная)
|University of California, Los Angeles
|Не доступна (дата доступа 01.04.2017)
|-
|Biological Interaction Network Databank (или Database)<ref>{{Cite web|url=http://bind.ca|title=Biomolecular Interaction Network Database|author=|website=|date=|publisher=}}</ref>
|Агрегатор литературно-курируемых экспериментальных данных о разных организмах
|[[Homo sapiens|''Homo sapiens'']]
[[Saccharomyces cerevisiae|''Saccharomyces cerevisiae'']]

[[Mus musculus|''Mus musculus'']]

[[Helicobacter pylori|''Helicobacter pylori'']]
|Разные виды связей
|amuel Lunenfeld Research Institute at Mount Sinai Hospital, Toronto<ref>{{Статья|заглавие=Biomolecular Object Network Databank|ссылка=https://en.wikipedia.org/w/index.php?title=Biomolecular_Object_Network_Databank&oldid=750352351|язык=en|издание=Wikipedia|год=2016-11-19}}</ref>
|Не доступна из-за проблем с финансированием<ref>{{Статья|заглавие=Databases in peril|ссылка=http://www.nature.com/ncb/journal/v7/n7/full/ncb0705-639b.html|язык=en|издание=Nature Cell Biology|год=2005-07-01|том=7|выпуск=7|страницы=639–639|issn=1465-7392|doi=10.1038/ncb0705-639b}}</ref>
|-
|GeneMANIA<ref name=":2">{{Cite web|url=http://genemania.org/|title=GeneMANIA|publisher=genemania.org|accessdate=2017-04-01}}</ref>
|Сервис для предсказания функций генов ''in silico'' на основе агрегированных данных из других баз
|На момент 01.04.2017 9 видов<ref name=":2" />
|Разные виды связей
|University of Toronto<ref>{{Cite web|url=https://www.utoronto.ca/|title=University of Toronto|publisher=www.utoronto.ca|lang=en|accessdate=2017-04-01}}</ref>
|Активна
|-
|High-quality interactomes (HINT)<ref>{{Cite web|url=http://hint.yulab.org/|title=High-quality INTeractomes|publisher=hint.yulab.org|accessdate=2017-04-01}}</ref>
|Курируемый агрегатор экспериментальных данных
|На момент 01.04.2017 12 видов
|Разные виды связей
|Yu Lab, Cornell University<ref>{{Cite web|url=http://yulab.icmb.cornell.edu/|title=Yu Lab - Cornell University|publisher=yulab.icmb.cornell.edu|accessdate=2017-04-01}}</ref>
|Активна, обновляется каждый день
|-
|IntAct Molecular Interaction Database<ref>{{Cite web|url=http://www.ebi.ac.uk/intact/|title=http://www.ebi.ac.uk/intact/|author=IntAct|publisher=www.ebi.ac.uk|lang=en|accessdate=2017-04-01}}</ref>
|Курируемый агрегатор экспериментальных данных
|На момент 01.04.2017 7 основных видов<ref>{{Cite web|url=http://www.ebi.ac.uk/intact/about/statistics?conversationContext=8#it|title=http://www.ebi.ac.uk/intact/about/statistics?conversationContext=8#it|author=IntAct|publisher=www.ebi.ac.uk|lang=en|accessdate=2017-04-01}}</ref>
|Разные виды связей
|Cambridge<ref>{{Cite web|url=http://www.ebi.ac.uk/intact/about/overview;jsessionid=F9BA9ECD507219503D95BBB7E3B21128|title=http://www.ebi.ac.uk/intact/about/overview;jsessionid=F9BA9ECD507219503D95BBB7E3B21128|author=IntAct|publisher=www.ebi.ac.uk|lang=en|accessdate=2017-04-01}}</ref>
|Активна
|-
|Biological General Repository for Interaction Datasets (BioGRID)<ref>{{Cite web|url=https://thebiogrid.org/|title=BioGRID {{!}} Database of Protein, Chemical, and Genetic Interactions|author=Mike Tyers Lab|publisher=thebiogrid.org|lang=en|accessdate=2017-04-01}}</ref>
|Курируемый агрегатор экспериментальных и предсказанных ''in silico'' данных
|Список видов указан на <ref>{{Cite web|url=https://wiki.thebiogrid.org/doku.php/statistics|title=BioGRID Database Statistics {{!}} BioGRID|publisher=wiki.thebiogrid.org|lang=en|accessdate=2017-04-01}}</ref>
|Разные виды связей
|Princeton, Mount Sinai Hospital, University of Edinburgh, University of Montreal<ref>{{Cite web|url=https://wiki.thebiogrid.org/doku.php/aboutus|title=About the BioGRID {{!}} BioGRID|publisher=wiki.thebiogrid.org|lang=en|accessdate=2017-04-01}}</ref>
|Активна
|-
|Integrated Network Database (IntNetDB)<ref>{{Статья|автор=Kai Xia, Dong Dong, Jing-Dong J. Han|заглавие=IntNetDB v1.0: an integrated protein-protein interaction network database generated by a probabilistic model|ссылка=http://dx.doi.org/10.1186/1471-2105-7-508|издание=BMC Bioinformatics|год=2006-01-01|том=7|страницы=508|issn=1471-2105|doi=10.1186/1471-2105-7-508}}</ref>
|Предсказанная ''in silico'' сеть
|[[Homo sapiens|''Homo sapiens'']]
|Бинарная ''in silico''
|hanlab.genetics.ac.cn
|Не доступна (дата доступа 01.04.2017)
|-
|The Drosophila Interactions Database (DroID)<ref>{{Cite web|url=http://www.droidb.org/Index.jsp|title=Welcome to DroID: The Comprehensive Drosophila Interactions Database|publisher=www.droidb.org|accessdate=2017-04-01}}</ref>
|Курируемый агрегатор данных об интерактоме дрозофилы, как и экспериментальных, так и предсказанных ''in silico''
|[[Drosophila melanogaster|''Drosophila melanogaster'']]
|Разные виды связей (в том числе предсказанные in silico)
|Wayne State University School of Medicine<ref>{{Cite web|url=http://www.droidb.org/ContactUs.jsp|title=Drosophila Interactions database|publisher=www.droidb.org|accessdate=2017-04-01}}</ref>
|Активна
|-
|The Arabidopsis Infrormation Resource (TAIR)<ref>{{Cite web|url=https://www.arabidopsis.org/index.jsp|title=TAIR - Home Page|publisher=www.arabidopsis.org|lang=en|accessdate=2017-04-01}}</ref>
|База всех биологических данных по [[Резуховидка Таля|резуховидке Таля]], включая неинтерактомные (просеквенированный геном, генные карты и т.д.)
|[[Arabidopsis thaliana|''Arabidopsis thaliana'']]
|Разные виды связей (в том числе предсказанные in silico)
|Phoenix Bioinformatics Corporation<ref>{{Cite web|url=http://www.phoenixbioinformatics.org/|title=Phoenix Home|publisher=www.phoenixbioinformatics.org|lang=en-US|accessdate=2017-04-01}}</ref>
|Активна
|-
|Human Protein-Protein Interaction Prediction (PIPs)<ref name=":4" />
|База данных человеческих протеиновых связей, предсказанных ''in silico''
|''[[Homo sapiens]]''
|Предсказанные in silico при помощи [[Наивный байесовский классификатор|наивного Байесовского классификатора]]
|University of Dundee<ref>{{Cite web|url=https://www.dundee.ac.uk/|title=University of Dundee|author=University of Dundee|publisher=University of Dundee|lang=en|accessdate=2017-04-01}}</ref>
|Активна
|-
|Predicted Rice Interactome Network (PRIN)<ref>{{Cite web|url=http://bis.zju.edu.cn/prin/|title=Welcome to PRIN - Predicted Rice Interactome Network|publisher=bis.zju.edu.cn|accessdate=2017-04-01}}</ref>
|База данных предсказанных ''in silico'' белок-белковых взаимодействий риса
|''[[Oryza sativa]]''
|Предсказанные in silico на основе интерологов
|Zhejiang University<ref>{{Cite web|url=http://bis.zju.edu.cn/prin/contact.do|title=Contact Us|publisher=bis.zju.edu.cn|accessdate=2017-04-01}}</ref>
|Активна
|}


== Открытые проблемы интерактомики ==
== Открытые проблемы интерактомики ==

Версия от 20:15, 1 апреля 2017

Интерактом (англ. Interactome) — термин молекулярной биологии, обозначающий (полный) набор взаимодействий в отдельной клетке. Взаимодействия могу быть разные:

Слово «интерактом» было изначально придумано в 1999 году группой французских ученых во главе с Бернардом Жаком[1]. Хотя интерактомы являются биологическими сетями, их не следует путать с другими биологическими сетями, такими как нейронные и трофические.

Интерактомика (англ. Interactomics) - это дисциплина, находящаяся на стыке биоинформатики и биологии, которая занимается изучением взаимодействий и последствий этих взаимодействий между белками и другими молекулами внутри клетки[2]. Таким образом, целью интерактомики является сравнение сетей взаимодействий (т.е интерактомов) у различных видов, для того чтобы узнать какие черты таких сетей сохранились или изменились. Она является примером науки, которая позволяет взглянуть на организм или биосистему в целом. В ней собраны большие наборы полногеномных и протеомных данных и определены корреляции между молекулами. Из этой информации формулируются новые гипотезы об ответных реакциях этих молекул, которые могут быть проверены в новых экспериментах[3].

Часть интерактома DISC1 с генами(текст в прямоугольниках) и взаимодействиями(линии между генами). Hennah and Porteous, 2009.[4]

Сети молекулярных и генетических взаимодействий

Молекулярные взаимодействия могут появляться между молекулами различных групп биохимических веществ (белки, нуклеиновые кислоты, липиды, углеводы), а также в пределах одной группы. В случае, когда такие молекулы физически связаны, они образуют сети молекулярных взаимодействий, которые обычно классифицируются согласно природе вовлеченных соединений.

Чаще всего термин "интерактом" относится к сетям белок-белковых взаимодействий или к их подмножествам. Например, интерактом белка Sirt-1 — это сеть, включающая Sirt-1 и белки, напрямую взаимодействующие с ним. А интерактом второго порядка семейства Sirt[5][6] иллюстрирует взаимодействия между соседями соседей. Другой широко изученный тип интерактома — белок-ДНКовый интерактом (также называемый генно-регуляторной сетью) — это сеть, образованная транскрипционными факторами, хроматин-регуляторными белками и их ген-мишенями. Даже метаболические сети могут рассматриваться как сети молекулярных взаимодействий: метаболиты, т.е химические компоненты клетки превращаются друг в друга с помощью ферментов, которые должны физически связаться со своими субстратами.

Все типы интерактомов взаимосвязаны и перекрываются. Например, белковые интерактомы содержат много ферментов, которые в свою очередь формируют биохимические сети. Подобным же образом, ген-регуляторные сети пересекаются с сетями белковых взаимодействий и с сигнальными сетями.

Было предположено, что размер интерактома организма коррелирует с биологической сложностью организма лучше, чем размер генома[7]. Однако, карты белок-белковых взаимодействий, содержащие несколько тысяч бинарных взаимодействий и доступные для нескольких видов, все еще окончательно не завершены, и поэтому, размеры интерактомов остаются причиной споров.

Оценки интерактома дрожжевых белков[8]

Гены взаимодействуют таким образом, что они влияют на функции друг друга. Например, мутация может быть вредоносна, однако, если она сочетается с другой мутацией, такая комбинация может оказаться летальной. О таких генах говорят, что они «генетически взаимодействуют». Гены, связанные таким образом, формируют сети генетических взаимодействий. Цели изучения этих сетей: развитие функциональных карт процессов в клетке, идентификация мишеней лекарств и предсказание функций неохарактеризованных генов.

В 2010 году наиболее полный из существующих интерактомов был основан на 5.4 млн попарных сравнений генов, описывал взаимодействие 75% всех генов и включал 170 тысяч взаимодействий. Эти гены были сгруппированы на основе схожести функций для построения функциональной карты клеточных процессов. С помощью этого метода стало возможным предсказание функции известных генов лучше, чем при помощи любых других подобных методов, а также добавление функциональной информации о ранее не описанных генах. Из этой модели генетические взаимодействия могут рассматриваться на разных масштабах, что поможет в изучении консервативности генов. В ходе исследования было замечено, что отрицательных взаимодействий вдвое больше, чем положительных и они более информативны, а также гены с большим количеством взаимодействий в случае повреждения более склонны привести к летальному исходу[9].

Экспериментальные методы создания интерактомов

Основной элемент белковой сети — белок-белковое взаимодействие. В то время, как существует много методов исследовать белок-белковые взаимодействия, только немногие из них используются при создании интерактомов.

Двугибридная дрожжевая система[10] используется для определения бинарных прямых физических взаимодействий между двумя белками. Кратко и неформально, метод заключается в том, чтобы проанализировать взаимодействие белков in vivo в дрожжах путем связывания интересующих белков A и B с разделенными ДНК-связывающим и активационным доменами некоторого активатора транскрипции (например Gal4) соответственно. Конструкция "белок A + ДНК-связывающий домен" называется наживкой (англ. bait), а конструкция "белок B + активационный домен" называется жертвой (англ. prey). Если взаимодействие происходит, то из двух фрагментов собирается функциональный активатор транскрипции, который запускает транскрипцию репортерного гена (например, вырабатывающего некий флюоресцентный белок), иначе репортерный ген не транскрибируется и ничего не происходит.

Плюсы метода в том, что он достаточно прост, не требует специального оборудования и может применяться для целых библиотек, что делает yeast two-hybrid выбором по умолчанию для построения интерактомов.

Большая проблема yeast two-hybrid - ложноположительные и ложноотрицательные срабатывания:

  • Ложноположительные срабатывания могут иметь разную природу и зависят от типа Y2H. Среди причин ложноположительных результатов может быть случай, когда белки способны взаимодействовать физически, но при этом в живом организме обычно этого не делают, потому что находятся в разных местах клетки, или вообще в разных видах клеток. Также ЛП может быть вызвано взаимодействием жертвы с репортерным белком. Белки, некорректно свернутые, также могут участвовать в нестандартных взаимодействиях.
  • В классическом (с Gal4) yeast two-hybrid очень сложно обнаружить взаимодействия мембранных белков. Также связь между двумя белками в Y2H несимметрична: зависит от того, какой белок входит в наживку, а какой в жертву. Еще причина ложноотрицательного ответа может быть в том, что настоящее взаимодействие белков не в контексте Y2H может быть вызвано посттрансляционными модификациями, а в Y2H этих модификаций нет.

Другой частоиспользуемый способ определения взаимодействия белков - ко-иммунопреципитация[11] (англ. co-immunoprecipitation) с последующей масс-спектрометрией. Ко-иммунопреципитация - частный случай аффинной хроматографии. Она позволяет найти белковые комплексы, из которых можно построить интерактом (так называемые co-complex networks или co-complex connections). Метод заключается в выполнении следующего неформального алгоритма[12]:

  1. Сделать лизис клеток при помощи неионного денатуранта;
  2. Добавить в результат лизиса специфические антитела, которые связываются с интересующими исследователей белками;
  3. Удалить не связанные с антителами белки;
  4. Остаток проанализировать при помощи масс-спектрометрии. Если связь между белками A и B есть, то при масс-спектрометрии в образец помимо связанного с антителом белка A попадет и связанный с белком A белок B;

Плюсы технологии в том, что исследуемые белки находятся в натуральной конформации во время опыта. На взаимодействие между белками опыт влияет очень слабо. Однако co-IP может не поймать слабое взаимодействие и не может отличить прямое взаимодействие от непрямого (при участии белков-посредников, чье присутствие не может быть исключено при этом методе).

Оба метода имеют высокую производительность. Комбинация "ко-иммунопреципитация + масс-спектрометрия" не имеет таких проблем с ложноположительными и ложноотрицательными срабатываниями, как Y2H, и используются в качестве золотого стандарта. Но двугибридная дрожжевая система лучше показывает неспецифические физические взаимодействия, в то время как co-IP + MS лучше демонстрируют функциональные белок-белковые взаимодействия in vivo.[13][14]

Изучение интерактомов различных видов живых организмов

Вирусные интерактомы

Белковые вирусные интерактомы содержат взаимодействия между белками вирусов или фагов. Эти интерактомы были одним из первых проектов, поскольку геномы вирусов и фагов невелики и все белки могу быть проанализированы с небольшими затратами. Вирусные интерактомы связаны с интерактомами их хозяев, формируя сети взаимодействий вируса и хозяина[15]. Некоторые опубликованные вирусные интерактомы включают:

Бактериофаги

Вирусы человека (млекопитающих)

Бактериальные интерактомы

Белок-белковые взаимодействия относительно немногих бактерий были исследованы. Однако, ни один из этих интерактомов не является полным. На самом деле, было оценено, что ни один из них не покрывает больше, чем 20-30 % всех взаимодействий в основном из-за того, что эти исследования включали один метод, который открывает только одно подмножество взаимодействий. Среди опубликованных бактериальных интерактомов представлены следующие:

Вид Количество белков Количество взаимодействий метод ссылка
Helicobacter pylori 1,553 ~3,004 Y2H [25][26]
Campylobacter jejuni[англ.] 1,623 11,687 Y2H [27]
Treponema pallidum 1,040 3,649 Y2H [28]
Escherichia coli 4,288 (5,993) AP/MS [29]
Escherichia coli 4,288 2,234 Y2H [30]
Mesorhizobium loti[англ.] 6,752 3,121 Y2H [31]
Mycobacterium tuberculosis 3,959 >8000 B2H [32]
Mycoplasma genitalium 482 AP/MS [33]
Synechocystis[англ.] sp. PCC6803 3,264 3,236 Y2H [34]
Staphylococcus aureus (MRSA) 2,656 13,219 AP/MS [35]

Интерактомы E.coli и Mycoplasma были проанализированы с помощью афинной очистки и масс-спектрометрии полномасштабного белкового комплекса, следовательно, не так просто определить прямые взаимодействия. Остальные интерактомы исследовались с помощью двугибридной дрожжевой системы. Интерактом Mycobacterium tuberculosis был проанализирован с помощью бактериальной двугибридной дрожжевой системы.

Эукариотические интерактомы

Пока ни один интерактом эукариот не был полностью охарактеризован, более 90 % белков в дрожжах Saccharomyces cerevisiae были изучены и их взаимодействия охарактеризованы, что делает этот интерактом наиболее хорошо охарактеризованным[36][37][38] . Виды, чьи интерактомы тоже неплохо изучены, включают:

Математические и информатические методы изучения интерактомов

Интерактомика как приложение теории сложных сетей к биологическим задачам

Сетевая составляющая интерактомики исследует представление реальной биологической сети в виде графа. Граф G - упорядоченная пара двух множеств - вершин и пар вершин. Пара вершин из этого множества называется ребром. Подробнее про графы рассказано в статье Граф (математика), для понимания нижеизложенного материала более подробных сведений не требуется. К интерактомному графу в полной мере применим весь арсенал теории сложных сетей.

Стоит сделать следующую терминологическую ремарку:

В теории графов на данный момент существует известная путаница в терминологии[41]. В разных работах используются разные слова для обозначения одних и тех же вещей. Таким образом, следующие наборы слов синонимичны:

  • "граф" и "сеть"
  • "узел", "вершина" и "точка"
  • "ребро" и "связь"

Степень узла[42] (англ. degree) - количество связей, входящих в узел и выходящих из узла. Для ориентированных графов эта характеристика распадается на две части: полустепень захода (англ. indegree) и полустепень выхода (англ. outdegree) - количество связей, входящих в узел и количество связей, выходящих из узла, соответственно.

Распределение степеней[42] (англ. degree distribution) вершин графа описывает количество узлов (в контексте протеинового интерактома, белков), у которых есть определенное количество связей.

Некоторые сети интерактомов - безмасштабны. Это значит, что их степени имеют степенной закон распределения (англ. power law):

,

где - вероятность найти узел со степенью x, - показатель масштаба.

log-log график распределения степеней для человеческого интерактома версии HI-II-14 на основе данных проекта Human Reference Protein Interactome[43].

Эта зависимость отображается как прямая линия на log-log графике. В реальности идеальной прямой практически никогда не будет, а приблизительная прямая на log-log графике не является достаточным тестом на степенной закон. Существуют количественные проверки на power-law.

Самая популярная была представлена группой М. Ньюмана в 2009 году в статье "Power-law distributions in empirical data"[44]. Тест основан на статистике Колмогорова-Смирнова и интерпретируется также, как и другие тесты на основе КС-статистики: p-value больше порога являются значимыми, не наоборот. Существует реализация этого теста на степенной закон в пакете для анализа сетевых данных igraph[45].

С безмасштабностью связано еще одно часто наблюдаемое (в моделях и в реальности) сетевое явление - эффект Матфея, также известный как принцип предпочтительного присоединения[42]. Суть явления в том, что у узлов сети может быть некоторые "предпочтения" на тему того, к какому узлу присоединиться, и, если предпочтения будут более-менее одинаковы для всех узлов, то наиболее предпочтительные будут получать больше связей в течение жизни сети. В итоге, "богатые станут богаче, а бедные станут беднее" - будет наблюдаться очень много узлов с малым количеством связей и очень мало узлов с большим количеством связей. Сеть с предпочтительным присоединением будет иметь степенной закон распределения степеней.

В оригинальной модели Барабаши-Альберт в качестве ранга узла для оценки предпочтительности присоединения использовались сами степени, но, как показали Дженсен и Пралат в статье "Rank-based attachment leads to power law graphs"[46], что использовать в качестве ранга, абсолютно не важно, если есть присоединение по рангу, то рано или поздно проявится степенной закон.

Несмотря на вышесказанное, пока не известно, является ли безмасштабность обычным явлением именно в интерактомах, насколько интерактомы в этом смысле подобны социальным сетям, где безмасштабность (а точнее предпочтительное присоединение) распространена практически повсеместно. Наблюдается следующая тенденция: после более тщательной статистической перепроверки, те интерактомы, которые были признаны исследователями безмасштабными, такими не оказываются[47]. Вопрос о распространенности безмасштабности в интерактомике на данный момент является открытым[48]. Ситуация осложняется тем, что вообще-то ни одного полного экспериментального интерактома никто еще не собрал (на момент 01.04.2017), и как ошибка во взятии выборки влияет на оценки распределения степеней - вопрос тоже открытый.

Локальный кластерный коэффициент[42] (англ. local clustering coefficient) узла показывает, насколько соседи узла связаны между собой, т.е. насколько подграф, состоящий из соседей узла и связей между ними близок к клике (полному подграфу). Он определен как отношение количества всех существующих связей в подграфе из соседей к количеству связей в клике, образованной из соседей:

,

где n - число соседей узла v.

Средний кластерный коэффициент[42] (англ. average clustering coefficient) - среднее локального:

,

где k - количество узлов в графе.

Коэффициент ассортативности[42] (англ. assortativity coefficient) показывает, насколько похожие между собой узлы склонны соединяться между собой. Под "похожестью" имеется в виду одинаковая или близкая степень. Ассортативность определяется как корреляция Пирсона между степенями соседних вершин.

Центральность узла[49] (англ. node centrality) описывает "важность" узла для сети, характеризует узел в зависимости от его положения относительно других узлов в сети, игнорируя внутреннюю структуру узла. Центральность - мета-характеристика, которая может пониматься по-разному в зависимости от исследуемого явления: устойчивости сети, распространения информации в сети, связности, достижимости других узлов. Соответственно, для разных аспектов центральности есть разные способы ее измерения, но все они связаны между собой и из одного часто вытекает другое. Центральность в смысле связности измеряется при помощи степени (для узла, для всей сети - распределения степеней).

Центральность по посредничеству[50] (англ. betweenness centrality) - измеряет центральность узла в смысле его способности быть посредником между другими узлами.

Математически определена как отношение количества кратчайших путей между всеми парами узлов, проходящих через этот узел (), к количеству всех возможных кратчайших путей между парами узлов в этой сети ():

Betweenness характеризует устойчивость[51] сети к атакам (целенаправленному удалению узлов по некоторому заранее определенному правилу) и отказам (удалению узлов случайным образом).

Центральность по близости[52] (англ. closeness centrality) - измеряет центральность узла в смысле удобства перехода к другим узлам из него. Математически определена как отношение количества узлов, исключая рассматриваемый узел u и суммы длинн кратчайших путей от узла u ко всем остальным узлам:

,

где d - длина кратчайшего пути между узлами u и v, а k - количество всех узлов в сети.

Пэйдж-ранк[53] (англ. PageRank) - мера важности узла для распространения информации в сети. Основана на случайном блуждании по связям. Неформально, пэйдж-ранк может быть описан следующим образом:

  1. Исполнитель алгоритма начинает на случайном узле;
  2. Он движется по исходящим связям, переходя на связанные узлы;
  3. Если он попадает в узел, в котором уже был, то увеличивает его значение важности в зависимости от важности узла, из которого он пришел;
  4. На каждом шаге алгоритма есть некоторая вероятность того, что исполнитель перейдет на случайный узел в графе. Эта вероятность является задаваемым пользователем параметром алгоритма;
  5. Алгоритм выполняется до тех пор, пока не пройдено заранее заданное количество итераций.

Получаемое в итоге число будет выше для тех узлов, которые встречались исполнителю в течение его пути по графу чаще, то есть для тех узлов, у которых больше всего входящих связей и оно свидетельствует о том, насколько часто этот узел был предыдущим в ходе потока информации по графу.

Коэффициент авторитетности (англ. HITS authority) и хаб-коэффициент (англ. HITS hub), находимые при помощи алгоритма HITS показывают степень популярности узла в контексте количества входящих связей и связанность с авторитетными узлами соответственно. Эти две характеристики вычисляются одновременно и рекурсивно, и, как и пэйдж-ранк, являются мерами важности узла для распространения информации в сети.

Белковый интерактом Treponema pallidum.[28]

Хаб - узел с большим количеством связей. Хабы, объединяющие белки по функциональным модулям, такие как белковые комплексы, называются «party hub». с другой стороны, «date hub» не имеет такой корреляции и соединяют различные функциональные модули. Party hubs находятся преимущественно в наборах данных, полученных в AO/МС, в то время как date hubs находятся в основном в бинарных картах сетей интерактома[54] . Party hub в основном состоит из белков с несколькими поверхностями взаимодействий, тогда как date hub обычно представлен белками с одной поверхностью взаимодействия[55]. В дрожжах количество бинарных взаимодействий определенного белка коррелирует с числом фенотипов, наблюдаемых при различных мутациях и физиологических условиях[54].

Важной задачей теории сложных сетей является поиск сообществ в сети. Если в социальной сети "сообщества" (англ. community) являются сообществами людей, то в контексте интерактомов "сообщества" - это группы взаимодействующих белков или геном, которые могут составлять метаболический путь или регуляционную подсистему. Это применение является ключевым для интерактомики как для части предсказательной медицины[56], потому что многие болезни вызываются значительными нарушениями функционирования клеток, которые возможно обнаружить при помощи определения той части интерактома, которая начинает работать неправильно.

В этом направлении наблюдается прогресс, отдельно стоит отметить такие работы, как DIAMOnD[57] - алгоритм определения болезненного модуля, основанный на систематическом анализе паттернов связей белков, участвующих в болезни, внутри человеческого интерактома. Авторы, группа под руководством одного из "отцов" теории сложных сетей Ласло Барабаши, проанализировали белковые данные о 70 болезнях и обнаружили, что белки, участвующие в развитии болезней, действительно группируются в специфических для каждой болезни частях интерактома - болезненных модулях (англ. disease modules) и предложили алгоритм поиска таких модулей.

Помимо составления интерактомов из экспериментальных данных, возможно также предсказание связей в интерактомах in silico. Задачу предсказания связи можно поставить как задачу бинарной классификации[58]. Связь в интерактоме может относиться к одному из двух классов:

  • Существующая связь (1)
  • Отсутствующая связь (0)

Затем, при помощи информации о свойствах каждого из связанных генов или белков и методов машинного обучения можно определить для каждой связи, к какому классу она относится. Полученные связи можно взвесить, добавив информацию о вероятности существования такой связи, как это делается, например в нижеописанном проекте PIPs[59], использующем наивный Байесовский классификатор.

Одна из нерешенных на данный момент проблем предсказания связей состоит в присутствии шума в данных, на которых обучается классификатор. Вышеописанные экспериментальные методы вносят свои ложноположительные и ложноотрицательные результаты, что может добавить систематическую ошибку в классификатор. Это можно поправить, например, при помощи детекции аномалий, как предлагают Сингх и Виг в своей работе "Improved prediction of missing protein interactome links via anomality detection"[60]. Однако, проблема неточности экспериментальных методов все еще сохраняется.

Валидация интерактомов

Прежде чем использовать собранный интерактом для анализа, следует проверить его на наличие ошибок. Если интерактом получен экспериментальным путем, то обязательно присутствует ошибка эксперимента, а если in silico, то ошибка алгоритма предсказания. Ошибка высокопроизводительных экспериментальных методов вроде yeast two-hybrid, по разным оценкам[61], составляет где-то между 25% и 50%.

Для контроля качества используются, в основном следующие методы[61]:

  1. Использование предыдущих публикаций интерактомных данных в качестве референса;
  2. Сопоставление связей, имеющих различную природу. Если белки взаимодействуют (бинарно, как обнаруживает Y2H), то они, возможно, находятся в одном месте в клетке, соответствующие гены коэкспрессируются, а при проведении нокаутных опытов, наблюдаемые фенотипы должны быть похожи. Соответственно, наблюдение этих событий должно увеличивать оценку вероятности взаимодействия изучаемых генов;
  3. Предсказанные in silico связи могут быть валидизированы при помощи экспериментов.

В интерактомике (при валидации, при применении в поиске причин заболеваний и т.д.) встречается важная задача выравнивания графов (англ. graph alighment). Суть задачи в отображении одного графа на другой таким образом, чтобы графы были как можно более "похожи". Трудности начинаются уже на этапе определения степени "похожести" двух графов. Поскольку можно по-разному определить, что значит похожесть графов, то для выравнивания графов тоже может быть несколько разных определений, но они будут отличаться в принципе только разными определениями похожести и постановка задачи выравнивания графов выглядит примерно следующим образом[62]:

Даны два графа и . Задана функционал качества выравнивания Требуется найти функцию выравнивания , которая максимизирует функционал качества.

Существует развитое решение именно для задач интерактомики - NetAligner[63], разрабатываемое Institute for Research in Biomedicine Barcelona[64]. NetAligner предоставляет исследователям следующие возможности для видов Homo sapiens, Mus muscusus, Drosophila melanogaster, Arabidopsis thaliana, Saccharomyces Cerevisiae, Escherichia coli и Caenorhabditis elegans:

  • Выравнивание белкового комплекса на интерактом;
  • Выравнивание метаболического пути на интерактом;
  • Выравнивание интерактома на интерактом;

Базы интерактомных данных

Существует множество баз интерактомных данных, и существующие базы могут быть классифицированы по-разному.

Базы интерактомных данных можно разделить на[65]:

  1. По способу получения данных: экспериментальные (литературно-курируемые (англ. literature-curated) и высокопроизводительные (англ. high-throughput )), предсказание in silico, метаагрегация;
  2. По исследуемому виду (видам);
  3. По типу связи: прямая бинарная связь (есть или нет прямого физического взаимодействия), небинарные связи возможно без прямого физического взаимодействия[66], получаемые ко-комплексными (англ. co-complex) методами вроде ко-иммунопреципитации[67], совмещенной с масс-спектрометрией, разные наборы сетей (для метаагрегаторов), бинарная связь, предсказываемая in silico.
Название базы Краткое описание базы Виды Тип сети Организация Статус
Human Reference Protein Interactome Project[68] Проект референского интерактома человека Homo sapiens Бинарная, получаемая при помощи yeast two-hybrid. Center for Cancer Systems Biology[69] Активна, продолжаются эксперименты по получению новой версии человеческого протеинового интерактома (HI-III), что должно составить примерно 77% от всего пространства поиска
Molecular Interaction Database (MINT)[70] Агрегатор литературно-курируемых экспериментальных данных о разных организмах На момент 01.04.2017 611 видов[71] co-complex и бинарная Molecular Genetics Laboratory, University of Rome, "Tor Vergata"[72] Активна
Database of Interacting Proteins[73] Агрегатор литературно-курируемых экспериментальных данных о разных организмах Escherichia coli Rattus norvegicus

Homo sapiensSaccharomyces cerevisiae

Mus musculus Drosophila melanogaster

Helicobacter pylori[65]

Разные виды связей (co-complex, бинарная) University of California, Los Angeles Не доступна (дата доступа 01.04.2017)
Biological Interaction Network Databank (или Database)[74] Агрегатор литературно-курируемых экспериментальных данных о разных организмах Homo sapiens

Saccharomyces cerevisiae

Mus musculus

Helicobacter pylori

Разные виды связей amuel Lunenfeld Research Institute at Mount Sinai Hospital, Toronto[75] Не доступна из-за проблем с финансированием[76]
GeneMANIA[77] Сервис для предсказания функций генов in silico на основе агрегированных данных из других баз На момент 01.04.2017 9 видов[77] Разные виды связей University of Toronto[78] Активна
High-quality interactomes (HINT)[79] Курируемый агрегатор экспериментальных данных На момент 01.04.2017 12 видов Разные виды связей Yu Lab, Cornell University[80] Активна, обновляется каждый день
IntAct Molecular Interaction Database[81] Курируемый агрегатор экспериментальных данных На момент 01.04.2017 7 основных видов[82] Разные виды связей Cambridge[83] Активна
Biological General Repository for Interaction Datasets (BioGRID)[84] Курируемый агрегатор экспериментальных и предсказанных in silico данных Список видов указан на [85] Разные виды связей Princeton, Mount Sinai Hospital, University of Edinburgh, University of Montreal[86] Активна
Integrated Network Database (IntNetDB)[87] Предсказанная in silico сеть Homo sapiens Бинарная in silico hanlab.genetics.ac.cn Не доступна (дата доступа 01.04.2017)
The Drosophila Interactions Database (DroID)[88] Курируемый агрегатор данных об интерактоме дрозофилы, как и экспериментальных, так и предсказанных in silico Drosophila melanogaster Разные виды связей (в том числе предсказанные in silico) Wayne State University School of Medicine[89] Активна
The Arabidopsis Infrormation Resource (TAIR)[90] База всех биологических данных по резуховидке Таля, включая неинтерактомные (просеквенированный геном, генные карты и т.д.) Arabidopsis thaliana Разные виды связей (в том числе предсказанные in silico) Phoenix Bioinformatics Corporation[91] Активна
Human Protein-Protein Interaction Prediction (PIPs)[59] База данных человеческих протеиновых связей, предсказанных in silico Homo sapiens Предсказанные in silico при помощи наивного Байесовского классификатора University of Dundee[92] Активна
Predicted Rice Interactome Network (PRIN)[93] База данных предсказанных in silico белок-белковых взаимодействий риса Oryza sativa Предсказанные in silico на основе интерологов Zhejiang University[94] Активна

Открытые проблемы интерактомики

Kiemer и Cesareni [2] подняли следующую проблему: экспериментальные методы изучения интерактомов склонны к ошибкам, приводящим к тому, что 30% всех найденных взаимодействий на самом деле являются артефактами (две группы исследователей, использующие одинаковый метод на одном организме находят только 30% одинаковых взаимодействий). Также методы могут быть предвзятыми, т.е от используемого метода зависит какие именно взаимодействия будут найдены. Это связано с индивидуальными свойствами белков, например, большинство методов, которые хорошо работают с растворимыми белками не подходят для исследования мембранных белков. Это также верно для двугибридной дрожжевой системы и афинной хроматографии/масс-спектрометрии.

На самом деле, большинство интерактомов не полные, за исключением S. cerevisiae. Но такое замечание не совсем корректно, поскольку никакая научная область не является достаточно полной, пока не усовершенствованы методики. Интерактомика в 2015 году находится на той же стадии, на которой геномное секвенирование находилось в 1990-х.

Интерактомы могут различаться в разных тканях, типах клеток и стадиях развития, пока геномы остаются стабильными. В то время как гомологичные последовательности ДНК можно найти достаточно легко, гомологичные взаимодействия предсказать трудно, поскольку гомологи двух взаимодействующих белков не обязаны взаимодействовать.

Примечания

  1. Sanchez C; Lachaize C; Janody F; et al. (January 1999). "Grasping at molecular interactions and genetic networks in Drosophila melanogaster using FlyNets, an Internet database". Nucleic Acids Res. 27 (1): 89—94. doi:10.1093/nar/27.1.89. PMC 148104. PMID 9847149. {{cite journal}}: Неизвестный параметр |name-list-format= игнорируется (|name-list-style= предлагается) (справка)
  2. 1 2 Kiemer, L; G Cesareni (2007). "Comparative interactomics: comparing apples and pears?". TRENDS in Biotechnology. 25 (10): 448—454. doi:10.1016/j.tibtech.2007.08.002. PMID 17825444.
  3. Bruggeman, F J; H V Westerhoff (2006). "The nature of systems biology". TRENDS in Microbiology. 15 (1): 45—50. doi:10.1016/j.tim.2006.11.003. PMID 17113776.
  4. Hennah W, Porteous D (2009). Reif, Andreas (ed.). "The DISC1 pathway modulates expression of neurodevelopmental, synaptogenic and sensory perception genes". PLoS ONE. 4 (3): e4906. doi:10.1371/journal.pone.0004906. PMC 2654149. PMID 19300510.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка) публикация в открытом доступе
  5. Sharma, Ankush; Gautam VK; Costantini S; Paladino A; Colonna G (Feb 2012). "Interactomic and pharmacological insights on human Sirt-1". Front. Pharmacol. 3: 40. doi:10.3389/fphar.2012.00040. PMC 3311038. PMID 22470339.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  6. Sharma, Ankush; Costantini S; Colonna G (March 2013). "The protein-protein interaction network of human Sirtuin family". arXiv:1302.6423v2. PMID 23811471. {{cite journal}}: Cite journal требует |journal= (справка)
  7. Stumpf MP; Thorne T; de Silva E; et al. (May 2008). "Estimating the size of the human interactome". Proc. Natl. Acad. Sci. U.S.A. 105 (19): 6959—64. doi:10.1073/pnas.0708078105. PMC 2383957. PMID 18474861. {{cite journal}}: Неизвестный параметр |name-list-format= игнорируется (|name-list-style= предлагается) (справка)
  8. Uetz P. & Grigoriev A. (2005) The yeast interactome. In Jorde, L.B., Little, P.F.R., Dunn, M.J. and Subramaniam, S. (Eds), Encyclopedia of Genetics, Genomics, Proteomics and Bioinformatics. John Wiley & Sons Ltd: Chichester, Volume 5, pp. 2033—2051
  9. Costanzo M; Baryshnikova A; Bellay J (2010-01-22). "The genetic landscape of a cell". Science. 327 (5964): 425—431. doi:10.1126/science.1180823. PMID 20093466. {{cite journal}}: Неизвестный параметр |displayauthors= игнорируется (|display-authors= предлагается) (справка); Неизвестный параметр |name-list-format= игнорируется (|name-list-style= предлагается) (справка)
  10. Anna Brückner, Cécile Polge, Nicolas Lentze, Daniel Auerbach, Uwe Schlattner. Yeast Two-Hybrid, a Powerful Tool for Systems Biology (англ.) // International Journal of Molecular Sciences. — 2009-06-18. — Vol. 10, iss. 6. — P. 2763–2788. — doi:10.3390/ijms10062763.
  11. Choogon Lee. Coimmunoprecipitation assay // Methods in Molecular Biology (Clifton, N.J.). — 2007-01-01. — Т. 362. — С. 401–406. — ISSN 1064-3745. — doi:10.1007/978-1-59745-257-1_31.
  12. Co-Immunoprecipitation (Co-IP). www.profacgen.com. Дата обращения: 1 апреля 2017.
  13. Brettner, Leandra M.; Joanna Masel (2012). "Protein stickiness, rather than number of functional protein-protein interactions, predicts expression noise and plasticity in yeast". BMC Systems Biology. 6: 128. doi:10.1186/1752-0509-6-128. PMC 3527306. PMID 23017156.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка) публикация в открытом доступе
  14. Mukherjee, K; Slawson; Christmann; Griffith (June 2014). "Neuron-specific protein interactions of Drosophila CASK-ß are revealed by mass spectrometry". Front. Mol. Neurosci. 7: 58. doi:10.3389/fnmol.2014.00058. PMC 4075472. PMID 25071438. {{cite journal}}: Шаблон цитирования имеет пустые неизвестные параметры: |laydate=, |laysource=, and |laysummary= (справка)Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  15. Navratil V.; De Chassey, B.; Meyniel, L.; Delmotte, S.; Gautier, C.; Andre, P.; Lotteau, V.; Rabourdin-Combe, C. (2009). "VirHostNet: a knowledge base for the management and the analysis of proteome-wide virus-host interaction networks". Nucleic Acids Res. 37 (Database issue): D661—8. doi:10.1093/nar/gkn794. PMC 2686459. PMID 18984613. {{cite journal}}: Неизвестный параметр |displayauthors= игнорируется (|display-authors= предлагается) (справка)
  16. Rajagopala SV.; Casjens, Sherwood; Uetz, Peter (2011). "The protein interaction map of bacteriophage lambda". BMC Microbiol. 11: 213. doi:10.1186/1471-2180-11-213. PMC 3224144. PMID 21943085. {{cite journal}}: Неизвестный параметр |displayauthors= игнорируется (|display-authors= предлагается) (справка)Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка) публикация в открытом доступе
  17. Bartel PL, Roecklein JA, SenGupta D, Fields S (1996). "A protein linkage map of Escherichia coli bacteriophage T7". Nat. Genet. 12 (1): 72—7. doi:10.1038/ng0196-72. PMID 8528255.{{cite journal}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  18. Sabri M.; Hauser, R.; Ouellette, M.; Liu, J.; Dehbi, M.; Moeck, G.; Garcia, E.; Titz, B.; Uetz, P. (2011). "Genome annotation and intraviral interactome for the Streptococcus pneumoniae virulent phage Dp-1". J. Bact. 193 (2): 551—62. doi:10.1128/JB.01117-10. PMC 3019816. PMID 21097633. {{cite journal}}: Неизвестный параметр |displayauthors= игнорируется (|display-authors= предлагается) (справка)
  19. Häuser R.; Sabri, M.; Moineau, S.; Uetz, P. (2011). "The proteome and interactome of Streptococcus pneumoniae phage Cp-1". J. Bact. 193 (12): 3135—8. doi:10.1128/JB.01481-10. PMC 3133188. PMID 21515781. {{cite journal}}: Неизвестный параметр |displayauthors= игнорируется (|display-authors= предлагается) (справка)
  20. Stellberger, T.; et al. (2010). "Improving the yeast two-hybrid system with permutated fusions proteins: the Varicella Zoster Virus interactome". Proteome Sci. 8: 8. doi:10.1186/1477-5956-8-8. PMC 2832230. PMID 20205919.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  21. Kumar K, Rana J, Sreejith R, Gabrani R, Sharma SK, Gupta A, Chaudhary VK, Gupta S (2012). "Intraviral protein interactions of Chandipura virus". Archives of Virology. 157 (10): 1949—1957. doi:10.1007/s00705-012-1389-5. PMID 22763614.{{cite journal}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  22. 1 2 3 4 Fossum, E; et al. (2009). Sun, Ren (ed.). "Evolutionarily conserved herpesviral protein interaction networks". PLoS Pathog. 5 (9): e1000570. doi:10.1371/journal.ppat.1000570. PMC 2731838. PMID 19730696.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка) публикация в открытом доступе
  23. Hagen N, Bayer K, Rösch K, Schindler M (2014). "The intra viral protein interaction network of hepatitis C virus". Molecular & Cellular Proteomics. 13 (7): 1676—89. doi:10.1074/mcp.M113.036301. PMID 24797426.{{cite journal}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка) Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  24. Osterman A, Stellberger T, Gebhardt A, Kurz M, Friedel CC, Uetz P, Nitschko H, Baiker A, Vizoso-Pinto MG (2015). "The Hepatitis E virus intraviral interactome". Sci Rep. 5: 13872. doi:10.1038/srep13872. PMC 4604457. PMID 26463011.{{cite journal}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  25. Rain, J. C.; Selig, L.; De Reuse, H.; Battaglia, V. R.; Reverdy, C. L.; Simon, S. P.; Lenzen, G.; Petel, F.; Wojcik, J. R. M.; Schächter, V.; Chemama, Y.; Labigne, A. S.; Legrain, P. (2001). "The protein-protein interaction map of Helicobacter pylori". Nature. 409 (6817): 211—215. doi:10.1038/35051615. PMID 11196647.
  26. Häuser, R; Ceol, A; Rajagopala, S. V.; Mosca, R; Siszler, G; Wermke, N; Sikorski, P; Schwarz, F; Schick, M; Wuchty, S; Aloy, P; Uetz, P (2014). "A Second-generation Protein-Protein Interaction Network of Helicobacter pylori". Molecular & Cellular Proteomics. 13 (5): 1318—29. doi:10.1074/mcp.O113.033571. PMID 24627523.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  27. Parrish, JR; et al. (2007). "A proteome-wide protein interaction map for Campylobacter jejuni". Genome Biol. 8 (7): R130. doi:10.1186/gb-2007-8-7-r130. PMC 2323224. PMID 17615063.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  28. 1 2 Rajagopala, S. V.; Titz, B. R.; Goll, J.; Häuser, R.; McKevitt, M. T.; Palzkill, T.; Uetz, P. (2008). Hall, Neil (ed.). "The Binary Protein Interactome of Treponema pallidum – the Syphilis Spirochete". PLoS ONE. 3 (5): e2292. doi:10.1371/journal.pone.0002292. PMC 2386257. PMID 18509523.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка)
  29. Hu, P; et al. (2009). Levchenko, Andre (ed.). "Global functional atlas of Escherichia coli encompassing previously uncharacterized proteins". PLoS Biol. 7 (4): e96. doi:10.1371/journal.pbio.1000096. PMC 2672614. PMID 19402753.{{cite journal}}: Википедия:Обслуживание CS1 (не помеченный открытым DOI) (ссылка) публикация в открытом доступе
  30. Rajagopala, S. V.; Sikorski, P; Kumar, A; Mosca, R; Vlasblom, J; Arnold, R; Franca-Koh, J; Pakala, S. B.; Phanse, S; Ceol, A; Häuser, R; Siszler, G; Wuchty, S; Emili, A; Babu, M; Aloy, P; Pieper, R; Uetz, P (2014). "The binary protein-protein interaction landscape of Escherichia coli". Nature Biotechnology. 32 (3): 285—90. doi:10.1038/nbt.2831. PMID 24561554.
  31. Shimoda, Y.; Shinpo, S.; Kohara, M.; Nakamura, Y.; Tabata, S.; Sato, S. (2008). "A Large Scale Analysis of Protein-Protein Interactions in the Nitrogen-fixing Bacterium Mesorhizobium loti". DNA Research. 15 (1): 13—23. doi:10.1093/dnares/dsm028. PMC 2650630. PMID 18192278.
  32. Wang, Y.; Cui, T.; Zhang, C.; Yang, M.; Huang, Y.; Li, W.; Zhang, L.; Gao, C.; He, Y.; Li, Y.; Huang, F.; Zeng, J.; Huang, C.; Yang, Q.; Tian, Y.; Zhao, C.; Chen, H.; Zhang, H.; He, Z. G. (2010). "Global Protein−Protein Interaction Network in the Human PathogenMycobacterium tuberculosisH37Rv". Journal of Proteome Research. 9 (12): 6665—6677. doi:10.1021/pr100808n. PMID 20973567.
  33. Kuhner, S.; Van Noort, V.; Betts, M. J.; Leo-Macias, A.; Batisse, C.; Rode, M.; Yamada, T.; Maier, T.; Bader, S.; Beltran-Alvarez, P.; Castaño-Diez, D.; Chen, W. -H.; Devos, D.; Güell, M.; Norambuena, T.; Racke, I.; Rybin, V.; Schmidt, A.; Yus, E.; Aebersold, R.; Herrmann, R.; Böttcher, B.; Frangakis, A. S.; Russell, R. B.; Serrano, L.; Bork, P.; Gavin, A. -C. (2009). "Proteome Organization in a Genome-Reduced Bacterium". Science. 326 (5957): 1235—1240. doi:10.1126/science.1176343. PMID 19965468.
  34. Sato, S.; Shimoda, Y.; Muraki, A.; Kohara, M.; Nakamura, Y.; Tabata, S. (2007). "A Large-scale Protein protein Interaction Analysis in Synechocystis sp. PCC6803". DNA Research. 14 (5): 207—216. doi:10.1093/dnares/dsm021. PMC 2779905. PMID 18000013.
  35. Cherkasov, A; Hsing, M; Zoraghi, R; Foster, L. J.; See, R. H.; Stoynov, N; Jiang, J; Kaur, S; Lian, T; Jackson, L; Gong, H; Swayze, R; Amandoron, E; Hormozdiari, F; Dao, P; Sahinalp, C; Santos-Filho, O; Axerio-Cilies, P; Byler, K; McMaster, W. R.; Brunham, R. C.; Finlay, B. B.; Reiner, N. E. (2011). "Mapping the protein interaction network in methicillin-resistant Staphylococcus aureus". Journal of Proteome Research. 10 (3): 1139—50. doi:10.1021/pr100918u. PMID 21166474.
  36. Schwikowski, B.; Uetz, P.; Fields, S. (2000). "A network of protein-protein interactions in yeast". Nature Biotechnology. 18 (12): 1257—1261. doi:10.1038/82360. PMID 11101803.
  37. Uetz, P.; Giot, L.; Cagney, G.; Mansfield, T. A.; Judson, R. S.; Knight, J. R.; Lockshon, D.; Narayan, V. (2000). "A comprehensive analysis of protein-protein interactions in Saccharomyces cerevisiae". Nature. 403 (6770): 623—627. doi:10.1038/35001009. PMID 10688190.
  38. Krogan, NJ; et al. (2006). "Global landscape of protein complexes in the yeast Saccharomyeses Cerivisiae ". Nature. 440 (7084): 637—643. doi:10.1038/nature04670. PMID 16554755.
  39. Pancaldi V, Saraç OS, Rallis C, McLean JR, Převorovský M, Gould K, Beyer A, Bähler J (2012). "Predicting the fission yeast protein interaction network". G3 (Bethesda). 2 (4): 453—67. doi:10.1534/g3.111.001560. PMC 3337474. PMID 22540037.{{cite journal}}: Википедия:Обслуживание CS1 (множественные имена: authors list) (ссылка)
  40. Vo T. V., Das J., Meyer M. J., Cordero N. A., Akturk N., Wei X., Fair B. J., Degatano A. G., Fragoza R., Liu L. G., Matsuyama A., Trickey M., Horibata S., Grimson A., Yamano H., Yoshida M., Roth F. P., Pleiss J. A., Xia Y., Yu H. A Proteome-wide Fission Yeast Interactome Reveals Network Evolution Principles from Yeasts to Human. (англ.) // Cell. — 2016. — Vol. 164, no. 1-2. — P. 310—323. — doi:10.1016/j.cell.2015.11.037. — PMID 26771498. [исправить]
  41. Глоссарий теории графов // Википедия. — 2017-02-10.
  42. 1 2 3 4 5 6 Jackson M. O. Social and Economic Networks. — Princeton university press, 2010.
  43. Thomas Rolland, Murat Taşan, Benoit Charloteaux, Samuel J. Pevzner, Quan Zhong. A proteome-scale map of the human interactome network // Cell. — 2014-11-20. — Т. 159, вып. 5. — С. 1212–1226. — ISSN 1097-4172. — doi:10.1016/j.cell.2014.10.050.
  44. A. Clauset, C. Shalizi, M. Newman. Power-Law Distributions in Empirical Data // SIAM Review. — 2009-11-04. — Т. 51, вып. 4. — С. 661–703. — ISSN 0036-1445. — doi:10.1137/070710111.
  45. Welcome to igraph's new home (англ.). igraph.org. Дата обращения: 31 марта 2017.
  46. J. Janssen, P. PraŁat. Rank-Based Attachment Leads to Power Law Graphs // SIAM Journal on Discrete Mathematics. — 2010-01-01. — Т. 24, вып. 2. — С. 420–440. — ISSN 0895-4801. — doi:10.1137/080716967.
  47. Reiko Tanaka, Tau-Mu Yi, John Doyle. Some protein interaction data do not exhibit power law statistics (англ.) // FEBS Letters. — 2005-09-26. — Vol. 579, iss. 23. — P. 5140–5144. — ISSN 1873-3468. — doi:10.1016/j.febslet.2005.08.024.
  48. Gipsi Lima-Mendez, Jacques van Helden. The powerful law of the power law and other myths in network biology (англ.) // Molecular BioSystems. — 2009-01-01. — Vol. 5, iss. 12. — doi:10.1039/B908681A.
  49. Centrality. www.analytictech.com. Дата обращения: 31 марта 2017.
  50. Linton C. Freeman. A Set of Measures of Centrality Based on Betweenness // Sociometry. — 1977-01-01. — Т. 40, вып. 1. — С. 35–41. — doi:10.2307/3033543.
  51. M.E.J. Newman. The structure and function of complex networks (англ.) // SIAM Review. — 2003. — № 45. — С. 167-256. — doi:10.1137/S003614450342480.
  52. Freeman L. C. Centrality in social networks: conceptual clarification // Social networks. — 1978. — Т. 1, № 3. — С. 215-239. — doi:10.1016/0378-8733(78)90021-7.
  53. Lawrence Page, Sergey Brin, Rajeev Motwani and Terry Winograd. The PageRank Citation Ranking: Bringing Order to the Web (англ.) // Proceedings of the 7th International World Wide Web Conference. — 1998. — С. 161-172.
  54. 1 2 Yu, H; Braun, P; Yildirim, M. A.; Lemmens, I; Venkatesan, K; Sahalie, J; Hirozane-Kishikawa, T; Gebreab, F; Li, N; Simonis, N; Hao, T; Rual, J. F.; Dricot, A; Vazquez, A; Murray, R. R.; Simon, C; Tardivo, L; Tam, S; Svrzikapa, N; Fan, C; De Smet, A. S.; Motyl, A; Hudson, M. E.; Park, J; Xin, X; Cusick, M. E.; Moore, T; Boone, C; Snyder, M; Roth, F. P. (2008). "High-quality binary protein interaction map of the yeast interactome network". Science. 322 (5898): 104—10. doi:10.1126/science.1158684. PMC 2746753. PMID 18719252.
  55. Kim, P. M.; Lu, L. J.; Xia, Y; Gerstein, M. B. (2006). "Relating three-dimensional structures to protein networks provides evolutionary insights". Science. 314 (5807): 1938—41. doi:10.1126/science.1136174. PMID 17185604.
  56. Predictive medicine - Latest research and news | Nature (англ.). www.nature.com. Дата обращения: 1 апреля 2017.
  57. Susan Dina Ghiassian, Jörg Menche, Albert-László Barabási. A DIseAse MOdule Detection (DIAMOnD) Algorithm Derived from a Systematic Analysis of Connectivity Patterns of Disease Proteins in the Human Interactome // PLOS Computational Biology. — 2015-04-08. — Т. 11, вып. 4. — С. e1004120. — ISSN 1553-7358. — doi:10.1371/journal.pcbi.1004120.
  58. Классификация. www.machinelearning.ru. Дата обращения: 1 апреля 2017.
  59. 1 2 PIPs: Human Protein-Protein Interaction Prediction. www.compbio.dundee.ac.uk. Дата обращения: 1 апреля 2017.
  60. Kushal Veer Singh, Lovekesh Vig. Improved prediction of missing protein interactome links via anomaly detection (англ.) // Applied Network Science. — 2017-01-28. — Т. 2, вып. 1. — С. 2. — ISSN 2364-8228. — doi:10.1007/s41109-017-0022-7.
  61. 1 2 Validating the Interactome | The Scientist Magazine®. The Scientist. Дата обращения: 1 апреля 2017.
  62. Christoph Doepmann. Survey on the Graph Alignment Problem and a Benchmark of Suitable Algorithms. Expose for Bachelor's Thesis. / Ulf Leser, Andre Koschmieder. — Humboldt-Universitaet zu Berlin, Institut fuer Informatik, 2013.
  63. Roland A. Pache. NetAligner - fast and accurate alignment of protein interaction networks. netaligner.irbbarcelona.org. Дата обращения: 1 апреля 2017.
  64. IRB Barcelona (англ.). www.irbbarcelona.org. Дата обращения: 1 апреля 2017.
  65. 1 2 Cannataro M., Guzzi P. H. Data Management of Protein Interaction Networks. — Wiley Series on Bioinformatics: Computational Techniques and Engineering. — John Wiley and Sons, 2011.
  66. Laura Bonetta. Protein-protein interactions: Interactome under construction (англ.) // Nature. — 2010-12-09. — Vol. 468, iss. 7325. — P. 851–854. — ISSN 0028-0836. — doi:10.1038/468851a.
  67. Co-Immunoprecipitation (Co-IP) (англ.). www.thermofisher.com. Дата обращения: 1 апреля 2017.
  68. HuRI | Home (англ.). interactome.baderlab.org. Дата обращения: 31 марта 2017.
  69. CCSB (англ.). ccsb.dfci.harvard.edu. Дата обращения: 31 марта 2017.
  70. mint. mint.bio.uniroma2.it. Дата обращения: 1 апреля 2017.
  71. mint. mint.bio.uniroma2.it. Дата обращения: 1 апреля 2017.
  72. molecular genetics group (англ.). www.moleculargenetics.it. Дата обращения: 1 апреля 2017.
  73. Database of Interacting Proteins.
  74. Biomolecular Interaction Network Database.
  75. Biomolecular Object Network Databank (англ.) // Wikipedia. — 2016-11-19.
  76. Databases in peril (англ.) // Nature Cell Biology. — 2005-07-01. — Vol. 7, iss. 7. — P. 639–639. — ISSN 1465-7392. — doi:10.1038/ncb0705-639b.
  77. 1 2 GeneMANIA. genemania.org. Дата обращения: 1 апреля 2017.
  78. University of Toronto (англ.). www.utoronto.ca. Дата обращения: 1 апреля 2017.
  79. High-quality INTeractomes. hint.yulab.org. Дата обращения: 1 апреля 2017.
  80. Yu Lab - Cornell University. yulab.icmb.cornell.edu. Дата обращения: 1 апреля 2017.
  81. IntAct. http://www.ebi.ac.uk/intact/ (англ.). www.ebi.ac.uk. Дата обращения: 1 апреля 2017.
  82. IntAct. http://www.ebi.ac.uk/intact/about/statistics?conversationContext=8#it (англ.). www.ebi.ac.uk. Дата обращения: 1 апреля 2017.
  83. IntAct. http://www.ebi.ac.uk/intact/about/overview;jsessionid=F9BA9ECD507219503D95BBB7E3B21128 (англ.). www.ebi.ac.uk. Дата обращения: 1 апреля 2017.
  84. Mike Tyers Lab. BioGRID | Database of Protein, Chemical, and Genetic Interactions (англ.). thebiogrid.org. Дата обращения: 1 апреля 2017.
  85. BioGRID Database Statistics | BioGRID (англ.). wiki.thebiogrid.org. Дата обращения: 1 апреля 2017.
  86. About the BioGRID | BioGRID (англ.). wiki.thebiogrid.org. Дата обращения: 1 апреля 2017.
  87. Kai Xia, Dong Dong, Jing-Dong J. Han. IntNetDB v1.0: an integrated protein-protein interaction network database generated by a probabilistic model // BMC Bioinformatics. — 2006-01-01. — Т. 7. — С. 508. — ISSN 1471-2105. — doi:10.1186/1471-2105-7-508.
  88. Welcome to DroID: The Comprehensive Drosophila Interactions Database. www.droidb.org. Дата обращения: 1 апреля 2017.
  89. Drosophila Interactions database. www.droidb.org. Дата обращения: 1 апреля 2017.
  90. TAIR - Home Page (англ.). www.arabidopsis.org. Дата обращения: 1 апреля 2017.
  91. Phoenix Home (амер. англ.). www.phoenixbioinformatics.org. Дата обращения: 1 апреля 2017.
  92. University of Dundee. University of Dundee (англ.). University of Dundee. Дата обращения: 1 апреля 2017.
  93. Welcome to PRIN - Predicted Rice Interactome Network. bis.zju.edu.cn. Дата обращения: 1 апреля 2017.
  94. Contact Us. bis.zju.edu.cn. Дата обращения: 1 апреля 2017.

Ссылки