GenBank

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
Рост нуклеотидов в GenBank с 1982 по 2007 гг.

GenBank — база данных, находящаяся в открытом доступе, содержащая все аннотированные последовательности ДНК и РНК, а также последовательности закодированных в них белков. GenBank поддерживается Национальным центром биотехнологической информации США, входящего в состав Национальных Институтов Здоровья в США, и доступен на бесплатной основе исследователям всего мира. GenBank получает и объединяет данные, полученные в разных лабораториях, для более чем 100000 различных организмов.

GenBank — архивная база данных, то есть ответственность за содержимое каждой записи несут создатели этой записи, которыми, как правило, являются экспериментаторы, определившие данную последовательность. GenBank вместе с банками EMBL и DDBJ входит в консорциум INSDC (http://insdc.org/), осуществляющий регулярный обмен данными между этими тремя архивами аннотированных нуклеотидных последовательностей.

Правила внесения данных[править | править вики-текст]

Только первоначальные последовательности вносят в GenBank. Непосредственный внос данных для желающих пополнить базу GenBank возможен через отдельную онлайн-програму. Данные проверяются сотрудниками GenBank на предмет:

  • в какой лаборатории получены данные
  • качество полученных данных

После проверки добавленных данных, им присваевается новый AC (accession number англ.). Данные, проверка которых завершена, добавляют в общий доступ, откуда их можно извлечь, используя Entrez или сохранить с сайта через FTP.

История базы данных[править | править вики-текст]

Начало GenBank положило формирование в 1979г. Базы Данных Сиквенсов в Лос Аламосе Волтером Гоадом и сотрудниками группы Теоретической Биологии и Биофизики. В середине 1980х биоинформатическая компания Intelligenetics в Стэнфордском Университете управляла проектом GenBank совместно с LANL. Будучи одним из первых общественных биоинформатических проектов в Интеренете, в рамках проекта были открыты первые форумы и средства для обмена научными знаниями: BIOSCI/Bionet.

В период с 1989-1992 GenBank был перемещен в новообразованныйНациональный Центр Биотехнологической Информации (NCBI).

Развитие GenBank[править | править вики-текст]

На июль 2013 года GenBank содержал информацию о 152 599 230 112 нуклеотидах, 165 740 164 последовательностях (из более чем 100 000 живых организмов)[1]. Релиз банка данных от 15 декабря 2015 года (211.0) одержал 189232925 проаннотированных локусов, 20393911071 оснований, входящих в состав 189232925 описанных секвенированных геномов. Скорость расширения банка огромна: количество данных в нем удваивается примерно в течение 18 месяцев.

В генном банке содержатся также дополнительные наборы данных, механически добавленных, на основе основной коллекции данных секвенирования.

Примечания[править | править вики-текст]

См. также[править | править вики-текст]

Ссылки[править | править вики-текст]