UGENE

Материал из Википедии — свободной энциклопедии
Перейти к: навигация, поиск
UGENE
UGENE logo.png
UGENE-1.9.0-ru-overview.png
Тип

Биоинформационная программа

Разработчик

Унипро

Написана на

C++, Qt

Операционная система

Кроссплатформенное программное обеспечение

Языки интерфейса

русский, английский, чешский, китайский

Последняя версия

1.14.2 (08 октября 2014 года)

Лицензия

GPL

Сайт

ugene.unipro.ru

UGENE — свободное биоинформационное программное обеспечение.[1]

UGENE может работать на персональном компьютере с Windows, Mac OS X или Linux.

UGENE предоставляет графический интерфейс для работы с последовательностями, аннотациями, множественными выравниваниями, филогенетическими деревьями, данными секвенирования (NGS) и т.д. Данные могут храниться как локально (на персональном компьютере), так и в общем хранилище (в базе данных лаборатории).

В состав UGENE включены десятки популярных биоинформационных алгоритмов и инструментов, а также собственные разработки для работы с этими данными в контексте геномики, эволюционной биологии, вирусологии и других дисциплин. Для всех инструментов также предоставляется графический интерфейс, что облегчает анализ этих данных биологами без опыта программирования.

UGENE предоставляет возможность потокового анализа большого количества данных с помощью “Дизайнера вычислительных схем”. Вычислительная схема при этом составляется из различных блоков: считывания данных, применения встроенных алгоритмов/инструментов, записи данных. При необходимости, в схему могут быть добавлены блоки произвольных инструментов командной строки, скриптовые блоки и т. п. В дизайнере имеются уже готовые примеры схем (для аннотирования последовательностей, конвертирования форматов, анализа данных секвенирования и другие).

Помимо графического интерфейса UGENE предоставляет интерфейс командной строки. В частности, составленная в дизайнере вычислительная схема также может быть запущена из командной строки.

Чтобы обеспечить максимальное быстродействие вычислений, UGENE использует возможности многоядерных ЦПУ и графических процессоров для оптимизации некоторых вычислительных задач.

Основные возможности[править | править вики-текст]

Ниже представлены основные возможности продукта:

Редактор последовательностей[править | править вики-текст]

Редактор множественных выравниваний

Редактор последовательностей (“Sequence View”) позволяет отображать, анализировать и редактировать нуклеотидные или аминокислотные последовательности. Также, для различных типов данных, в окне редактора последовательностей поддерживаются дополнительные возможности визуализации:

  • Отображение 3D структуры белка
  • Отображение кольцевых ДНК
  • Хроматограммы
  • Графики (GC-контент, AG-контент и другие)
  • Отображение точечных графиков для ДНК последовательностей (dotplot)

Редактор множественных выравниваний[править | править вики-текст]

Редактор множественных выравниваний (“Alignment Editor”) позволяет работать с несколькими нуклеотидными или аминокислотными - выравнивать их, редактировать вручную, анализировать, сохранять консенсус, строить филогенетические деревья и др.

Редактор филогенетических деревьев[править | править вики-текст]

Редактор филогенетических деревьев (“Phylogenetic Tree Viewer”) позволяет отображать и редактировать филогенетические деревья. Имеется возможность синхронизации дерева и множественного выравнивания, по которому оно построено.

Дизайнер вычислительных схем UGENE[править | править вики-текст]

Дизайнер вычислительных схем

Дизайнер вычислительных схем позволяет составлять и запускать многошаговые вычислительные схемы. Отличительное качество дизайнера вычислительных схем UGENE заключается в том, что схемы исполняются на локальном компьютере пользователя, что снимает накладные расходы по загрузке данных на сервер.

Каждая схема состоит из вычислительных элементов. Дизайнер содержит элементы для большинства алгоритмов, интегрированных в UGENE. Также имеется возможность создавать собственные элементы, например на основе произвольной программы, запускаемой из командной строки. Вычислительную схему можно сохранить для последующего многократного использования или для передачи другому пользователю.

Созданную вычислительную схему можно запускать используя графический пользовательский интерфейс или интерфейс командной строки. Графический интерфейс предоставляет функции по контролю исполнения схемы: отображение результатов, сохранение параметров, отображение ошибок и пр.

Встроенная библиотека содержит готовые схемы для конвертации, фильтрации и аннотирования данных. В сотрудничестве с NIH NIAID, были разработаны схемы для анализа NGS данных (поиск мутаций, ChIP-seq, RNA-seq).

Assembly Browser[править | править вики-текст]

Обозреватель сборок

Создание Assembly Browser началось в 2010 году в качестве проекта-участника конкурса Illumina iDEA Challenge 2011. Assembly Browser позволяет визуализировать и изучать большие (до сотен миллионов коротких прочтений) данные полногеномного секвенирования. Поддерживаются форматы: ACE, SAM и его бинарная версия BAM. Для просмотра данных в UGENE входной файл должен быть сконвертирован в собственный формат UGENE. Такой подход обладает как преимуществами, так и недостатками. Недостатками являются время конвертирования, которое может быть значительным для больших файлов, а также размер баз данных. С другой стороны, конвертирование позволяет удобно обозревать всю сборку целиком, перемещаться по сборке и быстро переходить к плотно покрытым регионам.

Поддерживаемые форматы биологических данных[править | править вики-текст]

  • Последовательности и аннотации: FASTA (.fa), GenBank (.gb), EMBL (.emb), GFF (.gff), GTF (.gtf), BED (.bed), PDW (.pdw)
  • Множественные выравнивания: Clustal (.aln), MSF (.msf), Stockholm (.sto), Nexus (.nex), PHYLIP (.phy)
  • 3D структуры белка: PDB (.pdb), MMDB (.prt)
  • Хроматограммы: ABIF (.abi), SCF (.scf)
  • Короткие последовательности: Sequence Alignment/Map (SAM) (.sam), бинарная версия SAM (BAM) (.bam), ACE (.ace), FASTQ (.fastq)
  • Филогенетические деревья: Newick (.nwk), NEXUS (.nex)
  • Некоторые другие форматы: Bairoch (информация о ферментах), HMM (HMMER профили), PWM и PFM (весовые матрицы), SNP и VCF4 (геномные вариации)

Цикл выпуска[править | править вики-текст]

Разработка проекта ведется компанией «Унипро» с головным офисом в Академгородке Новосибирска. Каждая итерация длится приблизительно от 1го до 2х меспосле чего выпускается очередная версия. Пользователям также доступны промежуточные предрелизные сборки.

Возможности, которые будут включены в следующие версии во многом определяются запросами со стороны пользователей.

Награды[править | править вики-текст]

В 2010 году UGENE[3] был признан «Лучшим свободным проектом России — 2010» в категории «Групповой проект» в конкурсе журнала Linux Format.

Также, в 2010 году UGENE занял третье место во «Всероссийском ежегодном конкурсе проектов в сфере высокопроизводительных вычислений (High Performance Computing)», поддерживаемом корпорациями Роснано и Intel.

В 2008 году проекту оптимизации алгоритма HMMER в UGENE было присуждено первое место на «Конкурсе по разработке программного обеспечения для процессора PowerXCell 8i», проводимого компанией «Т-Платформы».

Литература[править | править вики-текст]

  1. Okonechnikov, K.; Golosova, O.; Fursov, M.; the UGENE team (2012). «Unipro UGENE: a unified bioinformatics toolkit». Bioinformatics. DOI:10.1093/bioinformatics/bts091.
  2. Vaskin, Y.; Khomicheva, I.; Ignatieva, E.; Vityaev, E.; (2012). «ExpertDiscovery and UGENE integrated system for intelligent analysis of regulatory regions of genes». In Silico Biology. DOI:10.3233/ISB-2012-0448.
  3. Васькин, Ю.; Данилова, Ю.; (2013). «Свободный дух биоинформатики». Наука из первых рук.

Аналогичное программное обеспечение[править | править вики-текст]

Ссылки[править | править вики-текст]