Работа с Phyml при реконструкции больших филогений

Публикуем четвертую часть серии туториалов, посвященных построению больших филогенетических деревьев. В этом туториале мы рассказываем, как с помощью программы Phyml провести реконструкцию филогенетического дерева. В туториале реконструкция делается для матрицы состовленной из нескольких генов в программе SequenceMatrix и выровненных с помощью программы MAFFT. Полное описание туториала можно прочитать на сайте InsideDNA

Использование MAFFT для выравнивания нуклеотидных последовательностей при реконструкции больших филогений

Публикуем третью часть серии туториалов, посвященных построению больших филогенетических деревьев. В этом туториале мы рассказываем, как выравнивать нуклеотидные последовательности (матрицы) с помощью программы MAFFT, а также как объединить различные геномные участки в единую матрицу с помощью программы SequenceMatrix. Программа MAFFT удобна тем, что позволяет быстро и точно выравнивать большие матрицы нуклеотидных последовательностей. Кроме того, в… Read More »

Создание диаграммы Венна для сравнения транскриптомов и геномов по результатом обработки OrthoMCL

Один из наиболее наглядных графиков, используемых в научных статья для сравнения транскриптомов и геномов – это график попарного перекрытия ортологов, транскриптов или генов, найденных в каждом сравниваемом транскриптоме или геноме. Чаще всего для отрисовки такого графика используется диаграмма Венна, так как она очень наглядна и понятна в интерпретации. Тем не менее, удобных иструментов для трансформации данных… Read More »

Загрузка данных из NCBI для реконструкции больших филогений – часть 2

Публикуем продолжение (вторую часть) туториала по получению данных для реконструкции больших филогенетических деревьев. Этот туториал пока доступен на английском языке на сайте InsideDNA.me, но скоро появится и тут на русском. Второй инструмент для загрузки больших объемов данных из NCBI – geneCoverage2fasta позвляет быстро получить фаста-файлы для всех референсных генов  с помощью BLAST. В английском туториале… Read More »

Анализ ортологов в геномах трех бактерий Ralstonia с помощью OrthoMCL

Один из наиболее мощных инструментов для кластеризации ортологов – это программа OrthoMCL. Несмотря на свою популярность, это также одна из наиболее трудно устанавливаемых и настраиваемых программ в биоинформатике. Мы постарались максимально упростить работу с этим инструментом в рамках InsideDNA и описываем ниже полный пайплайн для анализа ортологов в OrthoMCL / MCL . Использование сайта InsideDNA бесплатно и открыто… Read More »

Оценка покрытия генов и секвенированных видов в NCBI для реконструкции больших филогений

Одной из наиболее частых задач, с которыми сталкиваются эволюционные биологи в процессе построения филогенетических деревьев и их анализа, является необходимость дополнения существующих последовательностей (например, полученных в лаборатории de novo) последовательностям уже существующими в базе GenBANK. Данная задача обычно сводиться к двум подзадачам: определение покрытия генов в базе (как много уникальных видов было осеквенировано для каждого… Read More »

Объявление и приглашение присоединиться к проекту InsideDNA

Дорогие читатели блога! Столь долгая пауза в написании новых туториалов по филогенетике и биоинформатике была вызвана тем, что мы с моими коллегами трудились над новым сайтом, который, как нам кажется, будет полезен все тем, кому приходится иметь дело с биоинформатическими и другими задачками в каждодневной научной работе. Мы разрабатывали новый сайт целых полтора года и теперь… Read More »

Как работают модели для реконструкции дискретных анцестральных признаков с использованием филогенетических деревьев

Среди сравнительных методов одним из наиболее старых является метод реконструкции предковых дискретных состояний (ancestral character state reconstruction) с использованием филогенетических деревьев.  Исторически, в основе метода  лежали две математических модели: Модель бережливости (parsimony, Maddison et al., 1984) Модель на основе непрерывного марковского процесса (continuous-time Markov process, Pagel , 1994) В настоящее время оценка параметров моделей на… Read More »

Расшифровка терминов часто используемых при сборке генома

Начнем с термина использованного в заголовке статьи. Сборка генома (genome assembly) – процесс создания генома из большого числа коротких нуклеотидных последовательностей (ридов) длинной от 50 нк (нуклеотидов) до нескольких тысяч. Обычно сборка генома включает в себя ряд этапов: Первичная обработка и чистка данных Сборка ридов в контиги (contings) Сборка контигов в скаффолды (scaffolds) Секвенирование и… Read More »

Новогодний опросNew Year poll

От всей души поздравляю всех читателей сайта с наступлением нового рабочего года! В новом году – к новым целям. И, в связи с этим, первый опрос на нашем сайте. Расскажите, статьи на какие темы вам было бы наиболее интересно увидеть на нашем сайте в 2014? Рассказать об этом можно либо проголосовав в опроснике на главной… Read More »