Category Archives: Практические руководства

Практические статьи, how-to, руководства

Работа с Phyml при реконструкции больших филогений

Публикуем четвертую часть серии туториалов, посвященных построению больших филогенетических деревьев. В этом туториале мы рассказываем, как с помощью программы Phyml провести реконструкцию филогенетического дерева. В туториале реконструкция делается для матрицы состовленной из нескольких генов в программе SequenceMatrix и выровненных с помощью программы MAFFT. Полное описание туториала можно прочитать на сайте InsideDNA

Использование MAFFT для выравнивания нуклеотидных последовательностей при реконструкции больших филогений

Публикуем третью часть серии туториалов, посвященных построению больших филогенетических деревьев. В этом туториале мы рассказываем, как выравнивать нуклеотидные последовательности (матрицы) с помощью программы MAFFT, а также как объединить различные геномные участки в единую матрицу с помощью программы SequenceMatrix. Программа MAFFT удобна тем, что позволяет быстро и точно выравнивать большие матрицы нуклеотидных последовательностей. Кроме того, в… Read More »

Создание диаграммы Венна для сравнения транскриптомов и геномов по результатом обработки OrthoMCL

Один из наиболее наглядных графиков, используемых в научных статья для сравнения транскриптомов и геномов – это график попарного перекрытия ортологов, транскриптов или генов, найденных в каждом сравниваемом транскриптоме или геноме. Чаще всего для отрисовки такого графика используется диаграмма Венна, так как она очень наглядна и понятна в интерпретации. Тем не менее, удобных иструментов для трансформации данных… Read More »

Загрузка данных из NCBI для реконструкции больших филогений – часть 2

Публикуем продолжение (вторую часть) туториала по получению данных для реконструкции больших филогенетических деревьев. Этот туториал пока доступен на английском языке на сайте InsideDNA.me, но скоро появится и тут на русском. Второй инструмент для загрузки больших объемов данных из NCBI – geneCoverage2fasta позвляет быстро получить фаста-файлы для всех референсных генов  с помощью BLAST. В английском туториале… Read More »

Как работают модели для реконструкции дискретных анцестральных признаков с использованием филогенетических деревьев

Среди сравнительных методов одним из наиболее старых является метод реконструкции предковых дискретных состояний (ancestral character state reconstruction) с использованием филогенетических деревьев.  Исторически, в основе метода  лежали две математических модели: Модель бережливости (parsimony, Maddison et al., 1984) Модель на основе непрерывного марковского процесса (continuous-time Markov process, Pagel , 1994) В настоящее время оценка параметров моделей на… Read More »

Расшифровка терминов часто используемых при сборке генома

Начнем с термина использованного в заголовке статьи. Сборка генома (genome assembly) – процесс создания генома из большого числа коротких нуклеотидных последовательностей (ридов) длинной от 50 нк (нуклеотидов) до нескольких тысяч. Обычно сборка генома включает в себя ряд этапов: Первичная обработка и чистка данных Сборка ридов в контиги (contings) Сборка контигов в скаффолды (scaffolds) Секвенирование и… Read More »

Сборка генома de novo с использованием программы Velvet Using Velvet for de novo genome assembly

Представим, что Вы получили свои первые paired-end данные от Illumina и хотите провести первичную сборку генома в т.н. контиги (contigs). Рассмотрим сборку на примере программы Velvet. Прежде чем приступать к сборке, убедитесь в следующих моментах: У вас есть два (или больше, но четное число) FASTQ файла (ов) с forward и reverse последовательностями (ридами, reads –… Read More »

Введение в программу RIntroduction to R (basics)

Большая часть задач в филогенетике, эмолюционной биологии и биоинформатике решается в настоящее время в программе R. Это бесплатная программа, состоящая из множества отдельных пакетов (модулей, packages), доступ к которым осуществляется через обший интерфейс. Все пакеты разрабатываются различными людьми и обычно каждый пакет имеет какую-то свою специализацию. Например, есть пакеты (ggplot2), который позволяют создавать красивые графики;… Read More »

Основы Байесовского моделированияBasics of Bayesian modelling

Чтобы провести анализ лог-файлов получающихся на выходе из программ BEAST/MrBayes/BEAST* (да и любых других моделей на основе Байесовского моделирования) разберемся в базовых принципах Байесовского моделирования. Модель в биологии Очень часто модель в биологическом анализе  – это de facto некоторое распределение или совокупность распределений, форма которого (которых) определена набором параметров. Например, распределение морфологических признаков в популяции… Read More »

Детектирование позитивного отбора в геномных последовательностях. Теория.Detecting positive selection in genetic sequences. Theory

Одним из наиболее интересных объектов приложения филогенетических реконструкций в эру геномики является поиск нуклеотидных позиций и ветвей филогенетического дерева находящихся (или находившихся) под позитивным отбором. Сразу оговоримся, что в данном случае термин позитивный отбор (positive selection) не является полной аналогией термина «положительный отбор» принятого в эволюционной биологии. Под позитивным отбор подразумевается следующее. При сравнении двух… Read More »