Использование MAFFT для выравнивания нуклеотидных последовательностей при реконструкции больших филогений

By | 10 August 2015

Публикуем третью часть серии туториалов, посвященных построению больших филогенетических деревьев. В этом туториале мы рассказываем, как выравнивать нуклеотидные последовательности (матрицы) с помощью программы MAFFT, а также как объединить различные геномные участки в единую матрицу с помощью программы SequenceMatrix. Программа MAFFT удобна тем, что позволяет быстро и точно выравнивать большие матрицы нуклеотидных последовательностей. Кроме того, в ней реализовано несколько алгоритмов выравнивания, оптимизированных под различные типы входных данных. SequenceMatrix позволяет объединить различные участки генома в единую большую матрицу с учетом названий видов и пропущенных генов в разных видах. Шаг выравания и создания общей матрицы является следующим шагом после получения исходных данных по разным генам из базы NCBI в формате fasta. Полный туториал, а также его запуск можно прочитать и запустить вот здесь.