Monthly Archives: July 2013

Реконструкция филогенетического дерева в BEAST с использованием стартового дереваPhylogenetic tree in BEAST – using an alternative strarting tree

При реконструкции филогенетического дерева в BEAST иногда может возникать необходимость перезапустить цепь MCMC с использованием некоторого стартового дерева. Такая ситуация может возникать тогда, когда расчет происходит для большого дерева и по какой-то причине процесс был остановлен раньше достижения желаемого количества поколений МСМС. Кроме того, если у вас есть дерево созданное в RAXML/Phyml – то его тоже можно использовать в качестве начального.

Для того, что использовать стартовое дерево необходимо:

  • подготовить топологию стартового дерева в формате Newick
  • модифицировать файл созданный с помощью программы BEAUti и используемый для запуска BEAST

Разберем пример.

Newick формат выглядит следующим образом

(A:0.1,B:0.2,(C:0.3,D:0.4)E:0.5)F;

Здесь буквы обозначают названия таксонов, цифры – длину ветвей дерева, ведущих к таксонам. Конверторов в формат Newick достаточно много и можно даже воспользоваться бесплатными онлайн ресурсам для конвертации из формата в формат (например, вот здесь). Кроме того, можно провести конвертацию в статистическом пакете R с помощью библиотекой “ape” (команды read.nexus/write.tree).

Теперь разберемся, как нужно модифицировать файл, который BEAST использует на входе. Этот файл имеет формат xml. Блоки файла разделены специальными тэгами, например, <taxa> <alignment> <patterns> и т.д. Каждый из этих блоков “координирует” различные параметры МСМС алгоритма. Например, блок taxa описывает группировку видов в монофилетические клады; блок alignment содержит выровненные нуклеотидные последовательности, блок patterns задает разбивку выровненных нуклеотидных последовательностей на гены.

Кроме того, есть большое число блоков описывающих априорные параметры модели используемой в BEAST для построения филогенетического дерева. Например, есть априрорный параметр определяющий стохастический процесс диверсификации видов, есть априорные параметры описывающие тип модели нуклеотидных замен. Среди большого числа прочих параметров там есть и параметры определеяющие то, каким образом создается исходное филогенетическое дерево. По умолчанию этих параметров два:

  • coalescentTree 
  • constantSize 

Эти параметры создают простую начальную топологию дерева на основе процесса коалесценции (coalescent).
Так как нас интересует замена этой простой топологии на некоторую известную необходимо сделать следующее:

  1. В файле xml, который создает программа BEAUti, нужно найти блоки constantSize и coalescentTree (выделено серым на картинке ниже).pr32_1
  2. Удалить их, а на их место вставить дерево в формате newick со следующим тэгом:<!– Set up starting tree –> 
    <newick id=”startingTree”> (A:0.1,B:0.2,(C:0.3,D:0.4)E:0.5)F; </newick>
  3. Обратите внимание, что название дерева в блоке Newick и в блоке treeModel совпадают и называются “startingTree” (тэг coalescentTree блок treeModel). Именно по этому названию программа определяет какое именно дерево использовать в качества стартового.

    BEAUTi xml

    BEAUTi xml with a new starting tree

  4. Не забудьте сохранить xml файл и используйте его в BEAST.