Monthly Archives: May 2012

Датировка филогенетического дерева в BEAST/BEAUtiDating phylogenies in BEAST/BEAUti

 

В этой статье мы используем программу BEAST для реконструкции филогенетического дерева рода Ctenotus. 

Установите программу BEAST с сайта разработчиков. Помимо самой программы автоматически будут установлены утилиты: BEAUti, LogCombiner, TreeAnnotator, TreeStat.

Для подготовки файла в формате, используемом программой BEAST (xml), воспользуемся утилитой BEAUti.

Запустите программу. В главном меню выберите File>Import Data…

Укажите в качестве входного файла ctenotus_4genes.nexus (или файл с вашими данным). Учтите, форма nexus файла должен быть sequential, пробелы в названиях видов должны быть замещены на нижнее подчеркивание и быть не в кавычках. Для пропущенных данных использовать «?», для инделов «-».

Если данные были подготовлены правильно и формат нексус файла соответствует требования программы, вы увидите как в закладке Data Paritition в разделе Partition Name появится название ваше файла. Кроме того, будет указана информация в остальных колонках (Taxa,Sites,Data type, etc). 

Мы использовали нексус-файл, в котором не были указаны блоки данных (data partitioning, указывается в блоке “begin mrbayes;”). Если бы в файле были прописаны блоки Charsets и была установлена модель разбивки данных (partition + set partition), то кнопки Unlink Subst.Models, Unlink Clock Models, Unlink Trees были активны. В наших данных, разбивка на блоки указана (то есть для каждого гена использован свой charset), но не прописана модель объединения блоков, поэтому программа «не видит» разделения. Для простоты, мы будем рассматривать этот, самый простой из возможных, случай. 

Переключитесь на вкладку Taxon Sets. Нажмите на плюс «+» расположенный в левой нижней части окна. В результате в правом подокне появится запись Untitled1 (в колонке Taxon Sets), а в левом подокне в разделе Excluded Taxa появится список всех видов из файла nexus. Переимнуйте untitled1 в ctenotus_prasino и поставьте галочку в колонке Monophyletic?. Выделите все виды в колонке Excluded Taxa кроме Sphenomorphus_muelleri. После того, как вы выберете виды в колонке, небольшая стрелочка справа от колонки станет активной.

Нажмите на эту стрелочку. Все выделенные виды перемещены в колонку Included Taxa. В колонке Excluded Taxa остался только один вид, который в нашем случае не относится к роду Ctenotus. В результате этих действий мы сможем задавать датировку дереву на узле между двумя родами Sphenomorphus и Ctenotus (~75 миллионов лет).

Перейдите в следующую закладку Tip Dates. В данном упражнении у нас нет информации для этой закладки, поэтому оставьте все параметры неизменными.

Точно также ничего не меняйте в закладке Traits. Она может быть использована в тех случаях, когда есть дополнительная информация о морфологии вида, но ее использование должно быть строго оправдано, так как морфологические признаки (особенно конвергентные) могу нарушать процесс реконструкции филогенетического дерева.

Перейдите во вкладку Site Models. Из списка Substitution Model выберите модель GTR.

Из списка base frequencies выберите Estimated.

Из списка Site Heterogeneity Model выберите Gamma и Number of Gamma Categories оставьте равной 4.

Так как мы не используем разделение данных на блоки, Partition into codon positions оставьте Off

В закладке Clock Model в колонке Model выберите Relaxed Clock: uncorrelated lognormal и в колонке Estimate поставьте галочку (таким образом мы позволяем модели варьировать скорость нуклеотидных замен в разных частях дерева)

Перейдите во вкладку Trees. Оставьте Link tree prior for all trees включенным, а в разделе Tree Prior выберите из списка Speciation: Yule Process

Перейдите во вкладку Priors. В колонке Parameter выберите tmrc(ctenotus_prasino) – то есть априорное распределение для узла между группой Сtenotus и Sphenomorphus. Нажмите в колонке Prior на Using tree prior. Появится окно вида:

В этом окне выберите из списка априорное распределение Normal, укажите mean 78 и stdev 2.8. Нажмите OK.

Таким образом мы задаем возраст для узла соединяющего две клады – Сtenotus и Sphenomorphus. Этот узел позволяет задать референсную точку всему филогенетического дереву и произвести его датировку. Одного узла для точной датировки дерева почти всегде не достаточно, особенно если этот узел расположен ближе к вершине дерева. Наиболее оптимальным является наличие трех-четырех дат расположенных равномерно по всему дереву (например, один узел ближе к корню дерева, один узел в центре, и два – ближе к вершине дерева). Источником информации для датирования деревьев являются палеонтологические данные. В данном случае мы воспользовались информации полученной в результате датировки более крупного филогенетического дерева для нескольких таксономических групп ящериц из научной статьи Rabosky 2007. Этот метод не идеален, но может быть использован для примерной датировки.

Теперь выберите строку ulcd.mean нажмите в колонке Priors на ?Not yet specified и в открывшемся окне и укажите Uniform, Initial Value = 0.00001, Lower =0, Upper = 0. Нажмите OK.

С помощью этого окна мы указали все необходимые априорные распределения для модели, про которые мы могли сказать хотя бы немного. Обратите внимание, большая часть параметров осталась с априорными распределениями по умолчанию.

Лирическое отступление навеянное опытом общения со студентами:

Попробуйте проанализировать значение каждого из параметров и решить для себя, есть ли у вас какие-либо основания менять априорные распределения, заданные по умолчанию. Чаще всего таких оснований не может быть, поэтому прежде чем менять параметры priors попробуйте подумать о последствиях для модели, и о том, что именно вы знаете про Байесовскую статистику.

Перейдите в последнюю вкладку MCMC. Укажите следующие параметры: Length of chain 100 000 000, Echo state to screen every = 10000, Log parameters = 10000. Поставьте галочку напротив Create tree log file with branch length in substitutions.

Нажмите кнопку Generate BEAST file и укажите названия xml-файлу ctenotus_dated.xml

Теперь запустите программу BEAST. Нажмите на кнопку Choose file… и выберите созданный нами xml-файл. Нажмите RUN. В зависимости от мощности компьютера расчет MCMC может занять до нескольких суток.

  

В этой статье мы используем программу BEAST для реконструкции филогенетического дерева рода Ctenotus. 

Установите программу BEAST с сайта разработчиков. Помимо самой программы автоматически будут установлены утилиты: BEAUti, LogCombiner, TreeAnnotator, TreeStat.

Для подготовки файла в формате, используемом программой BEAST (xml), воспользуемся утилитой BEAUti.

Запустите программу. В главном меню выберите File>Import Data…

Укажите в качестве входного файла ctenotus_4genes.nexus (или файл с вашими данным). Учтите, форма nexus файла должен быть sequential, пробелы в названиях видов должны быть замещены на нижнее подчеркивание и быть не в кавычках. Для пропущенных данных использовать «?», для инделов «-».

Если данные были подготовлены правильно и формат нексус файла соответствует требования программы, вы увидите как в закладке Data Paritition в разделе Partition Name появится название ваше файла. Кроме того, будет указана информация в остальных колонках (Taxa,Sites,Data type, etc). 

Мы использовали нексус-файл, в котором не были указаны блоки данных (data partitioning, указывается в блоке “begin mrbayes;”). Если бы в файле были прописаны блоки Charsets и была установлена модель разбивки данных (partition + set partition), то кнопки Unlink Subst.Models, Unlink Clock Models, Unlink Trees были активны. В наших данных, разбивка на блоки указана (то есть для каждого гена использован свой charset), но не прописана модель объединения блоков, поэтому программа «не видит» разделения. Для простоты, мы будем рассматривать этот, самый простой из возможных, случай. 

Переключитесь на вкладку Taxon Sets. Нажмите на плюс «+» расположенный в левой нижней части окна. В результате в правом подокне появится запись Untitled1 (в колонке Taxon Sets), а в левом подокне в разделе Excluded Taxa появится список всех видов из файла nexus. Переимнуйте untitled1 в ctenotus_prasino и поставьте галочку в колонке Monophyletic?. Выделите все виды в колонке Excluded Taxa кроме Sphenomorphus_muelleri. После того, как вы выберете виды в колонке, небольшая стрелочка справа от колонки станет активной.

Нажмите на эту стрелочку. Все выделенные виды перемещены в колонку Included Taxa. В колонке Excluded Taxa остался только один вид, который в нашем случае не относится к роду Ctenotus. В результате этих действий мы сможем задавать датировку дереву на узле между двумя родами Sphenomorphus и Ctenotus (~75 миллионов лет).

Перейдите в следующую закладку Tip Dates. В данном упражнении у нас нет информации для этой закладки, поэтому оставьте все параметры неизменными.

Точно также ничего не меняйте в закладке Traits. Она может быть использована в тех случаях, когда есть дополнительная информация о морфологии вида, но ее использование должно быть строго оправдано, так как морфологические признаки (особенно конвергентные) могу нарушать процесс реконструкции филогенетического дерева.

Перейдите во вкладку Site Models. Из списка Substitution Model выберите модель GTR.

Из списка base frequencies выберите Estimated.

Из списка Site Heterogeneity Model выберите Gamma и Number of Gamma Categories оставьте равной 4.

Так как мы не используем разделение данных на блоки, Partition into codon positions оставьте Off

В закладке Clock Model в колонке Model выберите Relaxed Clock: uncorrelated lognormal и в колонке Estimate поставьте галочку (таким образом мы позволяем модели варьировать скорость нуклеотидных замен в разных частях дерева)

Перейдите во вкладку Trees. Оставьте Link tree prior for all trees включенным, а в разделе Tree Prior выберите из списка Speciation: Yule Process

Перейдите во вкладку Priors. В колонке Parameter выберите tmrc(ctenotus_prasino) – то есть априорное распределение для узла между группой Сtenotus и Sphenomorphus. Нажмите в колонке Prior на Using tree prior. Появится окно вида:

В этом окне выберите из списка априорное распределение Normal, укажите mean 78 и stdev 2.8. Нажмите OK.

Таким образом мы задаем возраст для узла соединяющего две клады – Сtenotus и Sphenomorphus. Этот узел позволяет задать референсную точку всему филогенетического дереву и произвести его датировку. Одного узла для точной датировки дерева почти всегде не достаточно, особенно если этот узел расположен ближе к вершине дерева. Наиболее оптимальным является наличие трех-четырех дат расположенных равномерно по всему дереву (например, один узел ближе к корню дерева, один узел в центре, и два – ближе к вершине дерева). Источником информации для датирования деревьев являются палеонтологические данные. В данном случае мы воспользовались информации полученной в результате датировки более крупного филогенетического дерева для нескольких таксономических групп ящериц из научной статьи Rabosky 2007. Этот метод не идеален, но может быть использован для примерной датировки.

Теперь выберите строку ulcd.mean нажмите в колонке Priors на ?Not yet specified и в открывшемся окне и укажите Uniform, Initial Value = 0.00001, Lower =0, Upper = 0. Нажмите OK.

С помощью этого окна мы указали все необходимые априорные распределения для модели, про которые мы могли сказать хотя бы немного. Обратите внимание, большая часть параметров осталась с априорными распределениями по умолчанию.

Лирическое отступление навеянное опытом общения со студентами:

Попробуйте проанализировать значение каждого из параметров и решить для себя, есть ли у вас какие-либо основания менять априорные распределения, заданные по умолчанию. Чаще всего таких оснований не может быть, поэтому прежде чем менять параметры priors попробуйте подумать о последствиях для модели, и о том, что именно вы знаете про Байесовскую статистику.

Перейдите в последнюю вкладку MCMC. Укажите следующие параметры: Length of chain 100 000 000, Echo state to screen every = 10000, Log parameters = 10000. Поставьте галочку напротив Create tree log file with branch length in substitutions.

Нажмите кнопку Generate BEAST file и укажите названия xml-файлу ctenotus_dated.xml

Теперь запустите программу BEAST. Нажмите на кнопку Choose file… и выберите созданный нами xml-файл. Нажмите RUN. В зависимости от мощности компьютера расчет MCMC может занять до нескольких суток.

 

В этой статье мы используем программу BEAST для реконструкции филогенетического дерева рода Ctenotus. 

Установите программу BEAST с сайта разработчиков. Помимо самой программы автоматически будут установлены утилиты: BEAUti, LogCombiner, TreeAnnotator, TreeStat.

Для подготовки файла в формате, используемом программой BEAST (xml), воспользуемся утилитой BEAUti.

Запустите программу. В главном меню выберите File>Import Data…

Укажите в качестве входного файла ctenotus_4genes.nexus (или файл с вашими данным). Учтите, форма nexus файла должен быть sequential, пробелы в названиях видов должны быть замещены на нижнее подчеркивание и быть не в кавычках. Для пропущенных данных использовать «?», для инделов «-».

Если данные были подготовлены правильно и формат нексус файла соответствует требования программы, вы увидите как в закладке Data Paritition в разделе Partition Name появится название ваше файла. Кроме того, будет указана информация в остальных колонках (Taxa,Sites,Data type, etc). 

Мы использовали нексус-файл, в котором не были указаны блоки данных (data partitioning, указывается в блоке “begin mrbayes;”). Если бы в файле были прописаны блоки Charsets и была установлена модель разбивки данных (partition + set partition), то кнопки Unlink Subst.Models, Unlink Clock Models, Unlink Trees были активны. В наших данных, разбивка на блоки указана (то есть для каждого гена использован свой charset), но не прописана модель объединения блоков, поэтому программа «не видит» разделения. Для простоты, мы будем рассматривать этот, самый простой из возможных, случай. 

Переключитесь на вкладку Taxon Sets. Нажмите на плюс «+» расположенный в левой нижней части окна. В результате в правом подокне появится запись Untitled1 (в колонке Taxon Sets), а в левом подокне в разделе Excluded Taxa появится список всех видов из файла nexus. Переимнуйте untitled1 в ctenotus_prasino и поставьте галочку в колонке Monophyletic?. Выделите все виды в колонке Excluded Taxa кроме Sphenomorphus_muelleri. После того, как вы выберете виды в колонке, небольшая стрелочка справа от колонки станет активной.

Нажмите на эту стрелочку. Все выделенные виды перемещены в колонку Included Taxa. В колонке Excluded Taxa остался только один вид, который в нашем случае не относится к роду Ctenotus. В результате этих действий мы сможем задавать датировку дереву на узле между двумя родами Sphenomorphus и Ctenotus (~75 миллионов лет).

Перейдите в следующую закладку Tip Dates. В данном упражнении у нас нет информации для этой закладки, поэтому оставьте все параметры неизменными.

Точно также ничего не меняйте в закладке Traits. Она может быть использована в тех случаях, когда есть дополнительная информация о морфологии вида, но ее использование должно быть строго оправдано, так как морфологические признаки (особенно конвергентные) могу нарушать процесс реконструкции филогенетического дерева.

Перейдите во вкладку Site Models. Из списка Substitution Model выберите модель GTR.

Из списка base frequencies выберите Estimated.

Из списка Site Heterogeneity Model выберите Gamma и Number of Gamma Categories оставьте равной 4.

Так как мы не используем разделение данных на блоки, Partition into codon positions оставьте Off

В закладке Clock Model в колонке Model выберите Relaxed Clock: uncorrelated lognormal и в колонке Estimate поставьте галочку (таким образом мы позволяем модели варьировать скорость нуклеотидных замен в разных частях дерева)

Перейдите во вкладку Trees. Оставьте Link tree prior for all trees включенным, а в разделе Tree Prior выберите из списка Speciation: Yule Process

Перейдите во вкладку Priors. В колонке Parameter выберите tmrc(ctenotus_prasino) – то есть априорное распределение для узла между группой Сtenotus и Sphenomorphus. Нажмите в колонке Prior на Using tree prior. Появится окно вида:

В этом окне выберите из списка априорное распределение Normal, укажите mean 78 и stdev 2.8. Нажмите OK.

Таким образом мы задаем возраст для узла соединяющего две клады – Сtenotus и Sphenomorphus. Этот узел позволяет задать референсную точку всему филогенетического дереву и произвести его датировку. Одного узла для точной датировки дерева почти всегде не достаточно, особенно если этот узел расположен ближе к вершине дерева. Наиболее оптимальным является наличие трех-четырех дат расположенных равномерно по всему дереву (например, один узел ближе к корню дерева, один узел в центре, и два – ближе к вершине дерева). Источником информации для датирования деревьев являются палеонтологические данные. В данном случае мы воспользовались информации полученной в результате датировки более крупного филогенетического дерева для нескольких таксономических групп ящериц из научной статьи Rabosky 2007. Этот метод не идеален, но может быть использован для примерной датировки.

Теперь выберите строку ulcd.mean нажмите в колонке Priors на ?Not yet specified и в открывшемся окне и укажите Uniform, Initial Value = 0.00001, Lower =0, Upper = 0. Нажмите OK.

С помощью этого окна мы указали все необходимые априорные распределения для модели, про которые мы могли сказать хотя бы немного. Обратите внимание, большая часть параметров осталась с априорными распределениями по умолчанию.

Лирическое отступление навеянное опытом общения со студентами:

Попробуйте проанализировать значение каждого из параметров и решить для себя, есть ли у вас какие-либо основания менять априорные распределения, заданные по умолчанию. Чаще всего таких оснований не может быть, поэтому прежде чем менять параметры priors попробуйте подумать о последствиях для модели, и о том, что именно вы знаете про Байесовскую статистику.

Перейдите в последнюю вкладку MCMC. Укажите следующие параметры: Length of chain 100 000 000, Echo state to screen every = 10000, Log parameters = 10000. Поставьте галочку напротив Create tree log file with branch length in substitutions.

Нажмите кнопку Generate BEAST file и укажите названия xml-файлу ctenotus_dated.xml

Теперь запустите программу BEAST. Нажмите на кнопку Choose file… и выберите созданный нами xml-файл. Нажмите RUN. В зависимости от мощности компьютера расчет MCMC может занять до нескольких суток.

В этой статье мы используем программу BEAST для реконструкции филогенетического дерева рода Ctenotus. 

Установите программу BEAST с сайта разработчиков. Помимо самой программы автоматически будут установлены утилиты: BEAUti, LogCombiner, TreeAnnotator, TreeStat.

Для подготовки файла в формате, используемом программой BEAST (xml), воспользуемся утилитой BEAUti.

Запустите программу. В главном меню выберите File>Import Data…

Укажите в качестве входного файла ctenotus_4genes.nexus (или файл с вашими данным). Учтите, форма nexus файла должен быть sequential, пробелы в названиях видов должны быть замещены на нижнее подчеркивание и быть не в кавычках. Для пропущенных данных использовать «?», для инделов «-».

Если данные были подготовлены правильно и формат нексус файла соответствует требования программы, вы увидите как в закладке Data Paritition в разделе Partition Name появится название ваше файла. Кроме того, будет указана информация в остальных колонках (Taxa,Sites,Data type, etc). 

Мы использовали нексус-файл, в котором не были указаны блоки данных (data partitioning, указывается в блоке “begin mrbayes;”). Если бы в файле были прописаны блоки Charsets и была установлена модель разбивки данных (partition + set partition), то кнопки Unlink Subst.Models, Unlink Clock Models, Unlink Trees были активны. В наших данных, разбивка на блоки указана (то есть для каждого гена использован свой charset), но не прописана модель объединения блоков, поэтому программа «не видит» разделения. Для простоты, мы будем рассматривать этот, самый простой из возможных, случай. 

Переключитесь на вкладку Taxon Sets. Нажмите на плюс «+» расположенный в левой нижней части окна. В результате в правом подокне появится запись Untitled1 (в колонке Taxon Sets), а в левом подокне в разделе Excluded Taxa появится список всех видов из файла nexus. Переимнуйте untitled1 в ctenotus_prasino и поставьте галочку в колонке Monophyletic?. Выделите все виды в колонке Excluded Taxa кроме Sphenomorphus_muelleri. После того, как вы выберете виды в колонке, небольшая стрелочка справа от колонки станет активной.

Нажмите на эту стрелочку. Все выделенные виды перемещены в колонку Included Taxa. В колонке Excluded Taxa остался только один вид, который в нашем случае не относится к роду Ctenotus. В результате этих действий мы сможем задавать датировку дереву на узле между двумя родами Sphenomorphus и Ctenotus (~75 миллионов лет).

Перейдите в следующую закладку Tip Dates. В данном упражнении у нас нет информации для этой закладки, поэтому оставьте все параметры неизменными.

Точно также ничего не меняйте в закладке Traits. Она может быть использована в тех случаях, когда есть дополнительная информация о морфологии вида, но ее использование должно быть строго оправдано, так как морфологические признаки (особенно конвергентные) могу нарушать процесс реконструкции филогенетического дерева.

Перейдите во вкладку Site Models. Из списка Substitution Model выберите модель GTR.

Из списка base frequencies выберите Estimated.

Из списка Site Heterogeneity Model выберите Gamma и Number of Gamma Categories оставьте равной 4.

Так как мы не используем разделение данных на блоки, Partition into codon positions оставьте Off

В закладке Clock Model в колонке Model выберите Relaxed Clock: uncorrelated lognormal и в колонке Estimate поставьте галочку (таким образом мы позволяем модели варьировать скорость нуклеотидных замен в разных частях дерева)

Перейдите во вкладку Trees. Оставьте Link tree prior for all trees включенным, а в разделе Tree Prior выберите из списка Speciation: Yule Process

Перейдите во вкладку Priors. В колонке Parameter выберите tmrc(ctenotus_prasino) – то есть априорное распределение для узла между группой Сtenotus и Sphenomorphus. Нажмите в колонке Prior на Using tree prior. Появится окно вида:

В этом окне выберите из списка априорное распределение Normal, укажите mean 78 и stdev 2.8. Нажмите OK.

Таким образом мы задаем возраст для узла соединяющего две клады – Сtenotus и Sphenomorphus. Этот узел позволяет задать референсную точку всему филогенетического дереву и произвести его датировку. Одного узла для точной датировки дерева почти всегде не достаточно, особенно если этот узел расположен ближе к вершине дерева. Наиболее оптимальным является наличие трех-четырех дат расположенных равномерно по всему дереву (например, один узел ближе к корню дерева, один узел в центре, и два – ближе к вершине дерева). Источником информации для датирования деревьев являются палеонтологические данные. В данном случае мы воспользовались информации полученной в результате датировки более крупного филогенетического дерева для нескольких таксономических групп ящериц из научной статьи Rabosky 2007. Этот метод не идеален, но может быть использован для примерной датировки.

Теперь выберите строку ulcd.mean нажмите в колонке Priors на ?Not yet specified и в открывшемся окне и укажите Uniform, Initial Value = 0.00001, Lower =0, Upper = 0. Нажмите OK.

С помощью этого окна мы указали все необходимые априорные распределения для модели, про которые мы могли сказать хотя бы немного. Обратите внимание, большая часть параметров осталась с априорными распределениями по умолчанию.

Лирическое отступление навеянное опытом общения со студентами:

Попробуйте проанализировать значение каждого из параметров и решить для себя, есть ли у вас какие-либо основания менять априорные распределения, заданные по умолчанию. Чаще всего таких оснований не может быть, поэтому прежде чем менять параметры priors попробуйте подумать о последствиях для модели, и о том, что именно вы знаете про Байесовскую статистику.

Перейдите в последнюю вкладку MCMC. Укажите следующие параметры: Length of chain 100 000 000, Echo state to screen every = 10000, Log parameters = 10000. Поставьте галочку напротив Create tree log file with branch length in substitutions.

Нажмите кнопку Generate BEAST file и укажите названия xml-файлу ctenotus_dated.xml

Теперь запустите программу BEAST. Нажмите на кнопку Choose file… и выберите созданный нами xml-файл. Нажмите RUN. В зависимости от мощности компьютера расчет MCMC может занять до нескольких суток.

В этой статье мы используем программу BEAST для реконструкции филогенетического дерева рода Ctenotus. 

Установите программу BEAST с сайта разработчиков. Помимо самой программы автоматически будут установлены утилиты: BEAUti, LogCombiner, TreeAnnotator, TreeStat.

Для подготовки файла в формате, используемом программой BEAST (xml), воспользуемся утилитой BEAUti.

Запустите программу. В главном меню выберите File>Import Data…

Укажите в качестве входного файла ctenotus_4genes.nexus (или файл с вашими данным). Учтите, форма nexus файла должен быть sequential, пробелы в названиях видов должны быть замещены на нижнее подчеркивание и быть не в кавычках. Для пропущенных данных использовать «?», для инделов «-».

Если данные были подготовлены правильно и формат нексус файла соответствует требования программы, вы увидите как в закладке Data Paritition в разделе Partition Name появится название ваше файла. Кроме того, будет указана информация в остальных колонках (Taxa,Sites,Data type, etc). 

Мы использовали нексус-файл, в котором не были указаны блоки данных (data partitioning, указывается в блоке “begin mrbayes;”). Если бы в файле были прописаны блоки Charsets и была установлена модель разбивки данных (partition + set partition), то кнопки Unlink Subst.Models, Unlink Clock Models, Unlink Trees были активны. В наших данных, разбивка на блоки указана (то есть для каждого гена использован свой charset), но не прописана модель объединения блоков, поэтому программа «не видит» разделения. Для простоты, мы будем рассматривать этот, самый простой из возможных, случай. 

Переключитесь на вкладку Taxon Sets. Нажмите на плюс «+» расположенный в левой нижней части окна. В результате в правом подокне появится запись Untitled1 (в колонке Taxon Sets), а в левом подокне в разделе Excluded Taxa появится список всех видов из файла nexus. Переимнуйте untitled1 в ctenotus_prasino и поставьте галочку в колонке Monophyletic?. Выделите все виды в колонке Excluded Taxa кроме Sphenomorphus_muelleri. После того, как вы выберете виды в колонке, небольшая стрелочка справа от колонки станет активной.

Нажмите на эту стрелочку. Все выделенные виды перемещены в колонку Included Taxa. В колонке Excluded Taxa остался только один вид, который в нашем случае не относится к роду Ctenotus. В результате этих действий мы сможем задавать датировку дереву на узле между двумя родами Sphenomorphus и Ctenotus (~75 миллионов лет).

Перейдите в следующую закладку Tip Dates. В данном упражнении у нас нет информации для этой закладки, поэтому оставьте все параметры неизменными.

Точно также ничего не меняйте в закладке Traits. Она может быть использована в тех случаях, когда есть дополнительная информация о морфологии вида, но ее использование должно быть строго оправдано, так как морфологические признаки (особенно конвергентные) могу нарушать процесс реконструкции филогенетического дерева.

Перейдите во вкладку Site Models. Из списка Substitution Model выберите модель GTR.

Из списка base frequencies выберите Estimated.

Из списка Site Heterogeneity Model выберите Gamma и Number of Gamma Categories оставьте равной 4.

Так как мы не используем разделение данных на блоки, Partition into codon positions оставьте Off

В закладке Clock Model в колонке Model выберите Relaxed Clock: uncorrelated lognormal и в колонке Estimate поставьте галочку (таким образом мы позволяем модели варьировать скорость нуклеотидных замен в разных частях дерева)

Перейдите во вкладку Trees. Оставьте Link tree prior for all trees включенным, а в разделе Tree Prior выберите из списка Speciation: Yule Process

Перейдите во вкладку Priors. В колонке Parameter выберите tmrc(ctenotus_prasino) – то есть априорное распределение для узла между группой Сtenotus и Sphenomorphus. Нажмите в колонке Prior на Using tree prior. Появится окно вида:

В этом окне выберите из списка априорное распределение Normal, укажите mean 78 и stdev 2.8. Нажмите OK.

Таким образом мы задаем возраст для узла соединяющего две клады – Сtenotus и Sphenomorphus. Этот узел позволяет задать референсную точку всему филогенетического дереву и произвести его датировку. Одного узла для точной датировки дерева почти всегде не достаточно, особенно если этот узел расположен ближе к вершине дерева. Наиболее оптимальным является наличие трех-четырех дат расположенных равномерно по всему дереву (например, один узел ближе к корню дерева, один узел в центре, и два – ближе к вершине дерева). Источником информации для датирования деревьев являются палеонтологические данные. В данном случае мы воспользовались информации полученной в результате датировки более крупного филогенетического дерева для нескольких таксономических групп ящериц из научной статьи Rabosky 2007. Этот метод не идеален, но может быть использован для примерной датировки.

Теперь выберите строку ulcd.mean нажмите в колонке Priors на ?Not yet specified и в открывшемся окне и укажите Uniform, Initial Value = 0.00001, Lower =0, Upper = 0. Нажмите OK.

С помощью этого окна мы указали все необходимые априорные распределения для модели, про которые мы могли сказать хотя бы немного. Обратите внимание, большая часть параметров осталась с априорными распределениями по умолчанию.

Лирическое отступление навеянное опытом общения со студентами:

Попробуйте проанализировать значение каждого из параметров и решить для себя, есть ли у вас какие-либо основания менять априорные распределения, заданные по умолчанию. Чаще всего таких оснований не может быть, поэтому прежде чем менять параметры priors попробуйте подумать о последствиях для модели, и о том, что именно вы знаете про Байесовскую статистику.

Перейдите в последнюю вкладку MCMC. Укажите следующие параметры: Length of chain 100 000 000, Echo state to screen every = 10000, Log parameters = 10000. Поставьте галочку напротив Create tree log file with branch length in substitutions.

Нажмите кнопку Generate BEAST file и укажите названия xml-файлу ctenotus_dated.xml

Теперь запустите программу BEAST. Нажмите на кнопку Choose file… и выберите созданный нами xml-файл. Нажмите RUN. В зависимости от мощности компьютера расчет MCMC может занять до нескольких суток.

В этой статье мы используем программу BEAST для реконструкции филогенетического дерева рода Ctenotus. 

Установите программу BEAST с сайта разработчиков. Помимо самой программы автоматически будут установлены утилиты: BEAUti, LogCombiner, TreeAnnotator, TreeStat.

Для подготовки файла в формате, используемом программой BEAST (xml), воспользуемся утилитой BEAUti.

Запустите программу. В главном меню выберите File>Import Data…

Укажите в качестве входного файла ctenotus_4genes.nexus (или файл с вашими данным). Учтите, форма nexus файла должен быть sequential, пробелы в названиях видов должны быть замещены на нижнее подчеркивание и быть не в кавычках. Для пропущенных данных использовать «?», для инделов «-».

Если данные были подготовлены правильно и формат нексус файла соответствует требования программы, вы увидите как в закладке Data Paritition в разделе Partition Name появится название ваше файла. Кроме того, будет указана информация в остальных колонках (Taxa,Sites,Data type, etc). 

Мы использовали нексус-файл, в котором не были указаны блоки данных (data partitioning, указывается в блоке “begin mrbayes;”). Если бы в файле были прописаны блоки Charsets и была установлена модель разбивки данных (partition + set partition), то кнопки Unlink Subst.Models, Unlink Clock Models, Unlink Trees были активны. В наших данных, разбивка на блоки указана (то есть для каждого гена использован свой charset), но не прописана модель объединения блоков, поэтому программа «не видит» разделения. Для простоты, мы будем рассматривать этот, самый простой из возможных, случай. 

Переключитесь на вкладку Taxon Sets. Нажмите на плюс «+» расположенный в левой нижней части окна. В результате в правом подокне появится запись Untitled1 (в колонке Taxon Sets), а в левом подокне в разделе Excluded Taxa появится список всех видов из файла nexus. Переимнуйте untitled1 в ctenotus_prasino и поставьте галочку в колонке Monophyletic?. Выделите все виды в колонке Excluded Taxa кроме Sphenomorphus_muelleri. После того, как вы выберете виды в колонке, небольшая стрелочка справа от колонки станет активной.

Нажмите на эту стрелочку. Все выделенные виды перемещены в колонку Included Taxa. В колонке Excluded Taxa остался только один вид, который в нашем случае не относится к роду Ctenotus. В результате этих действий мы сможем задавать датировку дереву на узле между двумя родами Sphenomorphus и Ctenotus (~75 миллионов лет).

Перейдите в следующую закладку Tip Dates. В данном упражнении у нас нет информации для этой закладки, поэтому оставьте все параметры неизменными.

Точно также ничего не меняйте в закладке Traits. Она может быть использована в тех случаях, когда есть дополнительная информация о морфологии вида, но ее использование должно быть строго оправдано, так как морфологические признаки (особенно конвергентные) могу нарушать процесс реконструкции филогенетического дерева.

Перейдите во вкладку Site Models. Из списка Substitution Model выберите модель GTR.

Из списка base frequencies выберите Estimated.

Из списка Site Heterogeneity Model выберите Gamma и Number of Gamma Categories оставьте равной 4.

Так как мы не используем разделение данных на блоки, Partition into codon positions оставьте Off

В закладке Clock Model в колонке Model выберите Relaxed Clock: uncorrelated lognormal и в колонке Estimate поставьте галочку (таким образом мы позволяем модели варьировать скорость нуклеотидных замен в разных частях дерева)

Перейдите во вкладку Trees. Оставьте Link tree prior for all trees включенным, а в разделе Tree Prior выберите из списка Speciation: Yule Process

Перейдите во вкладку Priors. В колонке Parameter выберите tmrc(ctenotus_prasino) – то есть априорное распределение для узла между группой Сtenotus и Sphenomorphus. Нажмите в колонке Prior на Using tree prior. Появится окно вида:

В этом окне выберите из списка априорное распределение Normal, укажите mean 78 и stdev 2.8. Нажмите OK.

Таким образом мы задаем возраст для узла соединяющего две клады – Сtenotus и Sphenomorphus. Этот узел позволяет задать референсную точку всему филогенетического дереву и произвести его датировку. Одного узла для точной датировки дерева почти всегде не достаточно, особенно если этот узел расположен ближе к вершине дерева. Наиболее оптимальным является наличие трех-четырех дат расположенных равномерно по всему дереву (например, один узел ближе к корню дерева, один узел в центре, и два – ближе к вершине дерева). Источником информации для датирования деревьев являются палеонтологические данные. В данном случае мы воспользовались информации полученной в результате датировки более крупного филогенетического дерева для нескольких таксономических групп ящериц из научной статьи Rabosky 2007. Этот метод не идеален, но может быть использован для примерной датировки.

Теперь выберите строку ulcd.mean нажмите в колонке Priors на ?Not yet specified и в открывшемся окне и укажите Uniform, Initial Value = 0.00001, Lower =0, Upper = 0. Нажмите OK.

С помощью этого окна мы указали все необходимые априорные распределения для модели, про которые мы могли сказать хотя бы немного. Обратите внимание, большая часть параметров осталась с априорными распределениями по умолчанию.

Лирическое отступление навеянное опытом общения со студентами:

Попробуйте проанализировать значение каждого из параметров и решить для себя, есть ли у вас какие-либо основания менять априорные распределения, заданные по умолчанию. Чаще всего таких оснований не может быть, поэтому прежде чем менять параметры priors попробуйте подумать о последствиях для модели, и о том, что именно вы знаете про Байесовскую статистику.

Перейдите в последнюю вкладку MCMC. Укажите следующие параметры: Length of chain 100 000 000, Echo state to screen every = 10000, Log parameters = 10000. Поставьте галочку напротив Create tree log file with branch length in substitutions.

Нажмите кнопку Generate BEAST file и укажите названия xml-файлу ctenotus_dated.xml

Теперь запустите программу BEAST. Нажмите на кнопку Choose file… и выберите созданный нами xml-файл. Нажмите RUN. В зависимости от мощности компьютера расчет MCMC может занять до нескольких суток.