Построение филогенетических деревьев

Содержание

Слайд 2

Особенности молекулярной эволюции 1. Скорость эволюции любого белка, выраженная через число

Особенности молекулярной эволюции

1. Скорость эволюции любого белка, выраженная через число аминокислотных

замен на сайт в год, приблизительно постоянна и одинакова в разных филогенетических линиях, если только функция и третичная структура этого белка остаются в основном неизменными.
Слайд 3

Что такое филогенетические деревья? Дерево — это граф, в котором два

Что такое филогенетические деревья?

Дерево — это граф, в котором два соседних

узла соединены только одним ребром.
Слайд 4

Кладограммы и филограммы Кладограммы отражают только порядок ветвления, филограммы — ещё и длину ветвей

Кладограммы и филограммы

Кладограммы отражают только порядок ветвления, филограммы — ещё и

длину ветвей
Слайд 5

Сколько здесь разных кладограмм? a b c d e a e

Сколько здесь разных кладограмм?

a

b

c

d

e

a

e

c

d

b

a

b

c

e

d

b

a

c

d

e

Слайд 6

Выбор последовательностей Последовательности должны быть гомологичны! Программа выровняет любые последовательности =>

Выбор последовательностей

Последовательности должны быть гомологичны! Программа выровняет любые последовательности => нужно

проверить с помощью Blast
Затем нужно выровнять последовательности, и по получившемуся выравниванию, определить, какие последовательности включить в анализ
Слайд 7

«Эффект тыквенного пирога» Рецепт тыквенного пирога на филогенетическом дереве креветок.

«Эффект тыквенного пирога»

Рецепт тыквенного пирога на филогенетическом дереве креветок.

Слайд 8

Выбор последовательностей

Выбор последовательностей

Слайд 9

Особенности молекулярной эволюции 2. Функционально менее важные молекулы или их части

Особенности молекулярной эволюции

2. Функционально менее важные молекулы или их части эволюционируют

(накапливая эволюционные замены) быстрее, чем более важные
3. Мутационные замены, приводящие к меньшим нарушениям структуры и функции молекулы (консервативные замены), в ходе эволюции происходят чаще тех, которые вызывают существенное нарушение структуры и функции этой молекулы
Слайд 10

Различия между деревом генов и деревом видов Проблема: ортологи и паралоги

Различия между деревом генов и деревом видов

Проблема: ортологи и паралоги

Слайд 11

Молекулярная конвергенция

Молекулярная конвергенция

Слайд 12

Филогенетические маркёры Свойства: Гены, которые представлены одной копией в геноме лучше,

Филогенетические маркёры

Свойства:
Гены, которые представлены одной копией в геноме лучше, чем

те, у которых множество копий.
Длина гена не должна варьировать у разных организмов
Скорость изменения гена должна соответствовать скорости эволюции таксонов заданного уровня
Должны легко подбираться специфические праймеры
Слайд 13

Слайд 14

Филогенетические маркёры Рибосомальные гены Митохондриальные гены (COI/II, 12s RNA, cyt b)

Филогенетические маркёры

Рибосомальные гены
Митохондриальные гены (COI/II, 12s RNA, cyt b)
Хлоропластные гены
Гены

домашнего хозяйства и некоторые другие ядерные
Слайд 15

Выбор модели замен Результаты вычисления эволюционных дистанций будут отличаться в зависимости от выбранной модели замен

Выбор модели замен

Результаты вычисления эволюционных дистанций будут отличаться в зависимости от

выбранной модели замен
Слайд 16

Выбор модели замен AIC — Akaike’s Information Criterion. Быстрее BIC —

Выбор модели замен

AIC — Akaike’s Information Criterion. Быстрее
BIC — Bayesian information

criteria. Не «любит» более сложные модели
DT — decision theory
LRT — тест соотношения вероятностей. «Любит» более сложные модели.
Слайд 17

Слайд 18

Методы реконструкции филогении

Методы реконструкции филогении

Слайд 19

Дистанционные методы Neghbor-joining Начинаем с пары ветвей, которые меньше всего отличаются между собой

Дистанционные методы Neghbor-joining

Начинаем с пары ветвей, которые меньше всего отличаются между собой

Слайд 20

Дистанционные методы Neghbor-joining

Дистанционные методы Neghbor-joining

Слайд 21

Дистанционные методы Neghbor-joining

Дистанционные методы Neghbor-joining

Слайд 22

Зачем нужна аутгруппа Молекулярно-филогенетические методы используют информацию о последовательностях внешней группы

Зачем нужна аутгруппа

Молекулярно-филогенетические методы используют информацию о последовательностях внешней группы (контроля),

дистанция от которой для всех остальных последовательностей заведомо выше, чем от других.
Таким образом дерево «укореняется», а также внутри дерева убирается «шум»
Слайд 23

Дистанционные методы Neghbor-joining Не учитываются обратные и параллельные замены => Мы

Дистанционные методы Neghbor-joining

Не учитываются обратные и параллельные замены
=> Мы считаем не настоящую

дистанцию (расстояние), а редакционное расстояние.
Вычислительно более быстрые.
В большинстве случаев оценивают только топологию дерева, не воспроизводя исходную последовательность.
Если у нас будет бесконечная последовательность, то мы с вероятностью 100% получим истинное дерево.
Слайд 24

Методы максимальной экономии Минимизация числа замен символов Всегда реконструируют предковые последовательности

Методы максимальной экономии

Минимизация числа замен символов
Всегда реконструируют предковые последовательности
Лучше работает на
небольших

наборах
последовательностей
во многих случаях
на больших объёмах
данных работает хуже.
Слайд 25

Методы максимальной экономии B C A B C A B C

Методы максимальной экономии

B

C

A

B

C

A

B

C

A

B

C

A

D

D

D

B

C

A

D

B

C

A

D

E

E

B

C

A

D

E

…………………

Step 1

Step 2

Step 3

Слайд 26

Слайд 27

Методы максимальной вероятности Так же, как и в случае с методами

Методы максимальной вероятности

Так же, как и в случае с методами максимальной

экономии, генерирует все возможные топологии деревьев
Предположение особой модели эволюции
В отличие от метода максимальной экономии может предполагать разную скорость эволюции и скорость замен в разных ветвях дерева
Поиск дерева с максимальной вероятностью существования, соответствующего данным
Чем больше последовательность, тем вероятнее найти истинное дерево
Самые медленные
Слайд 28

Методы максимальной вероятности В позиции j для каждого внутреннего узла допустимы

Методы максимальной вероятности

В позиции j для каждого внутреннего узла допустимы все

четыре нуклеотида, значит всего 4*4=16 возможных деревьев.
Каждое из деревьев это произведение вероятности возникновения какого-либо основания в корне дерева и вероятность его замены на тот, который в следующем узле. Т.е. частота нуклеотида умноженная на вероятность его мутации, если грубо.
A = 0.25 or средняя частота A в последовательности зависит от модели) ƒ A->C трансверсия = 10-6 and A->G транзиции = 2x10-6 ƒ
Вероятность T1 = 0.25 x 2x10-6 x 10-6 = 5x10-13
Вероятность всего дерева равна произведению вероятностей деревьев для каждой позиции в выравнивании
Слайд 29

Оценка поддержки дерева Bootstrap

Оценка поддержки дерева

Bootstrap