banner banner banner
Математические модели в естественнонаучном образовании. Том II
Математические модели в естественнонаучном образовании. Том II
Оценить:
Рейтинг: 0

Полная версия:

Математические модели в естественнонаучном образовании. Том II

скачать книгу бесплатно


 терминальных таксонов количество некорневых раздвоенных деревьев можно найти как

. Составьте таблицу значений и отобразите эту функцию для

.

5.1.5. Для

 терминальных таксонов количество корневых раздвоенных деревьев равно значению

. Составьте таблицу значений и отобразите эту функцию для

.

5.1.6. В этой задаче рассмотрим рассуждения, лежащие в основе формул для числа топологически различных деревьев, корневых и некорневых.

а. Предположим известно, что некорневое дерево с

 концевыми вершинами состоит из

 ребер. Объясните, почему некорневое дерево с

 концевыми вершинами будет иметь

 ребра. Подсказка: подумайте о том, как добавление еще одной конечной вершины в существующее дерево влияет на количество ребер.

б. Поскольку некорневое дерево с 2 концевыми вершинами имеет 1 ребро, объясните из пункта (а), почему некорневое дерево с

 концевыми вершинами будет иметь

 ребра.

в. Предположим известно, что существует

 некорневых деревьев с

 концевыми вершинами. Объясните, почему существует

 некорневых деревьев с

 концевой вершиной. Подсказка: подумайте, сколькими различными способами можно добавить еще одну конечную вершину к существующему дереву.

г. Поскольку существует только 1 некорневое дерево с 2 концевыми вершинами, объясните используя пункт (c), почему существует

 некорневых деревьев с

 концевыми вершинами при

.

д. Объясните, почему

.

е. Почему число корневых деревьев с

 концевыми вершинами такое же, как число некорневых деревьев с

 концевыми вершинами?

ж. Сделайте вывод о правильности формул в задачах 5.1.4 и 5.1.5.

5.1.7. Поскольку митохондриальная ДНК у человека наследуется исключительно от матери, она может быть использована для структуры, относящейся к любому количеству людей из разных этнических групп, предполагая, что все люди произошли от одной первой человеческой самки. В зависимости от модели кластеризации этнических групп, это может дать представление о физическом местоположении той женщины, которую иногда называют митохондриальной Евой.

В работе Канна 1987 года была впервые предпринята попытка определить местонахождение митохондриальной Евы в Африке. Поддерживая теорию происхождения человека «из Африки», было построено дерево с корнями, которое, как утверждается, показывает отношения между 147 людьми. Сколько топологически различных деревьев нужно было бы рассмотреть, если бы действительно рассматривалась каждая возможность? Возможно, для ответа на этот вопрос придется использовать формулу Стирлинга:

. Здесь символ «?» можно интерпретировать как «приблизительно». Изучению последствий трудности рассмотрения стольких деревьев посвятил свою работу Гиббонс в 1992 году.

5.1.8. Филогенез четырех терминальных таксонов A, B, C и D связан по определенному метрическому дереву. Суммарные расстояния между таксонами вдоль дерева оказались такими же, как в таблице 5.1.

Таблица 5.1.  Расстояния между таксонами для задачи 5.1.8

A            B            C            D

A            .6           .6           .2

B                           .4           .6

C                                          .6

а. Используя любой подход, который пожелаете, определите правильное некорневое дерево, относящееся к этим таксонам, а также все длины его ребер. Объясните, как исключили другие топологические деревья.

б. Можете ли определить корень дерева по этим данным? Объясните, почему да или почему нет.

Примечание: Методы решения такого рода проблем являются предметом следующих разделов.

5.2. Построение дерева дистанционными методами UPGMA и FM

При построении филогенетического дерева таксоны, которые хотим связать, обычно являются теми, которые живут в настоящее время. Есть информация, такая как последовательности ДНК, от терминальных таксонов и нет информации от тех, которые представлены внутренними вершинами. В действительности, даже не знаем, какие внутренние вершины должны существовать, потому что не знаем даже топологию дерева.

Первым классом методов построения филогенетических деревьев, которые обсудим, являются дистанционные методы. Они пытаются построить дерево, используя информацию, которая предположительно описывает общие расстояния между терминальными таксонами вдоль дерева.

Чтобы понять, как получить эти расстояния, представьте, что пытаемся найти эволюционные отношения четырех видов:

,

,

 и

. Выбирая тот или иной ортологичный участок ДНК из их геномов, получаем и выравниваем последовательности из каждого. Если модель замены оснований Джукса-Кантора, рассмотренная в главе 4, кажется подходящей для имеющихся данных, то вычисляем расстояния Джукса-Кантора между каждой парой последовательностей. Получатся оценки расстояний по дереву, которые сводим в Таблицу 5.2.

В зависимости от данных последовательности могли бы вместо этого принять другую модель подстановки оснований, что привело бы к использованию другой формулы расстояния, такой как в 2-параметрической модели Кимуры или логарифмическое расстояние. Несмотря на это, расстояние, которое вычисляем между последовательностями, считается мерой количества произошедших мутаций. Если бы эти расстояния были точной мерой количества произведенных мутаций, они бы соответствовали между конечными таксонами в найденном метрическом дереве.

Таблица 5.2.  Расстояния между таксонами

.45         .27         .53

.40         .50

.62

На самом деле даже не ожидаем найти дерево, которое точно соответствует имеющимся данным; в конце концов, расстояния выводятся из данных последовательности и не должны быть точно правильными. Более того, метод вывода расстояний зависел от модели, которая включала дополнительные предположения, которые, безусловно, не встречаются в реальных организмах. Надеемся, однако, что построенное дерево не будет слишком чувствительно к такого рода ошибкам на больших расстояниях.

Первый метод, который рассматриваем, называется методом среднего расстояния или, более формально, невзвешенным парно-групповым методом с арифметическими средними (UPGMA). Этот метод создает корневое дерево и предполагает наличие молекулярных часов. Самый простой способ понять алгоритм – это ознакомиться с примером его использования.

По приведенной выше таблицы данных выберем два ближайших таксона,

 и

. Поскольку они находятся на расстоянии 0,27 друг от друга, изобразим на рисунке 5.6 каждое ребро с длиной

.

Рисунок 5.6. UPGMA; шаг 1.

Затем объединяем

 и

 в группу и усредняем расстояния

 и

 до каждого отдельного таксона, чтобы получить расстояние от группы до этого таксона. Например, расстояние между группой

 и

 равно

, а расстояние между

 и

 равно

.  Таким образом, исходная таблица сводится к таблице 5.3.

Таблица 5.3.  Расстояния между групп; UPGMA, Шаг 1

.425       .575

.50

Теперь просто повторяем процесс, используя расстояния в таблице 5.3. Поскольку ближайшими таксонами и/или группами в новой таблице являются

 и

, которые находятся на расстоянии 0,425 друг от друга, то получаем рисунок 5.7.

Рисунок 5.7. UPGMA; шаг 2.

Ребро

 должно иметь длину

, в то время как другое новое ребро должно иметь длину

, потому что уже есть ребро длины

 для учета некоторого расстояния между

 и другими таксонами.

Снова объединив таксоны, формируем группу

 и вычисляем расстояние от неё до

 путем усреднения исходных расстояний от

 до каждого из

,

 и

. Это приводит к значению

. Обратите внимание, что это не то же самое, что усреднение расстояния от

 до

 и до

. Поскольку новая таблица расстояний будет иметь это значение в качестве единственной записи, нет необходимости приводить ее. Изобразим рисунок 5.8, считая, что расстояние от корня до

 равно

. Конечное ребро имеет длину. 0625, таким образом, помещаем оставшийся таксон на расстоянии