Кому мешает ДНК-генеалогия? - Анатолий Клёсов
Шрифт:
Интервал:
Закладка:
Возвращаемся к «быстрым» скоростям мутаций. В маркере DYS710 в рассмотренном выше списке из 3466 гаплотипов (и, соответственно, аллелях данного маркера) наблюдается следующая картина распределений:
29 – 1 (то есть аллель 29 встречается в 3466 маркерах DYS710 всего один раз)
30 – 21 раз
31 – 49 раз
32 – 93
33 – 427
34 – 808
35 – 1058
36 – 759
37 – 182
38 – 50
39 – 17
40 – 1 раз
Видно, что картина мутаций значительно более «размазанная» по сравнению с медленными константами скоростей. Считая, что все мутации одношаговые, получаем 3594 мутации на 3466 аллелей DYS710 за те же 152 условных поколения, прошедших со времени жизни общего предка этих гаплотипов. Мы видим, как высокие скорости мутаций «размазывают» распределение мутированных аллелей в широком диапазоне. Если при минимальной скорости мутаций в DYS472 сохранились неизменными 3461 предковые аллели в гаплотипах 3466 потомков (константа скорости мутации 0.000008 на условное поколение), и в DYS617 сохранились неизменными 2921 предковые аллели в гаплотипах 3466 потомков (константа скорости мутации на в 63 раза выше, 0.0005 на условное поколение), то в случае самого «быстрого» маркера сохранились всего 1058 предковые (базовые) аллели, и число мутаций равно 3594 вместо 5 в DYS472, то есть в 700 с лишним раз больше. Константа скорости мутации была бы равна 3594/3466/152 (без учета поправки на возвратные мутации), то есть была бы равна примерно 0.0068 мутаций на условное поколение. Но из-за высокой скорости мутаций настолько много, что отношение числа мутированных аллелей к общему числу аллелей превышает единицу (3594/3466 = 1.037), и поправки на возвратные мутации «захлебываются», дают заниженные показатели, и в целом перестают работать. Формальный расчет по формуле, приведенной выше, показывает, что число возвратных мутаций здесь практически равно числу «прямых» мутаций, и полученную величину 0.0055 нужно удвоить. В действительности усредненная контанта скорости мутации этого маркера по разным гаплогруппам равна 0.0073 на условное поколение (25 лет), и она приведена в таблице выше.
Еще пример относительно «быстрого маркера» – это DYS534. В том же списке из 3466 гаплотипов (и, соответственно, аллелях данного маркера) наблюдается следующая картина распределений:
12 – 3 раза
13 – 48
14 – 524
15 – 1574
16 – 1043
17 – 229
18 – 43
19 – 2
Считая, как обычно, что все мутации одношаговые, получаем 2267 мутаций на 3466 аллелей DYS534 за те же 152 условных поколений, прошедших со времени жизни общего предка этих гаплотипов. Мы видим, что по сравнению с самым «быстрым» маркером DYS710 (в котором сохранились всего 1058 предковых (базовых) аллелей, и число мутаций равно было 3594, в случае DYS534 сохранилось 1574 предковых аллелей, и общее число мутаций равно 2267. Давайте посмотрим, что получится в этом случае. Константа скорости мутации, получаемая из экспериментальных данных, равна 2267/3466/152 (без учета поправки на возвратные мутации), то есть равна примерно 0.00430 мутаций на условное поколение. Моделирование дает среднюю константу скорости 0.00315 мутаций на условное поколение по разным гаплогруппам.
Таким образом можно проводить расчет констант скоростей мутаций, используя большие серии гаплотипов. Но работа на этом не заканчивается, потому что серии гаплотипов могут быть искаженными, включать примеси из других серий, с другим общим предком, включать другие субклады, с другим распределением аллелей по частотам, и так далее. Поэтому получаемые значения констант скоростей мутаций необходимо калибровать по известным документальным генеалогиям, опять желательно по нескольким. Как это делается, мы увидим в следующем разделе.
Вопрос 69: Насколько константы скоростей мутаций, определенные в разных регионах мира, надежны для проведений расчетов в ДНК-генеалогии? Что такое «калибровка» констант скоростей мутаций?
Приведу некоторую аналогию – а насколько надежны расчетные скорости (на самом деле – константы скоростей) радиоактивного распада соответствующих веществ? Влияют ли на них регионы планеты, где проводятся измерения? Любой образованный человек ответит – конечно, нет, не влияют. Скорость распада радиоактивных материалов определяется исключительно «внутренними» свойствами вещества, а не внешними воздействиями. Это – фундаментальные показатели. Вот так же должен отвечать каждый образованный человек на соответствующий вопрос о константах скоростей мутаций в гаплотипах. Это – фундаментальные показатели. Никакие регионы, питание, физические упражнения, национальность, гражданство или партийная принадлежность на них не влияют. Естественно, речь здесь идет о нормальных условиях, а не, скажем, в условиях солнечного ядра, или при смертельных уровнях радиации.
Итак, мутации в гаплотипах потомков расходятся от предкового гаплотипа как круги по воде, число мутаций легко рассчитывается, и они подчиняются довольно простым количественным закономерностям. Для кругов на воде, расходящихся от места, куда был брошен камень, легко рассчитать, когда был брошен камень, если знать скорость распространения волны и место нахождения круговой волны в данный момент времени. Чем больше прошло времени – тем дальше круги ушли, тем больше они разошлись. Так и в гаплотипах – чем больше время, прошедшее от общего предка, тем больше мутаций накопилось в гаплотипах его потомков. Число этих мутаций связано с временем, прошедшим от общего предка, с числом гаплотипов в серии, и с константой скорости мутации в гаплотипах, и выражается простой формулой: n/N = kt, где n – число мутаций в серии из N гаплотипов, k – константа скорости мутации (в числе мутаций на гаплотип за условное поколение, равное 25 лет), t – число условных поколений, с табличной поправкой на возвратные мутации[75]. На сотнях и тысячах примеров показано, что эта формула работает при любом числе гаплотипов и мутаций в них, и при любом времени, прошедшем от общего предка рассматриваемых гаплотипов. Однако при очень больших временах, более 10–20 тысяч лет, и особенно более 100 тысяч лет, нужно использовать гаплотипы с «медленными» маркерами, то есть с малыми константами скоростей мутаций, и тем самым снижать число мутаций и число возвратных мутаций. По аналогии, вряд ли целесообразно изучать скорости радиоактивного распада элементов со временами полураспада в тысячелетия, используя секундомер. Или пытаться изучать круги на воде за километры от места, куда был брошен камень, для этого нужно значительно более мощное воздействие. Как всегда, нужен конкретный анализ в конкретной ситуации, единых подходов на все случае жизни не бывает. Варианты конкретного анализа в конкретных ситуациях и рассматривает ДНК-генеалогия. Некоторые ситуации и расчеты мы рассмотрим ниже.
Теперь вопрос – насколько надежны величины констант скоростей мутации в соответствующих маркерах Y-хромосомы? Они надежны настолько, насколько надежно их определяют, калибруют, проверяют исследователи. Когда это делают популяционные генетики – совершенно ненадежны, они это показали последними двадцатью годами их так называемых «исследований». Они до сих пор так и не знают, какие значения эти константы имеют. Они до сих пор, в академических статьях 2015 года, продолжают использовать «скорости Животовского»[76]. Причем «на полном серьезе» обсуждают, что на временах до 5 тысяч лет эти «скорости» сильно завышают датировки, и вот на временах 40–60 тысяч лет подходят в самый раз. Они так и не поняли, что 23-маркерные гаплотипы на временах 40–60 тысяч лет вообще не применимы, там больше половины столь «быстрых констант скоростей», что они вообще не работают, потому что мечутся как белка в колесе. Это все равно, что секундомером измерять астрономические явления продолжительностью в тысячи и миллионы лет. И попгенетики этого так еще и не поняли!
Иногда принцип датировки «разбега» мутаций в гаплотипах с течением времени называют «принципом молекулярных часов». Смысл в этом есть, но примитивный. Дело не в том, что часы, а в том, чтобы правильно ходили. Любая реакция в химических или биологических системах, описываемая константой скорости первого порядка, есть «обычные молекулярные часы», поскольку связана с хронологией процесса на молекулярном уровне. Динамика любого такого процесса связана с временем согласно формуле с = с0е-kt, где c0 – исходное состояние системы (например, начальное количество или концентрация изучаемого вещества; количество гаплотипов Y-хромосомы в изучаемой выборке, и т. д.), с – состояние системы в определенный момент времени t (где t – время прошедшее с начала реакции, t-to), или количество базовых, то есть исходных гаплотипов в изучаемой выборке в настоящее время, спустя время t, прошедшее со времени жизни общего предка изучаемой серии гаплотипов), k – константа скорости реакции (мутаций, в данном случае). Эту же формулу можно переписать в виде ln(co/c) = kt, и она становится выражением логарифмического метода анализа выборок гаплотипов в ДНК-генеалогии. Берем, скажем, сто или тысячу гаплотипов, или любое другое их число, делим на число базовых (то есть одинаковых, идентичных друг другу гаплотипов, суть предковых гаплотипов, которые не успели мутировать за время t, прошедшее со времени жизни общего предка), берем натуральный логарифм (ln), и получаем произведение kt, то есть константу скорости мутации, помноженную на число лет, прошедшее со времени жизни общего предка, или на число условных поколений, опять же прошедших после общего предка – в зависимости от того, выражали константу скорости в годах, или в поколениях.