Кому мешает ДНК-генеалогия? - Анатолий Клёсов
Шрифт:
Интервал:
Закладка:
Вопрос 15. После изложения основ ДНК-генеалогии и ее отличий от популяционной генетики, подведите, пожалуйста, итоги по значимости ДНК-генеалогии, о том, как она появилась и какие в этой области Ваши самые значимые публикации.
Итак, речь здесь идет о новой науке, которая только создается, основы которой только закладываются в последние годы. Если точнее, то основы этой новой науки уже созданы, причем стремительно[16], и идет прогрессивное накопление экспериментального материала. Новый материал поступает потоком, ежедневно в базы данных уходят десятки и сотни новых «экспериментальных точек», которые по принципу обратной связи корректируют методологию новой науки, что приводит к уточнению методов расчета.
Имя этой науки – ДНК-генеалогия. Ее экспериментальные данные – это картина мутаций в нерекомбинантных участках мужской половой хромосомы (на самом деле – и в митохондриальной ДНК, но в этой книге речь пойдет в основном о Y-хромосоме, более информативной для исторических исследований), причем картина мутаций как в Y-хромосомах отдельных людей, так и их групп, популяций. Методология новой науки – перевод динамической картины мутаций в хронологические показатели, во времена жизни общих предков популяций, а на самом деле – общих предков древних родов и племен. То есть фактически производится расчет времен, когда в древности жили эти рода и племена[17]. Более того, расчеты показывают, как эти времена меняются от территории к территории, что может указывать на направления древних миграций[18].
Мутации, рассматриваемые в ДНК-генеалогии – это или одиночные (как правило) замены нуклеотидов в ДНК, как, например, аденин на цитозин, или цитозин на тимин, или вставки нуклеотидов, или делеции, или мутации более сложные, при которых ошибка копирующего фермента приводит к переносу в Y-хромосоме целого блока нуклеотидов, тандемного, как его порой называют. Это дает или удлинение серии таких блоков на один (редко – сразу на два-три блока), или их укорачивание. Первые мутации – SNP (Single Nucleotide Polymorphism, или в переводе «одиночные нуклеотидные вариации»), или «снипы», обычно очень стабильны, и их для ДНК-генеалогии отбирают только такие, которые случаются только один раз (два раза – максимум) за историю человечества. Поэтому они являются маркерами родов человечества. Примеры будут даны ниже.
Мутации второго типа – STR (Short Tandem Repeats, или «короткие тандемные повторы») – значительно более быстрые, и происходят в определенных участках, или локусах, или маркерах (это все синонимы) Y-хромосомы ДНК раз в несколько десятков или сотен поколений. Набор этих маркеров составляет гаплотип, примеры гаплотипов будут даны ниже. Гаплотип – это по сути цепочка чисел, показывающих число повторов в определенных маркерах.
Естественно, чем длиннее гаплотип, тем выше вероятность того, что в нем произойдет мутация. Мы уже поясняли выше, что мутация в гаплотипах – это результат ошибки в копировании блоков нуклеотидов, тех самых «коротких тандемных повторов», биологической системой копирования ДНК в клетке. Поскольку этих «коротких тандемных повторов» в Y-хросомоме многие тысячи (выше показано 431 таких повторов, и это только среди 10 миллионов нуклеотидов Y-хромосомы, этот размер определяется методологией исследования; всего же в Y-хромосоме примерно 58 миллионов нуклеотидов, или, точнее, нуклеотидных пар, но не будем здесь вдаваться в излишние подробности). Отсюда можно заключить, что таких «тандемных повторов» в Y-хромосоме может быть примерно 2500, и это, видимо, максимально возможный размер гаплотипа. Каждый «тандемный повтор», то есть маркер, мутирует, то есть копирующая система ошибается при копировании протяженных гаплотипов, с вероятностью примерно 0.00178 раз в поколение при протяженнности поколения 25 лет, или раз в 560 поколений, или раз в 14 тысяч лет. Здесь надо сделать два замечания. Во-первых, эта скорость мутации, раз в 14 тысяч лет – средняя величина, рассчитанная по большому числу маркеров. Чем короче гаплотип, тем реальная скорость мутации более отклоняется от средней величины. Во-вторых, величина поколения в 25 лет в ДНК-генеалогии называется условным поколением, она – сугубо математическая величина. Если кому-то больше нравится брать 30 лет за поколение, то вероятность мутации на 30 лет составит примерно 0.00214, или раз в 468 поколений (по 30 лет), или раз в 14 тысяч лет. Как видим, конечный результат получается точно такой же. Более подробно это будет показано ниже.
Поэтому долгие споры, которые популяционные генетики ведут уже многие десятилетия, а именно, сколько лет брать на поколение, не имеют большого смысла, да ни к чему так и не привели. Они просто не очень знакомы с понятием константы скорости мутации (k), а она в расчетах всегда помножена на протяженность поколения (t). Поэтому протяженность поколения нельзя брать произвольно, как захотим, она завязана на константу скорости мутации. Если взять 25 лет на поколение для одной константы скорости мутации, 30 лет – для другой константы, 20 лет на поколение для еще одной константы, но конечный результат получается один и тот же. Потому что это произведение (kt) калибруется по известным генеалогиям и историческим событиям.
Как было отмечено выше, мутация в каждом маркере в среднем происходит раз в 14 тысяч лет, но в гаплотипах, то есть определенных наборах маркеров, мутации происходят со следующими средними скоростями:
– в 6-маркерном гаплотипе она происходит (на весь гаплотип) в среднем раз в 135 условных поколений, или раз в 3380 лет (в этом коротком гаплотипе маркеры мутируют более медленно, чем в других гаплотипах),
– в 12-маркерном – раз в 50 поколений, или в 1250 лет,
– в 25-маркерном – раз в 22 поколения, или в 550 лет,
– в 37-маркерном – раз в 11 поколений, или в 275 лет,
– в 67-маркерном – раз в 8 поколений, или в 200 лет,
– в 111-маркерном – раз в 5 поколений, или в 125 лет,
– в 431-маркерном гаплотипе – примерно раз в поколение, или, точнее, раз в 33 года.
Ясно, что мутаций в протяженных гаплотипах будет больше, чем в коротких за тот же промежуток времени, и изучение истории популяций, принимая в расчет число мутаций, случившихся со времени жизни общего предка популяции, будет точнее.
Поясним это на простом примере. У автора этих строк есть коллега, родом из Белоруссии, и, как показали исследования, мы с ним принадлежим не только к одному роду, то есть не только к одной гаплогруппе (это будет пояснено ниже), но и к одному славянскому племени. Мы не знаем точно, как оно называлось в древности – поляне, или древляне, или вятичи, или кривичи (а кривичи были как минимум смоленские, изборские и северные), или дреговичи, полочане, ильменские словене, радимичи, северяне, волыняне или бужане, тиверцы, уличи, белые хорваты или какие другие. В ДНК-генеалогии наше племя (или племена) носит название «восточно-карпатская ветвь гаплогруппы R1a», и дальше идут символы, детализирующие восточно-карпатскую ветвь на много уровней, на которые расходилось это племя, продолжая ДНК-линию патриарха племени, то есть сохраняя в своей Y-хромосоме специфические, уникальные мутации патриарха. Естественно, чем древнее жил патриарх, тем больше мутаций накапливается в гаплотипах его потомков по сравнению с его гаплотипом.
Так вот, в 6-маркерном формате наши с коллегой из восточнокарпатской ветви гаплотипы выглядят так:
16 12 24 11 11 13
16 12 25 11 11 13
Между ними – одна мутация, что соответствует 1/0.0074 = 135 → 156 условных поколений, или 3900 лет, то есть наш общий предок жил примерно 3900/2 = 1950 лет назад. Надо отметить, что 6-маркерные гаплотипы весьма неточны, для показа чего и служит этот иллюстративный пример. Здесь 0.0074 мутаций на гаплотип – контанта скорости мутации для 6-маркерных гаплотипов, стрелка – табличная поправка на возвратные мутации[19].
В 12-маркерном формате:
13 24 16 11 11 15 12 12 10 13 11 30
13 25 16 11 11 14 12 12 10 13 11 29
Здесь между двумя гаплотипами уже три мутации, что дает 3/0.02 = 150 → 176 условных поколений, или 4400 лет, то есть общий предок жил примерно 2200 лет назад. Здесь 0.02 мутаций на гаплотип – контанта скорости мутаций для 12-маркерных гаплотипов. Вариация датировок, примерно 13 %, находится в пределах обычной погрешности расчетов, хотя гаплотипы короткие, мутаций мало.
В 25-маркерном формате:
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16 16
13 25 16 11 11 14 12 12 10 13 11 29 15 9 10 11 11 25 14 20 32 12 15 15 16
Здесь между двумя гаплотипами 9 мутаций (мутации между последними четверками гаплотипов считаются по определенным правилам, для так называемых мультикопийных маркеров, там всего две мутации), что дает 9/0.046 = 196 → 242 условных поколений, или 6050 лет, то есть общий предок жил примерно 3025 лет назад. Здесь 0.046 мутаций на гаплотип – контанта скорости мутаций для 25-маркерных гаплотипов. Вариация датировок по первым трем форматам гаплотипов уже заметна, и достигает 55 % (1950, 2200, и 3025). Может показаться, что чем длиннее гаплотипы, чем древнее общий предок, но это не так. В 37-маркерном формате