Кому мешает ДНК-генеалогия? - Анатолий Клёсов
Шрифт:
Интервал:
Закладка:
Но когда расчет ведется по всем маркерам сразу, а не его индивидуальным величинам, то число аллелей и мутаций в них идет на тысячи, и погрешность получаемого «возраста» резко снижается, но никогда не становится меньше, чем погрешность определения константы скорости мутации. Последняя обычно принимается за ±10 %, хотя определенно меньше этой величины, как пояснено выше.
Вопрос 55: Что такое «снип» в ДНК-генеалогии?
СНИП, «гаплогруппо-образующая мутация», от английского сокращения SNP (Single Nucleotide Polymorphism), практически необратима, происходит, как правило, на одном нуклеотиде, превращая один нуклеотид в другой, несвойственный для данной последовательности ДНК. Это приводит к появлению своебразной «метки», которая практически навсегда наследуется потомками. Именно поэтому каждый род (в понятиях ДНК-генеалогии) носит характерную метку и может быть надёжно и количественно отличим один от другого. Снипы обозначают индексами, например, Z280 (это – «входная» мутация для ДНК большинства этнических русских гаплогруппы R1a), M343 («входная» мутация в гаплогруппу R1b), L21, что эквивалентно снипу S145 (мутация, определяющая один из наиболее распространных субкладов в центральной и западной Европе), и так далее. Первая буква снипа показывает, в каком научном коллективе снип идентифицирован. Наиболее используемые индексы следующие:
• М, лаборатория под руководством Peter Underhill, Stanford University (США);
• Р, лаборатория, руководимая Michael Hammer, University of Arizona (США);
• S, лаборатория, руководимая James F. Wilson, Edinburgh University (Шотландия);
• L, исследовательский центр под названием Family Tree DNA's Genomics Research Center (США).
• U, университет центральной Флориды (Lynn M. Sims и Jack Ballantyne) и университет Gonzaga (Dennis Garvey);
• V, университет La Sapienza, Rosaria Scozzari and Fulvio Cruciani (Рим, Италия);
• CTS, лаборатория Chris Tyler-Smith, The Wellcome Trust Sanger Institute, Hinxton (Англия)
• Page, David C. Page, Whitehead Institute for Biomedical Research
• Z и DF, международная группа независимых исследователей, работающих с геномными базами данных
• А, Thomas Krahn, YSEQ.net, Houston, Texas (США)
• FGC, Full Genomes Corp. of Virginia and Maryland (США)
• Y и YP, группа независимых исследователей Y Full Team, работающих с геномными данными
• BY, группа Big Y, компания Family Tree DNA, Houston, Texas (США)
• F, лаборатория Li Jin, Fudan University, Shanghai (Китай)
• KMS, группа российских и международных исследователей
• N, лаборатория биоинформатики, Institute of Biophysics, Chinese Academy of Sciences, Beijing (Китай)
• PK, Biomedical and Genetic Engineering Laboratories, Islamabad (Пакистан).
Вопрос 56: Как измеряют скорости мутаций в ДНК-генеалогии?
СКОРОСТЬ МУТАЦИИ, средняя частота изменения числа повторов в маркере, обычно измеряется в числе мутаций на условное поколение в 25 лет. Средняя скорость мутаций составляет 0.00167 и 0.00183 на маркер на условное поколение для первых 12-ти и 25-ти маркеров в стандартном формате гаплотипов (см. выше), соответственно. Для первых 37-и маркеров средняя скорость мутаций составляет 0.00243 на маркер на поколение, для первых 67, 111 и 409 маркеров (см. ниже) – 0.00178-0.00179 мутаций на маркер на поколение. В неопределённых ситуациях для полуколичественной оценки часто принимается в виде «канонической» величины 0.002 мутаций на маркер на условное поколение.
В реальных условиях скорости мутаций иногда измеряют по мутациям в гаплотипах в одном поколении на большом числе пар отец-сын. Однако полученные данные не могут быть использованы для практических расчетов, так как даже при столь большом количестве, как 1700 пар отец-сын почти в половине изученных маркеров мутаций или не наблюдалось (и таких маркеров было большинство), или наблюдались всего одна-две мутации, что явно не дает приемлемой статистики.
Еще пример – при сравнительном изучении 1752 пар гаплотипов в 17-маркерном формате было выявлено 84 мутации. Из них 83 были одношаговые (98,8 %) и одна – двухшаговая (1,2 % от всех). Поскольку все 1752 гаплотипа содержали 1752 х 17 = 29784 маркера, то средняя скорость мутаций соответствовала 84/29784 = 0.00282 мутации на маркер на поколение, медиана была равна 0.0025 мутации на маркер на поколение. Из этих 84 мутаций 43 мутации были «вверх» (число повторов в аллели возросло) и 41 – «вниз». Самая высокая скорость мутаций была в маркере DYS458 (0.0074 мутаций за поколение), самая низкая – в маркере DYS448 (0.0003 мутаций за поколение, то есть примерно в 25 раз медленнее). Когда все отцы были подразделены на две (неравные) группы – те, у кого произошла мутация в гаплотипах, и те, у кого мутаций не было, то средний возраст первых и вторых составил – при рождении сына – 34.4±11.6 лет (округленно 34±12) и 30.3±10.2 лет (округлённо 30±10). Хотя разница в возрасте и имела место, эти величины находятся в пределах погрешности эксперимента. Объединение всех опубликованных данных подобных экспериментов выявило 331 мутацию на 135212 маркерах, то есть средняя скорость оказалась равна 0.00244 мутации на маркер за поколение. При сопоставлении скоростей мутаций с генеалогическими данными и историческими событиями (при калибровке) средняя скорость мутаций в 17-маркерных гаплотипах составила 0.0020 мутаций на маркер на поколение.
Эти оценки в целом приемлемы для расчетов, но только полуколичественно. Дело в том, что 84 мутации для 1752 пар гаплотипов – это неважная статистика. Мало того, что 84 мутации – это на самом деле 84±9 мутаций с 68 %-ной доверительностью, и 84±18 мутаций с 95 %-ной доверительностью, но это только для 17-маркерных гаплотипов, то есть для более протяженных (да и для более коротких) гаплотипов эти константы неприменимы. Далее, при 84 мутациях на 1752 пар гаплотипах и при 17 маркерах даже при относительно высоких скоростях мутаций в отдельных маркерах на них приходилось всего несколько мутаций. Например, в маркере DYS458, в котором наблюдалось максимальное количество мутаций, их было всего 13, что дало константу скорости мутации 13/1752 = 0.0074 мутаций на маркер на поколение. В другой серии экспериментов по парам отец-сын получили величину константу скорости мутации 0.0084 мутаций на тот же маркер на поколение. В наших исследованиях по 11 тысячам гаплотипов мы получили величину 0.0062 мутаций на маркер на поколение[56]. Но с такими экспериментами, как в цитируемой статье, дело на самом деле хуже – например, сообщенную в статье величину константы скорости мутации 0.0003 для DYS448 получить вообще нельзя, так как даже при одной мутации на все 1752 пары отец-сын получится 1/1752 = 0.0006, то есть скорость вдвое выше. На самом деле ошибка получилась из-за статистически малого числа мутаций. По нашим данным, в маркере DYS448 константа скорости мутаций равна 0.0014 мутаций на маркер за поколение, то есть для 1752 пар отец-сын авторы эксперимента должны были получить 2.45 мутации, то есть 2.45/1752 = 0.0014. Но 2.45 мутаций получить невозможно, можно две или три, но авторы и этого не получили, что неудивительно. Если бросить монету два или три раза, никакой статистики не получится.
Вопрос 57: Какова средняя скорость мутаций не на маркер, а на гаплотип?
СРЕДНЯЯ СКОРОСТЬ МУТАЦИИ НА ГАПЛОТИП, для первых 6-ти маркеров в «научном формате», DYS19, 388, 390, 391, 393, 393 – 0.0074 мутаций на гаплотип на поколение, для первых 12-ти маркеров (первая панель маркеров в формате
FTDNA) – 0.020 мутации на гаплотип на поколение, для первых 25-ти маркеров – 0.046 мутаций на гаплотип на поколение, для первых 37-ти маркеров – 0.09 мутаций на гаплотип на поколение, для 67-ми маркеров – 0.12 мутаций на гаплотип на поколение, для 111 маркеров – 0.198 мутаций на гаплотип на поколение. Отсюда сразу можно заключить, что если два 67-маркерных гаплотипа отличаются, например, на 6 мутаций, то они разошлись от общего предка, который жил 6/2/0.12 = 25 поколений назад, или 625 лет назад. Однако для таких расчётов надо знать, что оба гаплотипа относятся к одной гаплогруппе и одному субкладу, и понимать, что для двух гаплотипов и столь немногих мутаций подобные расчёты могут быть только оценочными. Например, в данном конкретном случае оценка равна 625±260 лет с 68 %-ной надёжностью.
Вопрос 58: Что такое «бутылочное горлышко популяции» и какова его значимость в ДНК-генеалогии?
«БУТЫЛОЧНОЕ ГОРЛЫШКО» ПОПУЛЯЦИИ – это резкое или медленное сокращение популяции до критической численности, после чего популяция либо выживает (проходя «бутылочное горлышко»), либо терминируется. Причинами «бутылочного горлышка» могут быть события, катастрофические в отношении популяции (природные катаклизмы, эпидемии, войны), либо медленное вымирание популяции. Обычно выжившая популяция «обнуляет» набор своих мутаций в гаплотипах до гаплотипа выжившего члена популяции, давшего выжившее мужское потомство, и он становится «общим предком» для потомков. Исследования показывают, что многие популяции в прошлом имели пульсирующий характер и многие популяции терминировались, не проходили «бутылочное горлышко». Многие древние популяции остались во «фрагментах», в серии относительно недавних популяций, «кластеров», которые очень значительно отличаются друг от друга по гаплотипам, оставаясь внутри одной и той же гаплогруппы. Примеры – гаплотипы американских индейцев, африканские гаплотипы, гаплотипы Русской равнины, ряд европейских гаплотипов.