Кому мешает ДНК-генеалогия? - Анатолий Клёсов
Шрифт:
Интервал:
Закладка:
Как работает калькулятор Килина-Клёсова? Он многофункциональный, и здесь нет возможности объяснять все его функции, кроме основной – быстро производить расчеты по гаплотипам от любых коротких (вплоть до единичных, отдельных маркеров) до 111-маркерных, в количествах до 10 тысяч гаплотипов. Калькулятор моментально, в ходе расчетов, определяет степень диперсии аллелей по каждому маркеру, и показывает ее количественную величину. Можно выставлять пороговую величину степени дисперсии, тогда калькулятор выбрасывает соответствующие маркеры из расчетов. Это особенно полезно, когда серия гаплотипов содержит включения посторонних гаплотипов, или нижестоящих субкладов, у которых некоторые маркеры имеют другие значения, чем у основной серии. Например, в серии гаплотипов гаплогруппы R1a значение маркера DYS392 обычно имеет величину 11, а в отдельной ветви «Старая европейская ветвь» это значение равно в основном (или исключительно) 13. Калькулятор «знает», что маркер DYS392 настолько «медленный» (константа скорости мутации равна 0.0004 мутаций на маркер на условное поколение), что, например, для тысячи гаплотипов в среднем должно наблюдаться примерно 40 мутаций за сто условных поколений, потому что 40/1000/0.0004 =100 условных поколений. При увеличении количества аллелей DYS393=13 в серии гаплотипов, дисперсия возрастает и в итоге превышает граничную величину 2.6, обычно используемую при расчетах. При величине 2.61 маркер блокируется, оставляя все остальные – незаблокированные – функциональными. Если в рассматриваемой серии гаплотипов блокируются сразу несколько маркеров, то это указание на то, что что-то с выборкой не так.
Поправка на возвратные мутации в калькуляторе не вводится, она уже заложена в самом калькуляторе, как для линейного метода, так и квадратичного. Калькулятор на 111 маркеров может использоваться для расчетов гаплотипов в любом формате, включая 67-маркерные, но для удобства нами создана серия калькуляторов для 17-маркерных и для самых медленных, 22-маркерных гаплотипов.
Калькулятор может быть использован для комбинаций серий гаплотипов для любых форматов. Это возможно потому, что в квадратичном методе он считает «по вертикали», по маркерам, а в линейном – «по горизонтали», по гаплотипам.
Вопрос 75: Поясните, пожалуйста, суть логарифмического метода в ДНК-генеалогии.
Логарифмический метод – самый простой в исполнении. Несколько примеров расчетов логарифмическим методом были даны выше. Суть его заключается в том, что для серии гаплотипов берется отношение общего числа гаплотипов в серии к числу идентичных (базовых) гаплотипов в той же серии, далее берется натуральный логарифм этого отношения, и делится на константу скорости мутации в данном гаплотипе. После этого вводится поправка на возвратные мутации, поскольку они возвращают мутированные гаплотипы обратно в исходные немутированные, и тем самым занижают датировку времени жизни общего предка. Поправка на возвратные мутации рссчитывается исходя из числа базовых гаплотипов в серии.
Чем больше по численности серия гаплотипов, происходящих от одного предка, тем расчет времени до этого предка точнее. И тем больше экономия времени при расчетах, поскольку логарифмический метод не требует подсчета числа мутаций в гаплотипах. Например, если серия из сотни гаплотипов, скажем, 37-маркерных, содержит четыре одинаковых (то есть базовых) гаплотипа, то даже и без подсчета мутаций в гаплотипах можно сразу сказать, что общий предок этих ста гаплотипов жил 925±105 лет назад, потому что натуральный логарифм отношения 100/4, поделенный на константу скорости мутации для 37-маркерных гаплотипов (0.09 мутаций на гаплотип на условное поколение в 25 лет) равен 36 → 37 условных поколений, то есть общий предок этой сотни гаплотипов жил примерно 925 лет назад. Поскольку для четырех базовых гаплотипов погрешность расчетов составляет ±51 % (как это расчитывается – приводилось выше на примере четырех мутаций в серии гаплотипов), то общий предок для данной серии из ста гаплотипов жил 925±470 лет назад. Но, как уже обсуждалось выше, в любом случае, в том числе и в искаженных, неоднородных сериях, почти всегда можно найти одинаковые гаплотипы, и деление общего числа гаплотипов на случайное количество одинаковых гаплотипов всегда даст какое-то число, часто не имеющее отношения к числу лет или поколений до общего предка. Поэтому необходим критерий, что расчетные величины времен до общего предка действительно имеют смысл, и что серия гаплотипов действительно происходит от одного общего предка.
Этим критерием является совпадение (в пределах погрешности расчетов) времени до общего предка, рассчитанное как линейным (или квадратичным), так и логарифмическим методами. Например, если число мутаций во всех ста 37-маркерных гаплотипах будет равно, например, 324 (или близко к тому), тогда 324/100/0.09 = 36 → 37 условных поколений, то есть ровно тот же промежуток времени до общего предка. Совпадение времен до общего предка для «логарифмического» и «линейного» метода (в первом мутации не считаются, во втором считаются) свидетельствует, что закономерности образования мутаций в гаплотипах следуют кинетике первого порядка, что в свою очередь означает, что все сто гаплотипов действительно произошли от одного прямого общего предка. Популяционная генетика такими подходами не пользуется, они ей чужды по ряду причин, как обсуждалось выше.
Вопрос 76: На каком основании некоторые популяционные генетики критикуют логарифмический метод?
Во-первых, это не «некоторые популяционные генетики», а один Балановский. Во-вторых, это не «критика», а смех один. Характерно, что он, при полном, как правило, отсутствии культуры расчетов, нападает не только на логарифмический метод, но и на всё остальное в ДНК-генеалогии. Забавно наблюдать эту выраженную ущербность «нападающего». Вот, например, цитата из моей недавней статьи на Переформате[86]: «В ДНК-генеалогии есть логарифмический метод… И он вовсе не «неточный», как безграмотно заявил О. Балановский, в очередной раз показав свою некомпетентность. Неточным любой метод бывает тогда, когда используется неправильно. Неточным будет микроскоп, если его использовать для рассматривания звезд. На то есть телескоп, или хотя бы подзорная труба.
Чем больше по численности серия гаплотипов, происходящих от одного предка, тем расчет времени жизни этого предка точнее. И тем больше экономия времени при расчетах, поскольку логарифмический метод не требует подсчета числа мутаций в гаплотиипах. Например, из 3466 12-маркерных гаплотипов субклада R1b-L21 249 гаплотипов являются базовыми, то есть идентичными друг другу. Это дает [ln(3466/249)]/0.02 = 132 → 152 условных поколений, или 3800±450 лет до общего предка. Расчет по мутациям для этой же серии гаплотипов 3841±384 лет по 67-маркерным гаплотипам и 3810±381 лет по 111-маркерным гаплотипам. Разницы между логарифмическим и линейным (то есть по мутациям) методами расчета практически нет, на уровне сотых долей процента, хотя погрешность расчетов ее увеличивает.
Ну, и где здесь «неточный» логарифмический метод? И это говорит тот, ошибки у которого в расчетах датировок систематически равны как минимум 250–350 %».
Уж как Балановскому не нравится логарифмический метод! Он уже стал для Балановского идеей-фикс. Недавно Балановский объявил, что метод настолько «неточный», что я от него сам отказался… Казалось бы, откуда такая зацикленность на методе, который к нему, Балановскому, никакого отношения не имеет? Который он никогда не применял, видимо, потому, что не знает, что такое логарифм. А ответ прост – это злоба середнячка на что угодно новое, оригинальное, прогрессивное.
Еще цитата на ту же тему: Балановский объявил, что «технические методы «ДНК-генеалогии» вовсе не оригинальны, представляя собой обычный метод молекулярных часов с рядом простейших модификаций…С его точки зрения, технические аспекты «ДНК-генеалогии» являются «малоэффективными, но приемлемыми»…».
«С «молекулярными часами» мы уже разобрались. На что ни пойдет безграмотный человек, чтобы дискредитировать грамотного… пустится во все тяжкие, включая и свой позор на публике. Так что же такое «ряд простейших модификаций»? Введение впервые в оборот серии констант скоростей мутаций, нигде и никогда раньше не публиковавшихся? Введение в оборот логарифмического метода, совершенно незнакомого ранее попгенетикам? Введение в оборот поправок на возвратные мутации, о которых попгенетики говорили, но никто и никогда не рассчитывал и не применял? Введение в оборот калибровок констант скоростей мутаций?
Не знаю как для кого, а для меня ясно, что О. Балановский, будучи «на автопилоте» желания дискредитировать, себя уже не контролировал. Он что-то произносил, главное, чтобы было негативное, но смысла сам не понимал. Это – не наука, это и есть лженаука в исполнении О. Балановского, как и другого доктора, Е. Балановской.