Кому мешает ДНК-генеалогия? - Анатолий Клёсов
Шрифт:
Интервал:
Закладка:
Итог – тяжелый случай с Балановским, и он еще книги садится писать по вопросу, в котором не разбирается.
Отступление про «генотип» и «генофонд»
По Балановскому, «прямой подсчет состоит в сравнении генотипов родителей и их потомства». Уже неряшливо, а по сути – неверно. Кстати, Балановский так и не написал, «прямой подсчет» – чего? Ну да ладно, косноязычность – это его визитная карточка. Здесь дело хуже. Генотип – это совокупность генов данного организма, а Балановский говорит о «STR-маркерах Y-хромосомы». Это та же неряшливость, с которой Балановские постоянно говорят про «генофонд», адресуясь к мутациям в нерекомбинантных участках Y-хромосомы.
Эти термины «генотип», «генофонд» в исполнении Балановских – или вопиющая безграмотность, или совершенно расхлябанный жаргон. Они, Балановские, повсюду используют термин «генофонд», относя его к гаплогруппам, субкладам и гаплотипам. Они не понимают, или не знают, или пренебрегают точностью понятий, что генофонд – это совокупность генов. Даже Википедия это знает, цитирую – «Генофонд (также генный пул, пул генов – англ. «genepool»)». Понятие генофонда сформулировал еще в 1928 году А.С. Серебровский, цитирую – «Совокупность всех генов данного вида… я назвал генофондом». Нет в гаплотипах и гаплогруппах генов, никакой это не генофонд.
Балановские же от статьи к статье, от высказывания к высказыванию называют снипы (!) «генофондом». Очередной пример, из десятков и сотен, в недавней статье в сборнике «Археология, этнография и антропология Евразии» (Том 43, № 2, 2015), статья называется (привожу только часть названия) «Структура генофонда по данным маркеров Y-хромосомы». В авторах – Е. Балановская. И дальше, первая фраза Абстракта «Изучен генофонд популяции по SNP-маркерам Y-хромосомы». Категорически неверно. Я уже не говорю, что здесь безграмотность еще и в другом – не пишут в Абстракте «изучено то-то», пишут, что именно обнаружили, нашли, какие выводы сделали. Не пишут в Абстракте «мы собирали грибы», пишут «мы нашли 8 кг грибов», если уж объяснять на пальцах. Но Балановская и эти элементарные вещи не знает, научная школа напрочь отсутствует.
Они, конечно, сейчас начнут воздевать руки, причитать, что наука движется вперед, и А.С. Серебровский им не указ, уже и не гены в попгенетике называют генами – я с ними спорить на этот счет не собираюсь по простой причине – попгенетика себя уже настолько дискредитировала, что этот «генофонд» в применении к снипам всего лишь яркая заплата на ветхом рубище попгенетики, так сказать. Но яркая, показательная.
И еще про «скорость мутирования» по БалановскомуВозвращаемся по сути к некорректной фразе Балановского – «для определения скорости мутирования… возможны два подхода: прямой подсчет и калибровка». На самом деле это неверно – нет «прямого подсчета» без калибровки. «Прямой подсчет» – это, видимо, подсчет числа мутаций в парах отец-сын, хотя и этого Балановский не говорит, не умееет прямо излагать. По Балановскому, «хотя мутации случаются редко, но при больших выборках можно обнаружить достаточное их количество». Поскольку примеров он никогда не дает, изъясняется косноязычно, вязко, мутно, то не поясняет, что такое «при больших выборках» и что такое «достаточное количество». А это – ключевые понятия, в которых Балановский понятия не имеет, извините за каламбур.
Придется опять привести конкретные примеры, раз он не может, не владеет материалом. То, к чему призывает Балановский, было описано в статье[270], в которой на 1300–1800 парах отец-сын (такой разброс – потому что для каждого маркера число пар отец-сын различалось) определяли, сколько в каждом маркере произошло мутаций между отцом и сыном, то есть буквально за одно поколение. Авторы ставили своей задачей определить число мутаций за поколение для всех 111 маркеров, которые составляют общую панель маркеров. Но сразу же возникла проблема, о которой Балановский не упоминает ни слова, но мы уже привыкли к его уклончивому и вязкому стилю. Из 111 маркеров в итоге не изучались 24 маркера, в 17 маркерах мутаций вообще не было, в 15 маркерах прошла всего одна мутация – то есть 56 маркеров из 111 оказались совершенно непригодными для количественного определения скоростей мутаций. А поскольку еще в 11 маркерах прошли всего две мутации, то почти две трети всех маркеров были непригодны для определения констант скоростей мутаций. Даже при одной сигма (доверительный интервал плюс-минус 68 %) погрешность в определении констант скоростей мутаций составляет ±100 % при одной мутации, и ±71 % при двух мутациях. А попгенетики их используют, в том числе и те маркеры, в которых мутаций вообще не было, при этом умудряясь рассчитать «скорости мутаций» для тех маркеров! В результате, разумеется, опять мусор в академических публикациях.
Пример такой работы – исследование 2013 года (Forensic Science International: Genetics. 7, 568–572), в авторах которого Chris Tyler-Smith, один из ведущих популяционных генетиков мира, и журнал один из ведущих. Я немедленно написал критическую статью в тот же журнал, и началась типичная для попгенетиков ситуация. Полгода ответа от журнала вообще не было. Я написал напоминание. После этого пришла одна рецензия, совершенно уклончивая, суть которой состояла в том, что несправедливо критиковать исследование, в котором используются мутации, определенные по парам отец-сын, поскольку многие их применяют. Поэтому моя статья быть принята не может. Я написал ответ, выразив возмущение сроками рецензии – более полугода, а также тем, что рецензент всего один, и само замечание неквалифицированное.
Через месяц пришла еще одна рецензия, в которой опять предлагалось снять критику за использование «скоростей мутаций» по парам отец-сын, снять таблицу, в которой показано, что значительная часть маркеров, используемых в работе Tyler-Smith, основывается всего на нескольких мутациях в парах отец сын. Так, по данным Ballantyne[271], в маркере DYS448 мутаций вообще не было (в 1747 парах отец-сын), в DYS438 прошла всего одна мутация (в 1751 паре), маркере DYS643 две мутации (в 1773 паре), и так в шести маркерах из 21, используемых в работе, более четверти. Помимо того, в работе использовались печально известные «популяционные скорости Животовского», которые вообще завышали датировки в три раза. Я ответил, что ничего снимать не буду. После этого получил письмо уже от главного редактора с приложением еще одной рецензии. Суть ее была в том, что несправедливо критиковать именно эту статью, и особенно несправедливо по отношению к Tyler-Smith, поскольку то, о чем я пишу, характерно по отношению буквально ко всем статьям популяционных генетиков, и почему начинать именно с Tyler-Smith? Поэтому мне предлагалось вообще снять всю критику данной статьи, и написать общую статью по мутациям в гаплотипах. Я отказался, написав, что сначала пусть они публикуют эту критическую статью, а потом обсудим более общую статью. После этого в течение года редактор мне периодически напоминал, что они ждут общую статью, но о критической статье не упоминал. Но я уже не отвечал. Такое отношение к авторам мне не подходит. И после этого попгенетики еще мне высказывают претензии, что я не публикуюсь в журналах по популяционной генетике. Нет уж, меня ангажированные издания не устраивают.
Резюмирую то, чего не понял Балановский. «Прямой подсчет» числа мутаций по парам отец-сын не подходит по ряду причин. Одна из них продемонстрирована выше – в объемной работе Ballantyne и др (2010)[272] из 111 маркеров данных не было получено для 24 маркеров, а для 56 данные совершенно ненадежны. Какая константа скорости для маркера, когда за поколение в маркере прошла всего одна мутация? Как константу будем рассчитывать? А если прошло всего 2–3 мутации, как константу рассчитывать будем? При погрешности в 70»-100 %? Пробовали бросить монету три раза, и по результатам рассчитать вероятность выпадения орла или решки?
А попгенетики так и не поняли, что эти данные по парам отец-сын для расчетов вообще непригодны. Возьмем, например, опять те же данные Ballantyne[273], потому что они самые массовые в одном эксперименте. В маркере DYS393, весьма «медленном», у 1750 пар отец-сын прошли три мутации, а в маркере DYS390, намного более «быстром», у 1758 пар прошли две (!) мутации, то есть маркер оказался как бы более медленный, что есть нонсенс. Любой, кто работает с гаплотипами, знает, что в DYS390 проходит больше мутаций, чем в DYS393. Вот пример – среди 3466 гаплотипов субклада R1b-L21 в маркере DYS393 от общего предка прошло 232 мутации, а в маркере DYS390 – 1164 мутации, в пять раз больше. А по парам отец-сын у Ballantyne – наоборот, 3 и 2 мутации, соответственно. Можно на основании расчетов по таким данным на что-то надеяться? Нет, конечно, и понятно, почему – статистика не та. Мало для расчетов 1700 пар отец-сын, очень мало. А Балановский, не имея понятия, пишет – «при больших выборках», «достаточное количество». Так какие выборки нужны? Какое количество достаточно, о чем Балановский, конечно, не знает? Уровень не тот.