Как лгать при помощи статистики - Дарелл Хафф
Шрифт:
Интервал:
Закладка:
Уровень смертности в военно-морском флоте США в период Испано-Американской войны[15] составлял девять человек на тысячу. За тот же период уровень смертности среди гражданского населения Нью-Йорка достигал шестнадцати человек на тысячу. Позже эти цифры использовали вербовщики, чтобы показать: служить в ВМС безопаснее, чем находиться за его пределами. Допустим, что сами эти цифры точны (вероятно, так оно и есть). Давайте остановимся на мгновение и проверим, сообразите ли вы, что лишает практически всякого смысла сами эти цифры, или хотя бы заключение, которое выводили из них вербовщики.
Все дело в том, что группы, к которым относятся вышеуказанные цифры, несопоставимы. В рядах ВМС служат главным образом молодые мужчины, признанные здоровыми. Гражданское же население состоит среди прочего из малых детей, стариков и больных, и для этих категорий населения уровень смертности выше, где бы они ни находились. Приведенные цифры вообще никак не доказывают, что мужчины, признанные годными к службе в соответствии со стандартами ВМС, находясь в его рядах, проживут дольше, чем если бы не служили на флоте. Впрочем, эти цифры не доказывают и обратного.
Вам, должно быть, приходилось слышать удручающую новость, что 1952 г. был худшим по ситуации с полиомиелитом за всю историю медицинских наблюдений. Этот вывод основывался на исчерпывающих, казалось бы, свидетельствах, какие только можно вообразить: в том году было зарегистрировано намного больше случаев заболевания полиомиелитом, чем в каком-либо другом.
Но когда эксперты взялись изучать исходные цифры, вскрылись и кое-какие более обнадеживающие факты. Во-первых, численность детей в возрасте, когда восприимчивость к заболеванию максимальна, в 1952 г. была так велика, что, если бы сохранился прежний уровень заболеваемости, количество случаев достигало бы рекордного значения. Другой отрадный факт таков: на фоне всеобщей бдительности по поводу полиомиелита его стали диагностировать чаще и фиксировать даже неострые формы заболевания. Наконец, в тот год усилились финансовые стимулы к большему вниманию к этой болезни, что выразилось в возросшем предложении страхования от полиомиелита, а также в увеличении возможностей получить поддержку и помощь со стороны Национального фонда борьбы с детским параличом. Выявленные факты позволяют серьезно усомниться в истинности утверждения, что распространение полиомиелита достигло нового пика, а данные о смертности от данного заболевания только усиливают эти сомнения.
Любопытный феномен: такие показатели, как уровень смертности или количество смертей, зачастую служат более точным мерилом распространенности заболевания, чем данные о количестве заболевших. А все потому, что, когда дело касается летального исхода, регистрация и учет поставлены на более качественный уровень. Это тот самый случай, когда цифра откровенно псевдообоснованная лучше той, что в первом приближении выглядит совершенно обоснованной.
В Америке псевдообоснованные цифры переживают бум раз в четыре года. Впрочем, это не свидетельствует о циклической природе таких цифр, а просто напоминает, что именно с такой периодичностью проходят выборы. Предвыборное заявление, обнародованное Республиканской партией в октябре 1948 г., целиком и полностью построено на цифрах. Создается видимость, что эти цифры связаны друг с другом, но это не так:
Когда Дьюи в 1942 г. был избран на пост губернатора, минимальный размер зарплаты учителей в некоторых районах составлял такую малость, как $900 в год. Сегодня школьные учителя в штате Нью-Йорк получают самые высокие зарплаты в мире. По рекомендации губернатора Дьюи, которая основывалась на сведениях, полученных в ходе работы назначенного им комитета, легислатура[16] штата выделила из бюджета штата $32 000 000 на обеспечение немедленного повышения заработной платы школьным учителям. В результате минимальный размер зарплаты учителя в Нью-Йорке варьируется в пределах от $2500 до $5325.
Совершенно не исключено, что мистер Дьюи проявил себя как друг учителей, да только приведенные цифры об этом не свидетельствуют. Это старый как мир трюк с «было» и «стало», когда для показа разительных перемен втихомолку приводят в действие ряд факторов, а потом представляют дело так, будто эти факторы ни при чем. Здесь у нас имеется «было» $900 и «стало» от $2500 до $5325. Это, бесспорно, создает впечатление, что положение улучшилось. Но меньшая цифра отражает нижний порог зарплаты учителя в каком-нибудь сельском районе штата, а цифры побольше – диапазон заработных плат учителей в самом Нью-Йорке. Может быть, при губернаторе Дьюи улучшения действительно произошли, а может быть, и нет.
Вышеприведенное заявление иллюстрирует статистическую форму картинки «было – стало», которая представляет собой знакомый всем нам по журнальным статьям и рекламе трюк. Гостиную дважды фотографируют, чтобы показать вам, какие крупные перемены к лучшему может сотворить слой краски на стенах. Но между этими двумя демонстрациями в гостиной появляется новая мебель. А еще бывает, что фотография «было» меньше размерами, сделана при слабом освещении и вообще черно-белая, а вот фотография «стало» – цветная и гораздо крупнее. Или пара картинок показывает вам, что бывает, когда юная особа начинает применять ополаскиватель для волос. И – бог ты мой! – ее шевелюра действительно выглядит значительно лучше после, чем до. Но при внимательном изучении вы замечаете, что перемен добились главным образом за счет того, что девушку заставили улыбнуться, а ее волосы сзади подсвечены ярким светом. Тут скорее следует отдать должное мастерству фотографа, чем чудодейственной силе ополаскивателя.
Глава 8
И снова это «после – значит вследствие»
Однажды некто взвалил на себя тяжкий труд определить, отстают ли в учебе студенты-курильщики от некурящих студентов. Как выяснилось – да, отстают. Очень многим этот вывод пришелся по душе, и они пошли еще дальше. Хочешь получать высокие оценки – бросай курить, так оно вроде бы верно. А следующий обоснованный вывод – курение пагубно влияет на умственные способности.
Вышеупомянутое исследование, как мне верится, было проведено по всем правилам: объем выборки был достаточно велик, подобрали ее добросовестно и тщательно, величина корреляции действительно оказалась очень значимой, и все прочие условия были соблюдены.
И все же не обошлось без одного заблуждения. И пускай оно древнее как мир, но почти всегда обнаруживается в статистических данных, замаскированное в гуще внушительных цифр. Это заблуждение таково: если событие В следует за событием А, значит, событие А является причиной события В. В вышеупомянутом исследовании делается неоправданное предположение, что поскольку курение и низкие оценки сопутствуют друг другу, значит, курение и есть причина плохой успеваемости. Но разве все это нельзя с таким же успехом перевернуть наоборот? Может быть, именно скверные оценки заставили студентов искать утешения, но не в выпивке, а в курении? Если уж на то пошло, данный вывод столь же вероятен и не хуже подкреплен фактами. Вот только всяких пропагандистов он не слишком устраивает.
Представляется куда более вероятным, что ни одно из этих двух явлений не обусловливает другого. Скорее оба они следствие какого-то третьего фактора. Может ли быть так, что компанейские парни, которые не слишком утруждают себя учебой, чаще имеют привычку к курению? Или секрет в том, что имеется корреляция между экстраверсией и низкой успеваемостью – связь очевидно более тесная, чем между оценками и умственными способностями? Очень может быть, что экстраверты более склонны к курению, чем интроверты. Это я к тому, что, когда имеется множество правдоподобных объяснений, у вас едва ли есть право выбрать то из них, которое вам больше нравится, и настаивать на его истинности. И все же многие поступают именно так.
Чтобы не поддаваться заблуждению «после – значит вследствие» и тем самым не уверовать в правоту многих ложных истин, следует подвергать любое утверждение самому тщательному анализу. Корреляция, эта убедительно точная зависимость, которая на первый взгляд показывает, что одно событие происходит вследствие другого, бывает нескольких типов.
Существует корреляция, обусловленная случайными причинами. Возможно, у вас получилось установить корреляцию между двумя рядами чисел, чтобы доказать некое маловероятное утверждение. Но если вы снова попробуете проделать расчет, но уже на других цифрах, никакого доказательства не получится. Подобно производителю зубной пасты, которая, как казалось, препятствует развитию кариеса, вы просто отбрасываете неугодные вам результаты и широко тиражируете те, что подходят для ваших целей. Если выборка невелика, то, скорее всего, вы обнаружите существенную корреляцию между двумя характеристиками или событиями, которые представляют для вас интерес.