статистика — цитаты, высказывания и афоризмы

Знаю, звучит неправдоподобно, но проверьте потом сами — это чистая правда: у среднего человека одна маточная труба. Средняя длина пениса — 14 см. И наконец, средняя длина пениса человека, ищущего в Гугле «средняя длина пениса» — 9 см.
Если бы не было статистики, мы бы даже не подозревали о том, как хорошо мы работаем.
— 42% разводов связано с психологической и практической неподготовленностью супругов к семейной жизни.

— Тоже няня?

— Ты что?! Википедия.
— Проще стать жертвой террориста, чем выйти замуж после 40.

— Это неправда!

— Это статистика.
Если мой сосед бьет свою жену ежедневно, а я — никогда, то в свете статистики мы оба бьем свою жену через день.
Статистика как бикини: показывает много, но скрывает самое интересное.
Статистика – это наука, она не терпит приблизительности.
— Пацаны, я тут кое-что подсчитал. В прошлом году соотношение составляло 90% белых против 10% черноты. Это означает, что всего за один год их стало на 50% больше.

— Первый раз ты так серьезно математикой.

— Потому-что это важно! Ежегодный прирост в 50% означает, что через 3 года мир заполонят одни нацменьшинства! Это случится в 2012 году. Индейцы Майя это предсказывали!

— Кто?

— Майя. Они знали, что к 2012 году чернота захватит мир! И это уже началось.
Странно. Девяноста пяти процентам людей я не могу сказать правду, потому что они ее не поймут или обидятся. И девяносто пять процентов людей никогда не говорят правды мне, потому что обижусь я. И сам себе я в десяти случаях из ста не могу сказать правду, потому что мне будет страшно.
Массы представляются мне достойными внимания только в трёх отношениях: прежде всего, как плохие копии великих людей, изготовленные на плохой бумаге со стёртых негативов, затем, как противодействие великим людям и, наконец, как орудие великих людей; в остальном же побери их чёрт и статистика!
Как показывает статистика — интуитивный ответ чаще всего верный. Если мы задумаемся и переменим решение — в семидесяти процентах случаев совершим ошибку.
Система — это статистика. Если система правильная, ни за что не проиграешь. А счастье всегда может обмануть.

A system is statistical. When you get the right system you can't lose, and that's the difference between it and a hunch. You never know when the right hunch is going wrong.
– У беднейшей половины мира столько же денег, сколько у восьмидесяти пяти самых богатых людей. Вы знаете об этом?

– Разумеется, да. – В голосе Фредди слышалось раздражение. – Это было во всех газетах. Бессмысленная статистика.

– Бессмысленная? Разве она не заставляет задуматься?

– Я и задумываюсь – о том, что беднейшей половине мира пора бы наконец взяться за ум.
По какой статистике?! Причём здесь статистика?! По статистике, 80% больных раком поджелудочной умирают в течение 5 лет, 95% аппендэктомии проходят без осложнений. Мы видели раковых больных, которые выжили, и пациентов с аппендицитом, которые умерли. Статистика не имеет отношения к конкретной жизни. Либо ты будешь хорошим отцом, либо не будешь. В конце концов твои родители развелись, а ты ухитрился стать относительно неплохим врачом.
Ни за что не поверю в статистику, к изменению которой я не приложил руку.
Факты — упрямая вещь, но статистика гораздо сговорчивее.
Вот ты, активистка. На случай, если однажды вздумаешь проголосовать, лучше кое-что запомни. Например, что не существует доказательств в пользу утверждения, что Америка — величайшая страна в мире. Мы 7-ые по грамотности, 27-ые в математике, 22-ые в естественных науках, 49-ые по долгожительству, 178-ые по детской смертности, 3-ие по доходу на домохозяйство, 4-ые по рабочей силе и 4-ые по экспорту. Мы обошли другие страны в 3-х категориях: по числу заключенных на душу населения, по количеству взрослых, верующих в ангелов, и по расходам на оборону, которые превышают расходы следующих 26-ти стран вместе взятых, 25 из которых — наши союзники. Конечно, в этом не виновата двадцатилетняя студентка. Но тем не менее вы несомненно принадлежите к поколению худшей точки в истории. И когда вы спрашиваете: «Что делает нас величайшей в мире страной?» — я не понимаю, да вы, ***ь, о чем? О заповедниках?
Послушайте, у людей всегда найдется какая-нибудь статистика. Это известно 14% населения.
Проблема в том, что мы сосредоточиваемся на тех редких случаях, когда наша методика срабатывает, и почти никогда — на многочисленных примерах ее несостоятельности.
Статистика — это такая вещь, с которой никогда ничего заранее не скажешь; иной раз она, как болезнь, таится много лет, а потом вдруг разит насмерть; а иная статистика бросается на тебя сразу, как атакующий бизон.
Несколько исследователей, изучив работу и самооценку аналитиков ценных бумаг, получили удивительные результаты, особенно в отношении эпистемической самонадеянности этих деятелей. Сравнивая их с метеорологами, прогнозирующими погоду, Тадеуш Тышка и Петр Зелонка констатируют, что аналитики предсказывают хуже, но при этом больше верят в собственное умение. Во всяком случае, им хватает апломба не снижать предела погрешности после откровенных провалов.
Булю показал мне удивительную исследовательскую работу, только что законченную его практикантом и уже принятую к публикации; в ней подробно рассматривались две тысячи предсказаний, сделанных аналитиками ценных бумаг. В работе наглядно показывалось, что эти брокер-аналитики не предсказывали ничего: наивный прогноз человека, просто переносящего цифры из истекшего периода в следующий, был бы немногим хуже. А ведь аналитики владеют информацией о заказах, грядущих контрактах и планируемых расходах и благодаря этим ценным знаниям вроде должны прогнозировать значительно лучше, чем наш наивный предсказатель, не располагающий никакой информацией, кроме прошлых данных. Хуже того, разрыв между предсказанными и реальными величинами был гораздо существенней, чем между разными прогнозами, а значит, аналитиками руководил стадный инстинкт. Иначе прогнозы отстояли бы друг от друга настолько же, насколько они отстоят от реальности.
Тетлок изучал проблему «экспертов» в политике и экономике. Он просил специалистов из разных областей оценить вероятность того, что в течение заданного временного периода (около пяти лет) произойдут определенные политические, экономические и военные события. На выходе он получил около двадцати семи тысяч предсказаний почти от трех сотен специалистов. Экономисты составляли около четверти выборки. Исследование показало, что эксперты далеко вышли за пределы своих допусков на ошибку. Обнаружилась и экспертная проблема: между результатами докторов наук и студентов не было разницы. Профессора, имеющие большой список публикаций, справлялись не лучше журналистов. Единственной закономерностью, которую обнаружил Тетлок, была обратная зависимость прогноза от репутации: обладатели громкого имени предсказывали хуже, чем те, кто им не обзавелся.

Но Тетлок ставил перед собой задачу не столько показать, чего реально стоят эксперты (хотя у него это замечательно получилось), сколько выяснить, почему до них никак не доходит, что они плохо справляются со своей работой, иными словами, как им удается «втирать себе очки».

<...>

Вы говорите, что играли в другую игру. Допустим, вам не удалось предсказать неожиданный крах Советского Союза (этого не предвидел ни один социолог). Легко заявить, что вы прекрасно понимали суть политических процессов, происходивших в Советском Союзе, но эти русские, будучи чрезмерно русскими, искусно скрыли от вас существенные экономические составляющие. Если бы вы обладали этими экономическими данными, вы бы уж конечно смогли предсказать падение советского режима. Винить надо не вашу квалификацию. Так же можно действовать, если вы предсказали решительную победу Эла Гора над Джорджем У. Бушем. Вы не знали, что экономика в таком отчаянном положении; собственно, этот факт, кажется, был тайной для всех. Вы же не экономист, а борьба-то, оказывается, шла на экономическом ринге.

Вы валите все на непредвиденные обстоятельства. Случилось что-то необычайное, лежащее вне поля вашей науки. Поскольку это нельзя было предсказать, вы не виноваты. Это был Черный лебедь, а вы не обязаны предсказывать Черных лебедей.
Здесь работает классический ментальный механизм — так называемый эффект привязки. Вы усмиряете свой страх перед неопределенностью, придумывая число и цепляясь за него как за островок посреди пустоты. Этот эффект был открыт отцами психологии неопределенности Дэнни Канеманом и Амосом Тверски, еще когда они только начинали исследовать заблуждения в использовании эвристик. Эффект работает следующим образом. Канеман и Тверски предлагали добровольцам покрутить рулетку. Добровольцы смотрели на выпавшее число, зная, что оно случайно. Затем их просили назвать количество входящих в ООН африканских стран. Ответ коррелировал с выпавшим числом.

Попросите кого-нибудь назвать вам последние четыре цифры своего номера социального страхования, а затем — приблизительное количество зубных врачей в Манхэттене. Вы увидите, что, активировав в сознании собеседника четырехзначное число, вы заставляете его соотносить свое предположение с этим числом.
Как и многие биологические переменные, ожидаемая продолжительность жизни — величина среднестанская, то есть подчинена рядовой случайности. Она не масштабируема, так как чем старше мы становимся, тем меньше у нас шансов жить дальше. В развитой стране таблицы страховых компаний предсказывают новорожденной девочке смерть в 79 лет. Когда она справит 79-й день рождения, ожидаемая продолжительность ее жизни в типичном случае будет составлять 10 лет. В возрасте 90 лет она сможет рассчитывать на 4,7 года.

В 100 лет — на 2,5 года. Если она чудесным образом доживет до 119 лет, ей останется около 9 месяцев. По мере того как она пересекает очередные пороги, количество дополнительных лет уменьшается. Это иллюстрация главного свойства случайных переменных, описываемых «гауссовой кривой». Чем старше человек, тем меньше дополнительных лет у него в резерве.

С человеческими планами и проектами дело обстоит по-другому. Они часто масштабируемы, как я уже говорил в главе 3. А в случае с масштабируемыми, то есть крайнестанскими, переменными вы получите ровно противоположный эффект. Скажем, предполагается, что проект будет завершен за 79 дней (берем ту же цифру, что в примере с возрастом женщины). Если на 79-й день проект не завершен, нужно будет отвести на него еще 25 дней. На 90-й день — еще около 58. На 100-й — 89. На 119-й —149. Если проект еще не завершен в день номер 600, то на него понадобится 1590 дополнительных дней. Как видно, чем дольше вы ждете, тем дольше вам предстоит ждать.
Люди субъективны, им верить нельзя, вот математика — наука от Бога. Следи за статистикой, огурчик мой, она не подведет.
— ... Выходит, ты кто?

— Как кто? — не понял штрафник Веретенников. — Человек.

— Не, ты не человек. Ты — статистика, — торжественно заключил политический Авдеев, и все вокруг радостно заржали. Авдеев оглядел смеющиеся небритые чумазые рожи и добавил: — Мы все здесь — статистика…
Ложь подразделяют на собственно ложь, гнусную ложь и статистику.
Статистика для политика — всё равно, что уличный фонарь для пьяного забулдыги: скорее опора, чем освещение.
— Тут как со всякой статистикой, — сказал он. — Умело её подтасовывая, можно доказать всё, что угодно.
Статистика, в чем рано убедилась Дженни, теряет всякий смысл, когда дело касается тебя самого, пусть ты оказываешься тем единственным человеком из тысячи, кого поразила молния, или той самой девочкой, чей отец не придет домой, — и неважно, разбился ли он в машине на скользкой дороге или сидит в тюремной камере.
Статистика такими данными не располагает — сколько людей ползает, а сколько летает.
Канеман и Тверски заметили, что люди способны всерьез задуматься о, казалось бы, маловероятных явлениях, если вовлечь их в обсуждение подобных явлений и дать почувствовать, что эти события не так уж нереальны. Например, если спросить человека, какова вероятность гибели в авиакатастрофе, он, скорее всего, завысит цифру.
Важно не то, насколько редко мы ошибаемся, а какова суммарная погрешность.
Прогнозисты от экономики, как мы очень скоро убедимся, гораздо ближе в своих догадках друг к другу, чем к реальному результату. Никто не хочет быть белой вороной.
В 1971 году психологи Дэнни Канеман и Амос Тверски решили помучить профессоров статистики вопросами, сформулированными не как статистические вопросы. Один был приблизительно таков (для большей ясности я поменял пример): представьте, что вы живете в городе, где есть две больницы — одна большая, другая маленькая. В определенный день в одной из этих двух больниц рождается 60 процентов мальчиков. В какой больнице это скорее могло бы произойти? Многие профессора делали ошибку (во время обычной беседы), называя большую больницу, в то время как суть статистики заключается в том, что большие выборки более стабильны и имеют меньше отклонений от долгосрочного среднего показателя (в нашем случае 50 процентов каждого пола), чем маленькие выборки. Эти профессора провалили бы экзамены, которые сами же принимают. Еще работая квант-инженером, я выявил сотни таких серьезных ошибок, сделанных статистиками, забывшими о том, что они статистики.
Грег Баррон и Идо Эрев в ходе ряда опытов установили, что люди склонны преуменьшать малую вероятность, если им самим приходится ее просчитывать, то есть если она не обозначена в цифрах. Представьте, что вы тянете шары из урны, в которой очень мало красных и много черных шаров, и вам нужно угадать, какого цвета шар вы сейчас вытащите; при этом вы не знаете точного соотношения красных и черных. Скорее всего, по вашей оценке, вероятность вытащить красный шар окажется ниже, чем она есть на самом деле. А вот если вам сказать, к примеру, что красных шаров — 3 процента, вы, наоборот, будете ошибаться, говоря «красный» чаще, чем нужно.
Психологи Канеман и Тверски <...> провели такой эксперимент: испытуемых (а это были люди, чья профессия связана с составлением прогнозов) просили оценить вероятность двух событий:

а) в Америке случится сильное наводнение, в результате которого погибнет более тысячи человек;

б) землетрясение в Калифорнии вызовет сильное наводнение, в результате которого погибнет более тысячи человек.

По мнению респондентов, первый вариант менее вероятен, чем второй: ведь землетрясение в Калифорнии — это причина, которую легко допустить и которая делает ситуацию наводнения более представимой, тем самым повышая ее вероятность в наших глазах.

Точно так же, если я спрошу: «Как вам кажется, сколько ваших сограждан больны раком легких?» — вы назовете какую-нибудь цифру (ну, скажем, полмиллиона). Однако если я спрошу, сколько человек в вашей стране заболели раком легких в результате курения, цифра, которую вы назовете, окажется гораздо (пожалуй, что и в два-три раза) больше. Если указана причина явления, это явление выглядит куда более правдоподобным — и куда более вероятным. В рак от курения верится легче, чем в рак без причины (если причина неясна, это все равно, что ее нет).