Не забываем, какой был год на дворе. В 1877 году Гальтон искал причинное объяснение и полагал, что регрессия к среднему — это каузальный процесс, подобный закону физики. Он ошибался, но был в этом не одинок. Многие повторяют эту ошибку по сей день. Например, бейсбольные эксперты почти всегда пытаются объяснить «проседание» чемпиона на втором году рассуждениями о причинах. «Он зазнался и расслабился», — сетуют они, или: «Другие игроки сумели найти его слабости и воспользоваться ими». Это может быть правдой, но на деле такой феномен не нуждается в объяснении причин. Чтобы оно произошло, обычно достаточно просто закона случая.
Рис. 8. Устройство, с помощью которого Фрэнсис Гальтон продемонстрировал аналогию наследования роста: а — когда через устройство вроде пинбола пропускают большое количество шариков, то в результате случайных отскакиваний они накапливаются на дне устройства, образуя колоколообразную кривую; б — при двух проходах через устройство, соответствующих двум поколениям, кривая распределения становится шире; в-чтобы упредить эту тенденцию, Гальтон придумал желобки, возвращающие шарики к центру во «втором поколении». Этими желобками Гальтон каузально объясняет явление возвращения к среднему [источник: Гальтон Ф. Естественная наследственность (1889)]
Современная статистика объясняет это явление совсем просто. В книге «Думай медленно, решай быстро» Даниэль Канеман делает вывод: «Успех — это талант плюс удача. Большой успех — это чуть больше таланта и намного больше удачи». Новичок года талантливее в бейсболе, чем большинство, но ему, скорее всего, еще и очень повезло. В следующем году ему повезет меньше и его баллы окажутся не столь впечатляющими.
К 1899 году Гальтон это понял и в процессе постижения, разочарованный, но одновременно и восхищенный открываю-щимся, предпринял первый значительный шаг к отделению статистического от причинного. Его рассуждения несколько туманны, но их стоит попытаться понять — ведь это первый, пока робкий лепет только что родившейся статистики.
Гальтон стал собирать разнообразные, так называемые антропометрические данные: рост, длину предплечья, длину и ширину головы и т. п. Он заметил, что если два размерных признака, например рост и длину предплечья, расположить на оси координат, то их сочетание проявляет все ту же регрессию к среднему. У самых высоких людей более длинные руки, чем в среднем, но длина их рук не настолько больше среднего, насколько рост. При этом очевидно, что рост не является причиной длины руки или, наоборот, в лучшем случае и то и другое имеют общую наследственную компоненту. Гальтон стал использовать новый термин для таких пар признаков: рост и длина предплечья со-отнесены, находятся в ко-реляции, ко-релируют. Со временем он перешел к более привычному нам написанию: «корреляция», «коррелируют».
Чуть позже он обнаружил еще более неожиданный факт: при сравнении поколений неважно, движемся ли мы по ходу времени или назад в прошлое. Это значит, что отцы относительно сыновей тоже проявляют возвращение к среднему. Отец сына, который выше ростом, чем популяция в среднем, оказывается почти всегда тоже выше среднего роста, но ниже, чем его сын (рис. 9). Заметив это, Гальтон был вынужден отказаться от попыток найти каузальное объяснение явлению регрессии к среднему, потому что рост сына никоим образом не может определять рост отца.
На первый взгляд, это наблюдение парадоксально. «Постойте! — скажете вы. — Значит, у более длинных отцов более короткие сыновья, а у более длинных сыновей более короткие отцы? Как эти два утверждения могут быть верны одновременно? Не может же сын быть одновременно выше и ниже своего отца».
Рис. 9. Точечный график показывает набор данных о росте. Каждая точка представляет рост отца (по оси Х) и сына (по оси Y). Пунктирная линия совпадает с большой осью эллипса, а сплошная линия (ее называют линией регрессии) соединяет крайнюю левую и крайнюю правую точки эллипса. Разница между ними отражает возвращение к среднему. Например, черная звездочка показывает, что у отцов ростом 72 дюйма сыновья в среднем имеют рост 71 дюйм (т. е. средний рост у всех, чьи данные представлены точками в вертикальной полосе, — 71 дюйм). Горизонтальная полоса и белая звездочка показывают, что такое же падение роста возникает в непричинном направлении (назад во времени) (источник: график Маян Харел при участии Кристофера Баучера)