Модели и статистика вводят нас в заблуждение

Люди часто пытаются разобраться в устройстве мира через причинно-следственные связи, которые мы выводим из опыта. Если нажать на дверь и она откроется, мы считаем это закономерностью. Наука начинается с наблюдения таких правил, которые часто формулируют как законы. Затем исследователи используют индукцию, чтобы создать теории, объясняющие эти причины. Теории могут быть вербальными гипотезами или математическими моделями, позволяющими делать количественные прогнозы. Со временем теории становятся мощнее, объясняя более широкий круг явлений. Однако наше понимание часто выражается словами или схемами, что неизбежно вносит смысловые неопределенности. Термины вроде «понимание», «объяснение» и «причинность» — это понятия, которые каждый читатель интерпретирует по-своему, поэтому жесткие определения их ограничивают. Мы используем эти слова в широком значении, подходящем для обычного разговора. Понимание — это личный рассказ о причинах явления, объяснение — передача этого рассказа другим, причинность — механизм, считающийся главным, дедукция — вывод из правил, а индукция — создание лучшего на данный момент описания явлений на основе всех известных данных.

Смысловая двусмысленность часто рождает жаркие споры в научных кругах. Иногда удовлетворительное объяснение создает иллюзию, и ученые перестают искать глубже, хотя любые модели неполны. Джордж Бок в 1976 году напомнил, что все модели ошибочны, но некоторые полезны. Неполные теории помогали науке шагать вперед, но они же могут вводить в заблуждение и приносить вред, как в случае с ложными данными об аутизме от вакцин. Для одних целей полезно простое объяснение, например, сжигание ископаемого топлива вызывает климатические изменения, а для других — учет всех сложностей может отрицать роль человека. Другой пример: ученые могут верить, что забывание связано с подавлением воспоминаний, хотя это упрощение, которое может привести к ошибочным клиническим методам лечения.

Математические уравнения и симуляции, такие как ChatGPT, дают точные прогнозы, но их создатели не всегда понимают внутреннюю работу моделей. История знает случаи, когда Ньютон правильно рассчитывал вероятность броска кубиков, но его вербальное объяснение было неполным. Такие иллюзии возникают из-за ошибочного чувства понимания. К ним относятся иллюзии глубины, когда мы думаем, что знаем больше, чем знаем; иллюзии полноты, когда мы считаем, что эксперты всё поняли; иллюзии, когда мы понимаем соседнюю область, например, анатомию гиппокампа, а не сам процесс памяти; или иллюзии от простых утверждений. Также есть иллюзии силы причинности, когда связь кажется сильнее, чем она есть, или иллюзии, что описание причины должно быть простым. Эксперты могут ошибочно полагать, что получатель понял их сообщение. В бесконечно сложном мире все наши теории — лишь приближения, как заметил лауреат Нобелевской премии Джорджио Пези: научные истины provisional, но не относительны, они всегда приближения.

Иллюзии понимания возникают даже на простых примерах, например линейной регрессии. Многие считают уравнение y = ax + b + s причинной связью, где x вызывает y, но корреляция не означает причинность. Знаменитый пример Ньюкомба показал, что корреляция между хинином и лихорадкой объясняется тем, что хинин давали в жарких регионах, а не тем, что лекарство вызывает болезнь. То же самое с курением и алкоголизмом. Причинная связь часто переоценивается, потому что мы игнорируем другие факторы. Линейность часто выбирают из-за принципа parsimony, или бритвы Оккама, который гласит: выбираем самое простое объяснение. Однако с развитием науки теории усложняются. Видимость стекла объяснялась прозрачностью, а сегодня — квантовой теорией поля.

Симпсонский парадокс, открытый ещё в 1951 году, демонстрирует, как тренды в подгруппах могут противоречить тренду в общей совокупности. В примере с приемом в UC Berkeley каждая кафедра принимала больше женщин, но в университете в целом — больше мужчин, из-за распределения абитуриентов. Графическое изображение делает это понятнее, но интуитивное понимание остаётся сложным. Этот парадокс часто путают с «амальгамационным парадоксом» или ошибочно списывают на скрытые переменные. На самом деле он возникает при смешении вероятностей и встречается чаще, чем думают. Люди ошибаются в вероятностных задачах, как в проблеме Линды или «Монти Холла», что показывает трудности понимания линейной регрессии.

Регрессия к среднему — ещё один пример статистической иллюзии. Если один из парных показателей экстремален, второй будет менее экстремален, например, высокий балл на промежуточном тесте предсказывает средний балл на экзамене. Это не из-за снижения способностей, а из-за случайных колебаний. Гальтон объяснял это через «квинкункс», где шарики падают и распределяются по нормальному закону. Если шарики отклонились в край, они стремятся к центру. В примере с родителями и детьми рост взрослых детей ближе к среднему, чем рост их родителей, из-за регрессии к среднему. Это явление встречается везде: от результатов аукционов на добычу нефти («проклятие победителя») до спортивных достижений. Его часто ошибочно интерпретируют как причинную связь, например, что диета влияет на рост, хотя это статистический артефакт.

Эти примеры показывают, что даже простые статистические концепции могут вводить в заблуждение. Индукция — процесс поиска лучших объяснений — нетривиален и требует осторожности. Наши иллюзии понимания мешают видеть реальные причины и корреляции. Наука progresses, но мы должны помнить, что все модели — приближения, и критическое мышление необходимо, чтобы не попасть в ловушку ложных выводов.