Автор текста рассматривает «парадокс дня рождения» как повод для глубокого обсуждения вероятностей. Всем известно, что в комнате из 23 человек шанс совпадения дат двух людей уже достигает 50%. Стандартная формула считает это через вероятность отсутствия совпадений, умножая доли оставшихся дней для каждого следующего участника. Однако всё становится интереснее, если задуматься о более редких событиях, например, когда три человека из 60 имеют одинаковый день рождения. Историческая справка приводит нас к сотрудникам страхового бюро в 1930-х годах, которые, рассчитывая вероятность для конкретной тройки на конкретный день, получили ничтожный результат около 0,0006%. Их ошибка заключалась в узком взгляде на задачу. Им нужно было найти вероятность события, где конкретные три человека (Алиса, Боб и Рэй) совпали, но они игнорировали тысячи других возможных комбинаций из этих 60 человек.
Правильный подход предложил австрийский математик Ричард фон Мизес в 1939 году. Он сменил оптику, предложив считать не вероятность конкретного совпадения, а ожидаемое количество дней, занятых тремя и более людьми. Это превращает задачу в последовательность испытаний Бернулли. Автор демонстрирует, как формула ожидаемого значения показывает, что в среднем каждый четвёртый или пятый набор из 60 человек будет содержать хотя бы одну тройку с одинаковым днём рождения. Шанс поднимается с нескольких тысячных до 0,22. Это значит, что тройные совпадения случаются куда чаще, чем считали в то время.
Закономерность работает не только с датами, но и с хеш-таблицами в программировании. Здесь дни года заменяются полями таблицы, а люди — хешами. Именно на этой математике строится «атака днём рождения» в кибербезопасности. Злоумышленник не пытается угадать конкретный хеш, а ищет любой случайный конфликт, чтобы сломать систему, и достаточно примерно квадратного корня из общего числа возможных значений. Важно учитывать, что такие расчёты в идеальной модели пренебрегают реальными факторами вроде сезонности рождений или двойни, которые сам фон Мизес упомянул в своей работе. Тем не менее, понимание распределения вероятностей помогает предсказывать коллизии и защищать криптографические алгоритмы вроде SHA-256 от взлома.