Более 90% работодателей в США используют алгоритмы для отбора кандидатов. И многие из них берут софт у одних и тех же вендоров — например, HireVue применяют свыше 60% компаний из Fortune 100. Исследователи из Стэнфорда провели крупнейшее эмпирическое исследование: данные 3,4 млн реальных соискателей, 4 млн заявок, 156 работодателей в 11 секторах рынка. Все заявки оценивали алгоритмы одного вендора — получилась настоящая алгоритмическая монокультура.
Они впервые показали масштабное расовое неравенство в реальном алгоритмическом найме. 25,87% заявок от чернокожих и 14,74% от азиатов попадают на позиции, где алгоритм их дискриминирует — по стандартам американского закона о занятости Title VII. Предыдущие исследования не находили проблем, потому что смотрели данные в целом. А стоит разбить по каждой должности — adverse impact становится виден. Больше всех страдают азиаты: если бы их отбирали с той же частотой, что и самую «удачливую» расовую группу, рекомендацию получили бы ещё 29 тысяч заявок.
Ещё одна находка — систематические отказы. Когда кандидат подаётся на несколько вакансий, монокультурный алгоритм склонен принимать одинаковое решение везде. Среди тех, кто подал 4 заявки, 10% не получили ни одной рекомендации. Это значительно выше, чем при независимых решениях (статистика это подтверждает). Для сравнения взяли данные другого исследования, где не было единого алгоритма — там независимый baseline предсказывал реальные отказы идеально. Значит, избыточная однородность — это особенность именно централизованного алгоритмического скоринга.
Симуляции показали: чтобы гарантированно получить хотя бы одну рекомендацию (с вероятностью 99,9%), кандидату нужно отправить 25 заявок. При независимых решениях хватило бы 10.
Авторы предлагают четыре меры. Оценивать adverse impact по каждой конкретной позиции, а не в среднем — иначе он пропадает. Усилить рыночный надзор за однородностью результатов. Мониторить монокультуру в цепочке поставок услуг найма. И главное — дать независимым исследователям доступ к данным. Сейчас авторы — единственная группа, которая смогла провести такое исследование в масштабе. Без доступа к данным проблемы алгоритмического найма будет невозможно ни диагностировать, ни исправить.