Спенсер Брингельсон (Spencer Bryngelson) опубликовал детальное исследование Apple Neural Engine (ANE) — специализированного матричного ускорителя, который встроен во все чипы Apple начиная с A11 (iPhone и iPad) и M1 (Mac). До сих пор ANE был чёрным ящиком: разработчики получали к нему доступ только через Core ML. Брингельсон пошёл другим путём — сделал реверс-инжиниринг.
Он измерил производительность напрямую на реальном «железе» (M1 и M5), статически проанализировал приватные runtime, компилятор, драйвер ядра и прошивку. В итоге получилась полная карта того, как устроен ANE. Документированы datapath и roofline — то есть какие ограничения по пропускной способности и энергопотреблению стоят за вычислениями. Описан маршрут, по которому задачи попадают ниже Core ML — прямо к нейросетевому блоку. Разобран компилятор, формат программ на диске, схема сжатия весов и, самое важное, драйвер, прошивка и командный протокол, который всем этим управляет.
Исследование охватывает поколения от A11 до A18 и от M1 до M5. Для каждого чипа есть таблица с характеристиками и матрица «операция на устройство». Все утверждения чётко помечены: «измерено», «получено из декомпиляции» или «предсказано». Методология расписана прозрачно, открытые вопросы зафиксированы.
Самый интересный практический вывод: прямой вызов ANE возможен из обычного userspace. Он работает, но официально не документирован, не поддерживается и ломается от версии к версии. Брингельсон предупреждает: этот путь годится только для измерений, исследований и задач на самом устройстве. Ни в коем случае не для коммерческого софта — для этого остаётся Core ML.