AI-исследователь: озарения приходят к тем, кто копает основы

Стать исследователем AI — это как учиться медитации. Комбинация чтения и создания своих проектов. Нельзя делать только что-то одно. В удачные дни ты работаешь. В неудачные — тоже работаешь. Большинство озарений приходят случайно, а прорывные идеи — это результат дисциплины и потраченного времени. Noam Shazeer из SwiGLU paper иронично списал успех своей архитектуры на «божественную благосклонность». И да, можно перечитать слишком много статей. Лучший путь — пытаться решить проблему самому, биться о бутылки и только тогда лезть в литературу.

Если начинаешь — не парься о теме. Но не бери тренды младше шести месяцев. Фундаментальные идеи AI не менялись сорок лет. Вместо модных concepts 2026 года (harnesses, agents, context engineering) разберись с основами: посчитай cross-entropy вручную, добейся, чтобы SVD визуализировался в голове. Не гоняйся за RL для code — пойми policy gradients. Если лучший результат твоего исследования — более высокий скор на существующем бенчмарке, ты копаешь недостаточно глубоко. Jason Wei верно заметил: умение найти датасет, который реально проверяет новый метод — навык, которого десять лет назад не было.

Опыт иногда мешает. Многие исследователи из pre-scaling эры цепляются за методы, которые работают в малом масштабе и ломаются при росте. В OpenAI большинство ключевых технарей моложе 35, а многие заводилы ChatGPT — до 30. AI настолько молод (ChatGPT меньше четырёх лет), что ни у кого нет огромного преимущества. Держи ум открытым, эго отключи.

Вдохновение приходит не за клавиатурой. Структура бензольного кольца приснилась. Ozempic вообще получили из яда аризонского ядозуба — Gila monster. Дарвин, Тесла, Фейнман гуляли. Иди на прогулку.

Когда смотришь на результаты — сохраняй равновесие. Получилось отлично? Провалилось? Тоже отлично — ты узнал то же самое, а часто и больше. Но к отличным результатам относись с крайним скепсисом: скорее всего, баг в коде или измерениях. Все опытные исследователи — параноики.

Не сравнивай себя с другими. Успехи в академии часто случайны и несправедливы. Если кто-то выпустил крутую работу — спроси: «Мог бы я сам до этого докопаться на своём уровне глубины?» Да? Значит, ты занят другим. Нет? Копай глубже.

За успехом стоят сотни часов грязной работы. Andrej Karpathy размечал часть ImageNet вручную. Создатели SWEBench месяцами фильтровали GitHub data. Чем амбициознее идея, тем больше труда.

Collin Raffel заметил: многие идеи умирают не потому, что плохи, а из-за бага в коде, который исследователь не нашёл. Современный deep learning stack безумно сложен, ошибки везде: в тренировке, инференсе, data. Если что-то выглядит неправильно — не пропускай. Логируй метрики, понимай их. Только здоровая паранойя спасёт.

Эксперименты с deep learning занимают недели, eval — дни. Не плоди сотни параллельных запусков — контекст-свичинг губителен. Строй эргономичный workflow с быстрой обратной связью. Вдохновляйся nanoGPT speedrun от Keller Jordan. И научись понимать эксперименты, закончившиеся на прошлой неделе.

Coding agents (вроде Codex) ускоряют, но усложняют контроль. Они могут сократить system prompt, поменять конфиг, не спросив. Инженерно это мелочи, научно — катастрофа. Если хочешь понимать результаты — понимай всю систему, которая их породила. Легких путей нет.

Итог: талант — не главное. Темперамент важнее. Любопытство, настойчивость, внимательность — и идеи придут.