Автор статьи рассказывает про Waveloop — музыкальный визуализатор, который ему сделала модель Fable (видимо, речь о прототипе или модели от Anthropic). Идея в том, чтобы визуализация наглядно показывала гармоническую и мелодическую структуру трека, а не просто уровень громкости. Waveloop рисует хроматический круг: 30° на полутон, один оборот — октава. Мгновенный срез музыки — это спиральная гистограмма: сколько энергии в каждой высоте. Цвета кодируют регистр: приглушённые синие и зелёные для баса, огненные для середины, золотые и сиреневые для высоких. Цветовая модель — oklch. Такая схема даёт читать интервалы по углам, а форму аккорда — по очертаниям фигуры. Транспозиция вращает фигуру, инверсия оставляет её неизменной. Waveloop в основном работает офлайн — предсчитывает CQT для трека, но Fable добавила режим живого микрофона, и он довольно надёжно распознаёт аккорды укулеле.
Автор вглядывается в код, который написал Fable. Первое впечатление — он очень плотный. Если обычные модели пишут как аккуратный инженер из FAANG, то этот код напоминает, как автор представляет себе код Терри Дэвиса в одиночной комнате. Комментарии — максимально информативные записи намерений, без лишних слов, из которых можно было бы восстановить весь код. В одном комментарии упоминаются альфа-преумножение, основные частоты, CDF, FFT, AGC. Язык при этом литературный: звуки «задерживаются», материал «вырывается» с края. Функция detectChord занимает удивительно мало строк и выглядит основательно.
Ещё автор попросил Fable сделать объясняющее видео на основе manim. Ушло три промпта. Первый вариант был «горячим мусором». После детальной обратной связи — про ужасный TTS, шум, нехватку сгенерированных звуков, слишком простые основы, неправильный стиль повествования — Fable существенно улучшил видео. Ещё один запрос на типографику математики и последовательность голоса — и видео готово. Автор признаёт, что видео не идеальное, но оно держало его внимание все десять минут при первом просмотре.
Дисклеймер: SVG-диаграммы для статьи сгенерированы Claude, весь остальной текст написан человеком.