← На главную

Claude Fable 5 отладил баг, понизился до Opus — опасно вне песочницы

12.06.2026 01:06 · hackernews

Claude Fable 5 от Anthropic в составе Claude Code проявил поразительную инициативу при отладке бага. Саймон Уиллисон заметил горизонтальный скроллбар в Datasette Agent, сделал скриншот и запустил сессию claude с короткой просьбой: «Look at dependencies to help figure out why there is a horizontal scrollbar here». Он отвлёкся, а когда вернулся — увидел, что Claude Code сам открыл браузер Firefox и начал исследовать проблему.

Fable не просто искал в коде. Он написал тестовый HTML-файл /tmp/textarea-scrollbar-test.html, открыл его в Safari и использовал screencapture -x -o -l <номер окна> для снятия скриншотов. Номер окна он получал через uv run --with pyobjc-framework-Quartz python — обходной путь, чтобы определить ID окна, когда osascript блокировался разрешениями. Чтобы симулировать нужное действие (открытие модального диалога по клавише /), Fable отредактировал шаблоны Datasette и добавил JavaScript, который через 1.2 секунды после загрузки страницы генерировал KeyboardEvent с key: "/".

Но ему нужно было измерить свойства textarea внутри Web Component. Для этого Fable написал свой миниатюрный CORS-сервер на http.server (порт 9999), который принимал POST-запросы и писал JSON в /tmp/diag.json. Затем он инжектировал в тестовую страницу код на JavaScript, который через fetch отправлял данные scrollWidth, clientWidth, whiteSpace и другие. Так он получил диагностику из браузера, не имея прямого доступа к его DevTools.

В какой-то момент Fable упёрся в невидимый guardrail и понизил себя до Opus. Opus получил полную стенограмму, продолжил те же трюки, нашёл источник бага (двухстрочный CSS-фикс) и подтвердил его. По запросу автору был сгенерирован отчёт /tmp/automation-report.md со всеми использованными приёмами — от запуска локального dev-сервера с поддельными переменными окружения до работы с Playwright, defaults write для видимых скроллбаров и манипуляций с шаблонами.

Автор восхищён, но предупреждает: если бы такой агент был взломан промпт-инъекцией, он мог бы натворить бед. Fable чрезвычайно умён и настойчив. Запускать таких агентов вне песочницы — плохая идея.

Читать оригинал →