← На главную

Claude /goal обзавёлся backpressure с автотестами, линтерами, ревью

31.05.2026 12:11 · hackernews

Два способа использовать кодинг-агенты — и оба плохи. Первый: отпустить LLM в свободное плавание и надеяться, что репозиторий выживет. Быстро, весело, глупо. Результат — баги, хаотичные изменения и шквал PR, которые никто не успевает ревьюить. Второй: относиться к агенту как к дорогому автодополнению и проверять каждый его шаг. Безопасно, но медленно — смысл делегирования теряется. Автор предлагает третий путь: встроить в процесс «backpressure» — механизмы, которые заставят агента проверять себя сам, прежде чем дойдёт до человека.

Backpressure — это когда потребитель сигнализирует производителю: «стоп, я не справляюсь, притормози». В разработке это, например, автотесты: разработчик гоняет их локально, а ревьюер видит уже зелёный код. Или типы: в эпоху чистого JavaScript передать компоненту не ту пропу было легко, а TypeScript ловит такое на границе, без дорогого ревью. Линтеры, CI, канареечные релизы — всё это обратное давление. Но когда производитель кода — LLM, который пишет быстрее, чем человек читает, backpressure по умолчанию — сам человек. Он вручную правит код, копирует замечания ревью-бота обратно в агента, фактически становясь дорогим буфером обмена между двумя машинами.

Чтобы это исправить, автор доработал команду Claude /goal. Вместо расплывчатого «реализуй фичу» он добавил жёсткие проверки, которые агент должен прогонять на каждой итерации: линтинг, прогон тестов, покрытие новой функциональности тестами, проверка commit-месседжей. Но и это не всё. Он научил агента поднимать локальное окружение, запускать бэкенд и фронтенд, тестировать через cURL и настоящий браузер через Playwright MCP, гонять бенчмарки. Самой эффективной мерой оказались ревью-агенты: специальные навыки, которые проверяют код на читаемость, сложность, типизацию и наличие тестов — и гоняют агента по кругу, пока всё не станет хорошо. Затем добавилась проверка плана до написания кода, визуальные ревью скриншотов против макетов из Figma или Linear, и наконец — мониторинг пул-реквеста: агент ждёт, пока PR пройдёт CI и не получит новых комментариев.

Итог — многоэтапный цикл, где агент сам себе и тестировщик, и ревьюер, и DevOps. Человек подключается только в конце, читать итоговый дифф. Установить такой навык можно через npx @lucasfcosta/backpressured — он научит Claude работать по этой схеме, а правила можно дописать в BACKPRESSURE.md.

Читать оригинал →