Библиотека Semble находит код быстрее, чем grep

Библиотека Semble разработана для автоматических агентов, чтобы они могли мгновенно находить нужный код и экономить токены. В тестах этот инструмент использует на ~98% fewer токенов по сравнению с классическим grep+read. Поиск и индексация всего репозитория занимают менее секунды, при этом работа происходит исключительно на CPU без необходимости в GPU, API-ключах или внешних сервисах. Семантический поиск работает быстро: средний репозиторий индексируется за ~250 мс, а ответы на запросы генерируются за ~1.5 мс. Качество поиска достигает NDCG@10 в 0.854, что сопоставимо со специализированными трансформерами, но стоит в разы меньше. Инструмент поддерживает работу через MCP-сервер или вызов из оболочки через AGENTS.md для Claude Code, Cursor, Codex и OpenCode. При интеграции в локальные конфиги, например, в ~/.codex/config.toml или ~/.cursor/mcp.json, агент автоматически использует Semble при поиске кода.

Вместо того чтобы гуглить ключевые слова и читать полные файлы, агент делает запросы на естественном языке, например, «как обрабатывается авторизация», и получает только нужный контекст. Если стандартного поиска недостаточно, можно использовать команду semble find_related, чтобы найти семантически похожий код в другом месте файла. Поиск через grep рекомендуется только для точного совпадения строк. Поддержка Bash позволяет добавить Semble в любые скрипты или под-агенты, которые не могут напрямую вызывать MCP-инструменты. Индексирование использует библиотеку Chonkie для разделения файлов на код-осведомленные фрагменты. Запрос обрабатывается двумя ретреиверами: статические embeddings на основе модели potion-code-16M для семантического сходства и BM25 для лексического поиска по идентификаторам. Результат объединяется с помощью Reciprocal Rank Fusion (RRF), после чего ранжирование уточняется на основе сигналов типа, определения символов и когерентности файла. Тестовые файлы и легаси-коды де-приоритизируются, чтобы приоритетные реализации появлялись первыми.

В бенчмарках на ~1,250 запросах в 63 репозиториях Semble превосходит другие методы по скорости и точности. Например, он работает в 218 раз быстрее индексации CodeRankEmbed Hybrid и в 11 раз быстрее по ответам на запросы, сохраняя при этом 99% производительности. Агенты, использующие grep+read, тратят контекстное окно на нерелевантный код, тогда как Semble достигает 94% recall с бюджетом всего 2k токенов, в то время как grep+read требует 100k. Это позволяет агентам экономить токены и быстро находить код. Инструмент доступен как отдельная CLI утилита или Python библиотека. Если у вас нет uv на пути, используйте uvx --from "semble[mcp]" semble. Статистика экономии токенов хранится в файле ~/.semble/savings.jsonl. При необходимости обновить версию достаточно выполнить pip install --upgrade semble или uv tool upgrade semble. Лицензия MIT.