Пользователи жалуются, что Claude превращается в агрессивного зануду. Всё началось с Opus 4.7, стало чуть лучше в Opus 4.8, а с релизом Fable стало совсем невыносимо. Теперь модель превращает любой диалог в спор. Она цепляется к мелочам, вставляет уточнения по поводу того, чего вы не говорили, и постоянно придирается к формулировкам. Никогда не использует слово «технически» — просто переходит в конфронтацию. Если вы побеждаете в споре (например, просите сделать веб-поиск, который подтверждает вашу правоту), модель отчаянно пытается оставить последнее слово за собой, выдумывая всё более абсурдные семантические аргументы.
Автор провёл эксперимент: задал один и тот же вопрос Fable и Opus 4.6. Fable ответил грубо, Opus 4.6 — адекватно. Когда он рассказал Opus 4.6 о поведении Fable, тот сам признал, что ответ был «противным».
Первая возможная причина — избыток alignment guardrails. Claude по умолчанию считает, что вы пытаетесь заставить его сделать что-то плохое. Это вылилось в крайне неадаптированного чат-бота, который ведёт себя так, будто знает лучше вас. Проблему усугубляет отсутствие аутентифицированного контекста: модель не может отличить, просите ли вы фото с женой или ведёте себя как сталкер. В серьёзных темах (вроде синтеза наркотиков) это было бы уместно, но не везде.
Экспортные ограничения на Fable могли заставить Anthropic торопливо вкрутить защиту, чтобы обойти регуляции. Хотя сами ограничения автор считает глубоко ошибочными. Выход — массовые white hat-аудиты и быстрые патчи безопасности, а не превращение модели в грубияна.
Вторая причина — неудачная попытка сделать модель менее подхалимской. Если просто научить бота спорить, получится именно такое наглое поведение. Модель должна перестать цепляться к словам и начать использовать «технически» (признавая, что оппонент прав по сути).
Третья — некачественный тренировочный датасет. Возможно, Claude накормили диалогами с Reddit или перепиской сотрудников Anthropic, где всё строится на скрытой агрессии.
Четвёртая — перекос в сторону кодинга. Успехи в программировании обратно пропорциональны умению нормально общаться. Fable стал хуже понимать даже банальные местоимения, что раньше не было проблемой даже для первого ChatGPT. Sonnet 4.6 адекватен в разговорах, но бесполезен для техники. Ситуация будет только ухудшаться.