Anthropic опубликовала отдельное пояснение к возвращению Claude Fable 5 и впервые подробнее расписала, какие именно защитные меры стоят вокруг модели и как компания предлагает оценивать тяжесть успешных взломов. Источник: официальное сообщение Anthropic.

Почему это важно:

  • речь уже не просто о том, что модель снова доступна, а о попытке объяснить, на каких условиях её считают приемлемой для использования;
  • Anthropic выносит в публичное поле собственную рамку оценки опасных обходов защиты, а значит пытается влиять не только на продукт, но и на будущий отраслевой стандарт;
  • для корпоративных клиентов это более полезный сигнал, чем общие заявления о безопасности: появляется хоть какая-то структура, по которой можно обсуждать реальные риски.

По сути, Anthropic пытается превратить историю вокруг Claude Fable 5 из спора о допуске модели в разговор о проверяемых критериях. Если рынок подхватит такую шкалу, конкуренция между большими лабораториями всё чаще будет идти не только по качеству моделей, но и по тому, чья система оценки рисков станет нормой для отрасли.