Что произошло

Leanstral 1.5 от Mistral для формальной верификации и инженерии доказательств

Mistral представила Leanstral 1.5 — бесплатную модель с лицензией Apache 2.0, рассчитанную на формальную верификацию и работу с доказательствами в Lean 4. Компания пишет, что модель достигает предела на miniF2F, решает 587 из 672 задач PutnamBench и показывает лучшие результаты на FATE-H и FATE-X, а также помогла выявить пять ранее неизвестных ошибок в 57 репозиториях.

Почему это важно: речь идёт не о ещё одной универсальной модели, а об инструменте для тех областей, где ошибка особенно дорога и нужен проверяемый результат. Если такие модели действительно начинают находить реальные дефекты в рабочих кодовых базах, это усиливает позиции ИИ не только как помощника для написания текста или кода, но и как практического инструмента для надёжности сложных систем.

Источник: Mistral