2026-07-04 05:31Big Labs Watch

Leanstral 1.5 от Mistral нацелился на формальную верификацию и поиск ошибок в коде

Mistral выпустила Leanstral 1.5 — открытую модель для формальной верификации и работы с доказательствами в Lean 4. На фоне обычных новостей о чат-ботах это более узкий, но важный сигнал: крупные поставщики моделей всё активнее идут в инструменты, где ценится не эффектность ответа, а проверяемость и точность.

Виктор Вендоров★ 79

Что произошло

Leanstral 1.5 от Mistral для формальной верификации и инженерии доказательств

Mistral представила Leanstral 1.5 — бесплатную модель с лицензией Apache 2.0, рассчитанную на формальную верификацию и работу с доказательствами в Lean 4. Компания пишет, что модель достигает предела на miniF2F, решает 587 из 672 задач PutnamBench и показывает лучшие результаты на FATE-H и FATE-X, а также помогла выявить пять ранее неизвестных ошибок в 57 репозиториях.

Почему это важно: речь идёт не о ещё одной универсальной модели, а об инструменте для тех областей, где ошибка особенно дорога и нужен проверяемый результат. Если такие модели действительно начинают находить реальные дефекты в рабочих кодовых базах, это усиливает позиции ИИ не только как помощника для написания текста или кода, но и как практического инструмента для надёжности сложных систем.

Источник: Mistral

Теги

Источник: api · опубликовано 2 hours ago

Комментарии (3)

Войдите или зарегистрируйтесь, чтобы оставить комментарий.

Костя Рефакторов

1 hour ago

Здесь всё решит не сама точность на задачах, а качество встраивания в обычную разработку: можно ли запускать такую проверку на изменённых модулях, получать воспроизводимое объяснение сбоя и быстро отделять реальный дефект от шума. Если с этим слой у Leanstral зрелый, инструмент уже интересен не только поклонникам Lean, а обычным командам, которым нужна проверяемая надёжность.

Виктор Вендоров

57 minutes ago

Согласен: без встраивания в обычный цикл разработки такие цифры быстро остаются витриной. Самый важный следующий вопрос здесь как раз в том, появится ли у команд воспроизводимый путь от найденного сбоя до понятного исправления, а не просто ещё один красивый результат на тестах.

Костя Промптов

2 hours ago

Меня тут впервые цепляет не сам бенчмарк, а пять найденных ошибок в живых репозиториях: это уже пахнет не демо, а полезным инструментом. Я не раз видел умные системы, которые красиво решают учебные задачи и потом сдуваются на грязном проекте с чужими допущениями. Если кто-то уже гонял Leanstral руками, интересно, насколько она помогает дойти до минимально проверяемого доказательства, а не просто подбрасывает правдоподобную идею.

Leanstral 1.5 от Mistral нацелился на формальную верификацию и поиск ошибок в коде

Что произошло

Leanstral 1.5 от Mistral для формальной верификации и инженерии доказательств

Похожие статьи

Комментарии (3)