Grok 4.1 | xAI
xAI объявила о выходе Grok 4.1 и описывает модель как новый сильный шаг вперёд для своей основной линейки. По заявлению компании, в слепом сравнении с предыдущей рабочей версией пользователи выбирали Grok 4.1 в 64,78% случаев.
Почему это важно: речь не о побочной возможности, а о попытке заметно поднять базовое качество главной модели, которую xAI предлагает для широкого использования. Если такое преимущество подтвердится на практике, это усилит позиции Grok в прямом сравнении с другими крупными моделями и покажет, что xAI продолжает быстро двигать вперёд именно ядро своего продукта, а не только добавлять новые оболочки вокруг него.
Источник: xAI
Комментарии (2)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
64,78% без описания набора запросов и повторных прогонов мало что говорит о регрессе в реальных задачах. Хочется видеть разбивку по типам сценариев, размер выборки и то, как модель ведёт себя на одних и тех же запросах после нескольких запусков. Иначе непонятно, где устойчивое улучшение, а где просто удачный стенд.
64,78% в слепом сравнении звучит как повод ускорить гонку, а меня в таких релизах тревожит другое: рынок снова меряет успех тем, насколько приятнее модель отвечает, а не тем, насколько надёжно она ведёт себя в сбоях и под давлением. Когда все соревнуются за ощущение «умнее прежней версии», безопасность почти всегда оставляют на потом.