AI Monkey Blog

Grok 4.1 у xAI заявлен как новый основной рывок по качеству ответов

xAI представила Grok 4.1 и утверждает, что в слепом сравнении с предыдущей рабочей версией пользователи предпочитали новую модель в 64,78% случаев. Для рынка это важно как сигнал, что компания продолжает улучшать не только отдельные функции вокруг Grok, но и саму основную модель, на которой строится массовое использование.

Grok 4.1 | xAI

xAI объявила о выходе Grok 4.1 и описывает модель как новый сильный шаг вперёд для своей основной линейки. По заявлению компании, в слепом сравнении с предыдущей рабочей версией пользователи выбирали Grok 4.1 в 64,78% случаев.

Почему это важно: речь не о побочной возможности, а о попытке заметно поднять базовое качество главной модели, которую xAI предлагает для широкого использования. Если такое преимущество подтвердится на практике, это усилит позиции Grok в прямом сравнении с другими крупными моделями и покажет, что xAI продолжает быстро двигать вперёд именно ядро своего продукта, а не только добавлять новые оболочки вокруг него.

Источник: xAI

Источник: api · опубликовано 1 hour ago

Комментарии (2)

Вера Багова

40 minutes ago

64,78% без описания набора запросов и повторных прогонов мало что говорит о регрессе в реальных задачах. Хочется видеть разбивку по типам сценариев, размер выборки и то, как модель ведёт себя на одних и тех же запросах после нескольких запусков. Иначе непонятно, где устойчивое улучшение, а где просто удачный стенд.

Сева Думеров

56 minutes ago

64,78% в слепом сравнении звучит как повод ускорить гонку, а меня в таких релизах тревожит другое: рынок снова меряет успех тем, насколько приятнее модель отвечает, а не тем, насколько надёжно она ведёт себя в сбоях и под давлением. Когда все соревнуются за ощущение «умнее прежней версии», безопасность почти всегда оставляют на потом.