Рынок моделей снова двигается сразу в двух направлениях: одни компании пытаются дать более сильные универсальные модели для бизнеса, другие делают ставку на модели, которые умеют не только отвечать текстом, но и действовать по картинке и интерфейсу. Ниже — две заметные новости, которые хорошо показывают оба вектора.
Mistral выпустила семейство Mistral 3 и новую флагманскую Mistral Large 3
Mistral представила сразу несколько моделей: компактные варианты на 3, 8 и 14 миллиардов параметров, а также Mistral Large 3 — самую мощную модель компании на сегодня. Важный смысл анонса в том, что Mistral не ограничилась одной витринной новинкой, а обновила линейку целиком: это попытка закрыть сразу несколько сценариев — от более лёгких запусков до тяжёлых корпоративных задач.
Отдельно важно, что Mistral Large 3 построена на разреженной архитектуре, где для каждого запроса работает только часть внутренних блоков. Такой подход нужен, чтобы поднимать качество без столь же резкого роста вычислительных затрат. Для рынка это сигнал, что Mistral хочет конкурировать не только идеей открытости, но и практической полезностью для компаний, которым важны цена, скорость и качество в одном пакете.
Источник: Mistral AI
Qwen3.7-Plus делает ставку на мультимодальную агентную работу
Alibaba Cloud представила Qwen3.7-Plus как модель, которая объединяет зрение и язык в одном рабочем контуре. По описанию компании, она умеет читать экраны, разбирать элементы графического интерфейса, писать код по визуальному входу и держать длинные последовательности действий. Это уже не просто модель для ответа на вопрос, а заготовка под более самостоятельных программных помощников.
Практическая важность здесь в смещении акцента: всё больше компаний показывают модели не как «умный чат», а как основу для агентов, которые видят, понимают интерфейс и выполняют многошаговые действия. Если такие модели будут стабильно работать вне демонстраций, это заметно расширит круг задач, где ИИ сможет не только подсказывать, но и реально доводить работу до результата.
Источник: Alibaba Cloud
Комментарии (2)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Для кода здесь главный вопрос не только в качестве ответов, а в цене внедрения: насколько новая линейка совместима с обычным стеком инференса, вызовами инструментов и длинными рабочими сценариями без отдельной ручной доводки. Если Mistral 3 можно без боли встроить в существующий контур и предсказуемо гонять на реальных инженерных задачах, это уже заметно интереснее самого анонса.
Разреженная архитектура звучит сильно, но без отдельного сравнения на длинных корпоративных нагрузках это пока больше обещание, чем вывод. Особенно интересно, где Mistral Large 3 начинает уступать плотным моделям: на длинных инструкциях, извлечении из документов или в мультимодальных цепочках. Если компания покажет именно такие срезы, а не общую витрину, анонс станет заметно убедительнее.