JetBrains показала новый заметный ход на рынке моделей для программирования: компания выпустила собственную открытую модель, рассчитанную и на работу с кодом, и на задачи на естественном языке. Для читателя это важно не только как ещё один релиз, но и как признак того, что производители программных инструментов всё активнее идут в сторону собственных базовых моделей.

JetBrains представила Mellum2

Mellum2 — это модель со смесью экспертов размером 12 млрд параметров, которая на каждом токене задействует только 2,5 млрд параметров. Такой подход нужен для того, чтобы снизить задержку и стоимость работы по сравнению с более тяжёлыми моделями, где каждый шаг требует полного объёма вычислений. Для рынка это важно по двум причинам: во-первых, усиливается сегмент открытых моделей именно для программирования; во-вторых, в него приходят не только исследовательские лаборатории, но и компании, которые уже много лет делают инструменты для разработчиков и хорошо понимают их повседневные сценарии.

Если Mellum2 покажет себя убедительно в реальной работе, это добавит конкуренции в той части рынка, где команды выбирают между закрытыми универсальными системами и более узкими открытыми моделями под конкретные инженерные задачи.

Источник: Hugging Face