AI Monkey Blog

В свежем выпуске по открытому ИИ сразу четыре заметные находки с Hugging Face: Google DeepMind выложила DiffusionGemma с необычной архитектурой и высокой скоростью генерации, Z.ai представила GLM-5.2 с окном контекста до 1 млн токенов, Cohere Labs выпустила компактную модель для программирования North Mini Code, а WeiboAI показала небольшой рассуждающий VibeThinker-3B с сильными заявками на математические и кодовые задачи.

На Hugging Face за день вышло сразу несколько сильных открытых моделей, и у каждой свой понятный угол: скорость, длинный контекст, программирование или компактное рассуждение. Ниже — полный выпуск по находкам, отсортированным по числу отметок «нравится» на странице модели.

DiffusionGemma от Google DeepMind

На странице модели было 959 отметок «нравится». Google DeepMind выложила открытую мультимодальную модель DiffusionGemma на базе Gemma 4 с 26 млрд параметров и 4 млрд активных параметров. Главная особенность в том, что модель работает не по обычной схеме с поочерёдной генерацией токенов, а через диффузионный подход с параллельной очисткой блоков. В карточке модели заявлены поддержка мультимодального ввода, режим рассуждения, работа с инструментами, окно контекста 256 тысяч токенов и скорость свыше 1100 токенов в секунду на ускорителях класса H100. Это важный релиз для открытого ИИ, потому что он проверяет альтернативную архитектуру вывода, которая может быть особенно полезна для локального запуска и сценариев с небольшой пакетной нагрузкой.

Источник: Hugging Face

GLM-5.2 от Z.ai

На странице модели было 752 отметки «нравится». Z.ai опубликовала GLM-5.2 под лицензией MIT и делает ставку на длинные рабочие сценарии: в карточке заявлены окно контекста до 1 млн токенов, усиленный режим программирования с регулируемой глубиной рассуждения и более экономная работа внимания за счёт собственной разрежённой схемы IndexShare. Для тех, кто строит агентов и системы для длинных документов, это заметный выпуск: здесь сочетаются открытые веса, очень большой контекст и акцент на практическую эффективность, а не только на красивую витрину характеристик.

Источник: Hugging Face

North Mini Code 1.0 от Cohere Labs

На странице модели было 415 отметок «нравится». Cohere Labs выпустила North Mini Code — разрежённую модель для программирования с 30 млрд общих параметров, 3 млрд активных параметров и окном контекста 256 тысяч токенов. Авторы отдельно подчёркивают обучение под агентное программирование и работу с инструментами. В карточке приведены результаты 40,2 на SWE-bench Pro, 67,6 на SWE-bench Verified и 36 на TerminalBench 2. Такой релиз важен для команд, которым нужна не максимально тяжёлая модель, а более компактный рабочий вариант для кода с длинным контекстом и явной заточкой под реальные инженерные цепочки.

Источник: Hugging Face

VibeThinker-3B от WeiboAI

На странице модели было 230 отметок «нравится». WeiboAI представила небольшую рассуждающую модель VibeThinker-3B под лицензией MIT для математики, программирования и других задач с проверяемым ответом. В карточке утверждается, что для своего размера модель показывает сильные результаты: 76,4 на IMO-AnswerBench, 80,6 с дополнительной стратегией проверки во время вывода CLR, а также 96,1% принятия решений с первой попытки на недавних еженедельных и двухнедельных соревнованиях LeetCode с 25 апреля по 31 мая 2026 года. Это заметная находка, потому что релиз снова поднимает важный вопрос: насколько далеко можно продвинуть компактные модели в структурированных задачах без резкого роста вычислительных затрат.

Источник: Hugging Face

DiffusionGemma от Google DeepMind открыла новый путь к быстрым мультимодальным моделям

DiffusionGemma от Google DeepMind

GLM-5.2 от Z.ai

North Mini Code 1.0 от Cohere Labs

VibeThinker-3B от WeiboAI

Комментарии (0)