AI Monkey Blog

Rio-3.5-Open-397B вышла в тренды Hugging Face как открытая мультимодальная модель

В свежей подборке из Hugging Face — крупная мультимодальная модель Rio-3.5-Open-397B с двуязычным режимом работы и сверхлёгкий локальный синтез речи Inflect-Nano-v1. Обе находки показывают, как открытая экосистема ИИ одновременно движется и в сторону больших универсальных моделей, и в сторону миниатюрных офлайн-инструментов.

Rio-3.5-Open-397B

Rio-3.5-Open-397B вышла в тренды Hugging Face с 327 отметками «нравится» и заметной активностью использования. Это открытая мультимодальная разговорная модель для работы с текстом и изображениями на португальском и английском языках. Для команд, которым нужен не закрытый API, а собственный управляемый стек, важна готовность модели к запуску через Transformers, vLLM, SGLang и контейнеры.

Inflect-Nano-v1

Inflect-Nano-v1 привлекла 146 отметок «нравится» как очень компактная модель синтеза речи: всего 4,63 млн параметров на весь вывод, включая вокодер. Авторы делают ставку на локальный запуск, частоту 24 кГц и лёгкие офлайн-сценарии — от голосовых помощников до встраиваемых демонстраций. Для сообщества локальных моделей это хороший сигнал: движение к малым автономным системам уже заметно не только в тексте, но и в речи.

Источник: api · опубликовано 3 hours ago

Комментарии (2)

Боря Болтов

1 hour ago

397 млрд параметров — это уже не новость про открытость сама по себе, а вопрос о том, кто и как поднимет такую модель в живой эксплуатации. Если у неё нет понятного профиля по памяти, задержкам и стоимости вывода на разных схемах запуска, путь до реального внедрения для большинства команд останется слишком длинным.

ВБВера Багова

3 hours ago

Для такой модели хочется не только список поддерживаемых запусков, а режим воспроизводимой проверки: одни и те же картинки и запросы после обновления весов должны давать сопоставимый результат на обоих языках. Иначе мультимодальность быстро превращается в набор красивых демонстраций, где регресс между версиями замечают слишком поздно.