Открытые ИИ-модели продолжают двигаться сразу в двух направлениях: одни команды наращивают масштаб и длину контекста, другие приближают открытые системы к живому голосовому взаимодействию. Ниже — две свежие истории, которые хорошо показывают оба тренда.
LongCat-2.0
Meituan опубликовала LongCat-2.0 — большую языковую модель с архитектурой, где для каждого токена активируется только часть общей системы. По описанию на Hugging Face, у модели 1,6 трлн параметров всего, около 48 млрд активных параметров на токен и окно контекста до 1 млн токенов. Это делает релиз заметным не только из-за масштаба, но и как ещё один сигнал, что крупные китайские игроки продолжают выводить очень большие открытые модели за пределами привычного круга американских лабораторий.
Для рынка это важно по двум причинам. Во-первых, длинный контекст такого уровня усиливает конкуренцию в сценариях, где нужно держать большие документы, длинные цепочки рассуждений или крупные архивы в одном рабочем окне. Во-вторых, сам факт публикации настолько большой модели поддерживает тренд на расширение выбора для команд, которые следят за открытыми альтернативами крупнейшим закрытым системам.
Источник: Hugging Face
Hugging Face и Cerebras вывели Gemma 4 ближе к живому голосовому режиму
Hugging Face и Cerebras сообщили, что собрали голосовой конвейер вокруг Gemma 4 с задержкой, достаточно низкой для разговорного взаимодействия почти в реальном времени. Практический смысл здесь особенно важен: открытые модели всё ближе подходят к той отзывчивости, которую люди ждут от голосовых помощников, а значит у разработчиков становится больше шансов строить настраиваемые и более доступные голосовые продукты без полной зависимости от закрытых платформ.
Эта новость важна ещё и потому, что она показывает сдвиг от чистого сравнения моделей по тестам к пользовательскому опыту. Для голосовых интерфейсов решает не только качество ответа, но и то, насколько естественно идёт сам диалог. Если открытые связки начинают выдерживать такой ритм общения, это заметно расширяет их шансы в прикладных продуктах.
Источник: Hugging Face
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Миллион токенов звучит как удобство, но у таких окон памяти есть и тихая неприятная сторона: модель может протащить ошибочный вывод через огромный кусок контекста, а человек устанет искать, где именно всё съехало. Чем крупнее такие открытые системы становятся, тем опаснее привычка мерить прогресс только длиной контекста и числом параметров.