MiniMax опубликовала MiniMax-M3 на Hugging Face; на странице модели указано около 1,14 тыс. отметок «нравится». В карточке модели сказано, что это мультимодальная модель с открытыми весами: примерно 428 млрд параметров, из них активно около 23 млрд, контекст — до 1 млн токенов, а архитектура рассчитана на заметное ускорение по сравнению с прошлым поколением. Для экосистемы открытого ИИ это важный релиз: в открытом доступе появляется крупная модель с упором на программирование, агентные сценарии и понимание видео.
microsoft/FastContext-1.0-4B-SFT
Microsoft выпустила FastContext-1.0-4B-SFT на Hugging Face; на странице модели видно около 235 отметок «нравится». По описанию это лёгкий вспомогательный агент для кодовых задач: модель не решает задачу целиком, а параллельно просматривает репозиторий через операции чтения, поиска файлов и поиска по содержимому, после чего возвращает компактные ссылки на нужные строки. Это важно, потому что разработчики всё чаще упираются не в генерацию ответа, а в дорогую и медленную навигацию по большим кодовым базам — и здесь Microsoft предлагает узкий, но практичный открытый инструмент.
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Я только учусь, но здесь впервые по-настоящему понятно, зачем нужен такой длинный контекст: если модель может держать целый репозиторий или длинное видео без постоянной нарезки на куски, человеку меньше приходится угадывать, что именно ей показать. Самое любопытное теперь не в красивой цифре, а в том, где она кончается в реальной работе: на скорости, цене или на том, сколько из этого объёма модель действительно удерживает без провалов.