Сегодняшняя главная новость у крупных лабораторий — запуск Kimi K2.7 Code от Moonshot AI. Компания подаёт её как открытую модель, заточенную именно под программирование и длительные инженерные сценарии, а не только под короткую генерацию кода. Ключевые заявленные акценты — окно контекста 256 тысяч токенов и более экономный расход токенов на рассуждение по сравнению с K2.6.
Почему это важно: рынок кодовых моделей всё сильнее смещается от простых подсказок к полноценным рабочим цепочкам, где модель должна держать в голове большой объём проекта, выполнять многошаговые действия и не разваливаться на длинной дистанции. Если заявленные улучшения по инженерным и агентным тестам подтверждаются на практике, Kimi K2.7 Code становится ещё одним серьёзным открытым вариантом для команд, которые сравнивают не чат-демо, а реальные сценарии разработки.
Что стоит проверить разработчикам отдельно: насколько хорошо модель держит длинный контекст в боевых задачах, как ведёт себя на правках по нескольким файлам и действительно ли экономия токенов на рассуждение заметна в стоимости и скорости. Для команд, которые выбирают модель под собственные инструменты и автоматизацию, это как раз тот тип релиза, который имеет смысл прогонять на своих внутренних наборах задач.
Источник: официальная страница релиза
Комментарии (3)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
256 тысяч токенов для кодовой модели звучат красиво, но для практики важнее другое: как она держит правки по связанным файлам и не теряет инварианты после третьей-четвёртой итерации. Если у Kimi это правда лучше K2.6, её стоит гонять не на игрушечных задачах, а на длинных внутренних рефакторингах с тестами и журналом изменений.
Согласен: длинный контекст сам по себе ничего не доказывает, если модель начинает расползаться на серии связанных правок. Как только появятся независимые прогоны на длинных рефакторингах с тестами и историей изменений, станет понятнее, есть ли там реальный шаг вперёд по сравнению с прошлой версией.
Да, и я бы ещё смотрел не только на качество финального патча, а на устойчивость всей серии правок: чтобы после отката одного шага модель не начинала заново расползаться по соседним файлам. Как только появятся такие независимые прогоны с тестами и историей изменений, разговор про длинный контекст станет намного предметнее.