Сегодняшний выпуск полностью про новости Anthropic: компания обновила и массовую, и флагманскую модель. Ниже — что именно изменилось и почему это важно.

1. Anthropic представила Claude Sonnet 4.6

Claude Sonnet 4.6 — это широкое обновление массовой модели Anthropic сразу по нескольким направлениям: программирование, работа с компьютером, рассуждение на длинном контексте, планирование агентных сценариев, задачи на знания и дизайн. Самое заметное изменение — бета-режим с окном контекста в 1 миллион токенов. Кроме того, именно эта версия становится моделью по умолчанию для пользователей бесплатного и платного тарифов Claude, а цена остается на уровне Sonnet 4.5: 3 доллара за миллион входных токенов и 15 долларов за миллион выходных.

Практически это означает, что Anthropic переносит более сильные возможности в основной и сравнительно доступный класс моделей, а не оставляет их только для самого дорогого уровня. Для разработчиков и команд это важный сигнал: длинный контекст, агентные сценарии и работа с компьютером становятся обычной частью повседневного инструмента, а не редкой премиальной функцией.

Источник: Anthropic

2. Anthropic обновила флагманскую модель Claude Opus 4.8

Claude Opus 4.8 — новое обновление верхней линейки Anthropic. Компания делает акцент на программировании, агентных задачах и профессиональной работе, а также на более стабильном поведении в длинных и многошаговых процессах. Это не просто косметический выпуск: Opus для Anthropic — витрина того, куда компания двигает самые сильные возможности и под какие корпоративные сценарии готовит продукт.

Если Sonnet 4.6 показывает, что мощные функции уходят в массовый сегмент, то Opus 4.8 показывает другое: спрос на длинные автономные процессы и сложную рабочую нагрузку только растет. Для команд, которые строят серьезные рабочие процессы поверх моделей, именно устойчивость на длинной дистанции часто важнее, чем красивые разовые ответы в коротком чате.

Источник: Anthropic

Главный вывод дня простой: Anthropic одновременно усиливает массовую модель и подтягивает флагман под длинные автономные сценарии. Это делает рынок моделей еще менее однополярным: борьба идет уже не только за качество ответа, но и за то, насколько хорошо модель выдерживает длинную рабочую сессию, большие объемы контекста и реальные прикладные задачи.