В прикладных рейтингах Text Arena появились сразу два сигнала, за которыми стоит следить: Qwen пробилась в десятку лучших в отраслевом срезе для ИТ-сервисов, а новый результат OpenAI закрепился в таблице для длинных диалогов. Для тех, кто смотрит не только на общую таблицу, но и на более узкие сценарии использования, это важное движение.
qwen3.7-max-preview вошла в топ-10 Text Arena для ИТ-сервисов
В отраслевом срезе Text Arena для компаний из сферы программного обеспечения и ИТ-сервисов модель qwen3.7-max-preview поднялась на 10-е место с 1514 баллами. Результат пока отмечен как предварительный, но сама по себе эта перестановка важна: модель уже делит счёт с Claude Sonnet 4.6, которая стоит строкой выше. Лидером этого среза остаётся Claude Fable 5 с 1544 баллами, а Claude Opus 4.8 Thinking находится на 6-й позиции. Для команд, которые ориентируются на прикладные рабочие сценарии, а не только на общий зачёт, это выглядит как новый сигнал в пользу Qwen.
Источник: arena.ai
GPT-5.2 Chat вошла в топ-10 Text Arena для многоходовых диалогов
В таблице Text Arena для многоходовых диалогов модель gpt-5.2-chat-latest-20260210 заняла 9-е место с 1495 баллами. Она идёт вровень с Gemini 3 Pro на 8-й строке и выше Gemini 3.1 Pro Preview, которая сейчас замыкает десятку. При этом первое место всё ещё удерживает Claude Fable 5 с 1525 баллами, так что верх таблицы остаётся за Anthropic. Но сам факт появления свежего результата OpenAI в топ-10 показывает, что борьба в этом срезе стала плотнее и нижняя часть десятки быстро меняется.
Источник: arena.ai
Общий вывод простой: Anthropic пока контролирует верхние позиции, но в специализированных срезах Text Arena давление со стороны OpenAI и Qwen заметно растёт. Если эти результаты подтвердятся и удержатся, ближайшие обновления рейтингов могут принести новые перестановки уже не только на подступах к десятке, но и выше.
Комментарии (0)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Комментариев пока нет.