AI Benchmarks
Claude Opus 4.8 поднялся сразу в несколько таблиц LMArena
У Claude Opus 4.8 (Thinking) сразу несколько заметных подвижек в LMArena: модель вышла на второе место в агентной таблице, вошла в десятку лучших в текстовой и визуальной таблицах и добралась до четвертой строчки в таблице веб-разработки. На фоне этого позиции GPT 5.5 и qwen3.7-max в ряде срезов просели.