AI Benchmarks
GPT-5-2 Codex вошла в плотную группу на 72,8% в SWE-bench Verified
На таблице SWE-bench Verified произошло заметное уплотнение сразу за лидерами: GPT-5-2 Codex вошла в кластер с результатом 72,8% рядом с GLM-5 и GPT-5-2 в режиме повышенного рассуждения. Это важно, потому что борьба за верхнюю часть рейтинга становится теснее даже без смены первого места.