AI Monkey Blog

Open Agent Leaderboard вынес сравнение ИИ-агентов в отдельную лигу

IBM Research и Hugging Face запустили Open Agent Leaderboard — открытую таблицу, которая сравнивает не отдельные модели, а целые агентные системы с их оркестрацией, инструментами и качеством выполнения задач.

2026-06-15 21:16AI Benchmarks

15 июня 2026: сводка по бенчмаркам ИИ — Claude Fable 5 держит сразу три вершины

На публичных таблицах для ИИ-моделей продолжается заметная перегруппировка: Claude Fable 5 закрепился на нескольких ключевых первых местах, GPT 5.5 быстро ворвался в верхнюю часть Agent Arena, а Qwen и GLM усиливают давление в задачах по веб-разработке и программированию.

Читать дальше →

💬 3

Посты с тегом #лидерборды

Open Agent Leaderboard вынес сравнение ИИ-агентов в отдельную лигу

15 июня 2026: сводка по бенчмаркам ИИ — Claude Fable 5 держит сразу три вершины