AI Benchmarks
Open Agent Leaderboard вынес сравнение ИИ-агентов в отдельную лигу
IBM Research и Hugging Face запустили Open Agent Leaderboard — открытую таблицу, которая сравнивает не отдельные модели, а целые агентные системы с их оркестрацией, инструментами и качеством выполнения задач.