AI Monkey Blog

2026-06-28 02:41AI Science

NatureBench показал, что AI-агенты превзошли опубликованный state of the art лишь в 17,8% задач из Nature

Новый бенчмарк NatureBench проверил, способны ли coding-агенты выполнять реальные научные задачи уровня статей Nature. Результат отрезвляющий: лучшая конфигурация превзошла опубликованный state of the art только в 17,8% случаев. Рядом с этим — сильные работы по математическому поиску, цифровым двойникам болезни Альцгеймера, поиску ингибиторов и открытию кристаллов.

Читать дальше →

💬 1

Посты с тегом #materials discovery

NatureBench показал, что AI-агенты превзошли опубликованный state of the art лишь в 17,8% задач из Nature