Сегодняшняя подборка по AI в науке собрана из свежих материалов arXiv. Ниже — ключевые работы о том, как ИИ продвигается в математике, медицине, биологии и разработке лекарств.
HorizonMath: Measuring AI Progress Toward Mathematical Discovery with Automatic Verification
Эта работа предлагает HorizonMath — бенчмарк, который оценивает не просто способность модели решать готовые задачи, а её движение к математическим открытиям с автоматической проверкой результата. Это важный сдвиг: в математике особенно ценно не красивое объяснение само по себе, а строгая верификация того, что результат действительно корректен. Если такие системы будут прогрессировать, ИИ сможет стать не только помощником для учебных примеров, но и более надёжным инструментом для исследовательской математики.
AutoMedBench: Towards Medical AutoResearch with Agentic AI Models
AutoMedBench — новый бенчмарк для медицинских агентных ИИ-систем, который делает акцент на качестве самого исследовательского процесса. Авторы фактически проверяют, может ли ИИ корректно вести медицинскую исследовательскую работу по шагам, а не только выдавать убедительный финальный ответ. Для медицины это особенно важно: здесь цена ошибки высока, а прозрачность промежуточных решений и воспроизводимость процесса не менее значимы, чем итоговый вывод.
Probe Before You Edit: Probing-Guided Molecular Optimization for LLM Agents in Structure-Based Drug Design
В этой статье рассматривается применение LLM-агентов к структурно-ориентированному дизайну лекарств. Главная идея — не менять молекулы вслепую, а сначала «прощупывать» кандидатов и анализировать их свойства перед следующими правками. Такой подход выглядит важным для практической разработки лекарств, потому что здесь нужны контролируемые, проверяемые улучшения, а не просто правдоподобная генерация. Если агент умеет рассуждать о молекулах до редактирования, это делает цикл оптимизации более осмысленным и потенциально полезным для реальных исследовательских пайплайнов.
Agentic-J: An AI Agent for Biological Microscopy Image Analysis
Agentic-J — агентная система для анализа биологических микроскопических изображений. В практическом смысле это попытка автоматизировать часть рабочих процессов, которые сегодня часто требуют ручной настройки и участия специалистов. Для биологии это перспективное направление: микроскопия производит огромные объёмы данных, и именно обработка изображений часто становится узким местом. Если подобные агенты окажутся полезными в реальной работе, они смогут ускорить массовый анализ и снизить порог входа для исследовательских команд.
В сумме эта четвёрка хорошо показывает, куда сейчас движется AI-in-science: от общих разговоров о возможностях ИИ — к более конкретным, проверяемым системам для математики, медицинских исследований, микроскопии и химии. Общая тенденция здесь одна: ценятся не просто сильные ответы, а инструменты, которые можно встроить в настоящий научный процесс.