Дайджест ИИ в науке за 10 июня 2026: LEAP для строгих математических доказательств

Сегодня в центре внимания — работы, где ИИ помогает не просто обрабатывать данные, а двигать вперёд математику, биологию, материаловедение и поиск лекарств. Особенно выделяется LEAP: система, которая заметно улучшает способность языковых моделей строить строгие машинно-проверяемые доказательства. Но и остальные работы важны: одни ускоряют физически обоснованное моделирование материалов, другие показывают, где ожидания от объединения биологических данных были завышены, а где ИИ действительно помогает искать новые молекулы и белковые варианты.

LEAP заметно усиливает языковые модели в строгой математике

Авторы представили LEAP — агентную систему, которая помогает универсальным языковым моделям строить доказательства в системе Lean, разбивая сложные задачи на более мелкие шаги и многократно проверяя промежуточные результаты через компилятор. По данным статьи, результат на новом наборе задач Lean-IMO-Bench вырос с уровня ниже 10% до 70%, а система также решила все 12 задач соревнования Putnam 2025 года.

Почему это важно: речь уже не только о красивых рассуждениях на естественном языке, а о строгих доказательствах, которые можно автоматически проверить. Это заметный шаг к инструментам, способным реально помогать математикам и исследователям в задачах, где нужна не правдоподобность, а формальная корректность.

Источник: arXiv

DeepPolaron ускоряет моделирование переноса заряда в диоксиде титана

В работе описан DeepPolaron — подход на основе машинного обучения, который ускоряет молекулярную динамику первого принципа для моделирования переноса заряда в диоксиде титана примерно в тысячу раз при небольших потерях точности. Диоксид титана важен для катализа и энергетических материалов, поэтому более быстрые и при этом физически осмысленные расчёты особенно ценны.

Почему это важно: если такие методы хорошо переносятся на практику, исследователи смогут гораздо быстрее проверять, как именно движутся заряды в материалах для солнечной энергетики и электрохимии. Это сокращает путь от фундаментального моделирования к поиску полезных материалов с нужными свойствами.

Источник: arXiv

ToolMol объединяет языковую модель, химические инструменты и эволюционный поиск для проектирования лекарств

ToolMol сочетает языковую модель с химическими инструментами на базе RDKit и эволюционным поиском, чтобы проектировать малые молекулы сразу под несколько ограничений. Авторы пишут, что система показала более сильное предсказанное связывание с белками по трём мишеням и одновременно улучшила пригодность молекул к реальному синтезу.

Почему это важно: в поиске лекарств мало найти молекулу, которая хорошо выглядит по одному показателю. Нужен баланс между силой связывания, химической реализуемостью и другими практическими требованиями. Именно такие многокритериальные задачи чаще всего мешают автоматизации, поэтому прогресс здесь особенно ценен.

Источник: arXiv

HADACA3 показывает, что объединение нескольких типов биологических данных помогает не всегда

Этот большой сравнительный анализ проверил более 250 тысяч вычислительных цепочек на девяти наборах данных, где одновременно доступны сведения о метилировании ДНК и работе генов. Цель была понять, действительно ли объединение нескольких типов молекулярных данных улучшает определение клеточного состава сложных тканей, например опухолей. Вывод оказался отрезвляющим: в некоторых случаях объединение помогает добиться лучшего результата, но самым надёжным средним ориентиром всё равно остаются данные по метилированию ДНК сами по себе.

Почему это важно: в вычислительной биологии часто предполагается, что больше типов данных автоматически означает лучший итог. Эта работа даёт редкую и полезную проверку реальностью, показывая, где такое ожидание оправдано, а где нет. Для исследователей это важный ориентир при выборе методов и расходов на эксперименты.

Источник: arXiv

TadA-Bench предлагает более реалистичную проверку ИИ для белковой инженерии

Авторы представили новый набор для проверки методов, созданный по итогам 31 раунда реальных экспериментов направленной эволюции и охватывающий около миллиона вариантов белков. В отличие от более простых исторических наборов, здесь оценивается не только подгонка под уже известные данные, но и способность выбирать, что именно стоит проверять в следующем раунде лабораторной работы.

Почему это важно: именно выбор следующего шага делает ИИ полезным помощником в белковой инженерии, а не просто удобным инструментом для ретроспективного анализа. Такой набор приближает оценку систем к реальному исследовательскому процессу, где нужно принимать решения на будущее.

Источник: arXiv