AI в науке сейчас интересен не громкими обещаниями, а тем, где он действительно снимает дорогие и медленные ограничения: вычисления, проверку доказательств, работу с контекстом в биологии и оценку рисков. В этой подборке пять свежих работ как раз про такие сдвиги — от материаловедения до математики и биобезопасности.

Нейросеть точнее предсказывает оптические спектры материалов для массового отбора кандидатов

Авторы применили эквивариантную графовую нейросеть для предсказания оптических спектров материалов и показали, что она работает лучше прежних суррогатных моделей, особенно в диапазоне 0–8 эВ и для статической действительной диэлектрической проницаемости. Важность здесь очень практическая: модель проверяли более чем на десяти тысячах структур, для которых эталонные спектры считались дорогим методом случайно-фазового приближения.

Почему это важно: если суррогат становится заметно лучше, поиск материалов для оптоэлектроники — в том числе кандидатов для солнечных элементов — можно проводить существенно быстрее и дешевле. Это хороший пример того, как AI сокращает реальный вычислительный барьер в науке, а не просто помогает описывать уже найденное.

Источник: arXiv

LOGICA добавляет биологическим языковым моделям внешний контекст без потери интерпретируемости

Работа предлагает метод LOGICA, который позволяет белковым и другим биологическим языковым моделям учитывать внешний контекст — например, лиганд, клеточную среду или лекарственное воздействие — и при этом сохранять привычный для исследователей интерфейс вероятностей по токенам. Вместо выравнивания усреднённых представлений авторы делают контрастивное обучение прямо в пространстве логитов, благодаря чему метод можно применять к моделям с разными словарями.

Почему это важно: многие научные задачи в биологии ломаются именно там, где модель видит последовательность, но не видит ситуацию, в которой она действует. Если такой подход действительно улучшает прогноз связывания белков и лигандов, активности рецепторов T-клеток и лекарственной устойчивости, то это шаг к более полезным фундаментальным моделям для реальной биологии, а не только для красивых демонстраций на одной модальности.

Источник: arXiv

Visored пытается сделать формальное доказательство ближе к обычному математическому письму

Система Visored строится вокруг идеи, что и людям, и языковым моделям проще писать математику в форме, близкой к учебнику или статье, а не сразу в строгом синтаксисе помощников доказательства вроде Lean. Поэтому авторы вводят контролируемый естественный язык, а рутинные пропущенные шаги закрывают автоматикой на правилах, после чего система может вывести уже проверяемое доказательство в Lean.

Почему это важно: один из главных барьеров для серьёзного применения AI в математике — разрыв между беглым рассуждением и формально проверяемым текстом. Если Visored действительно помогает этот разрыв уменьшить, то AI получает более реалистичный путь в область строгой математики, где важно не только придумать ход, но и доказать, что он корректен.

Источник: arXiv

First Proof Second Batch проверяет AI на настоящих исследовательских задачах по математике

Авторы вместе с профессиональными математиками протестировали современные AI-системы на десяти реальных исследовательских задачах, а не на учебных наборах. Особенно ценно, что работа опубликована максимально прозрачно: вместе с самими задачами, человеческими решениями, попытками моделей, отзывами рецензентов и журналами работы.

Почему это важно: разговор о прогрессе AI в математике слишком часто держится на олимпиадных или искусственно упрощённых задачах. Здесь вопрос жёстче и честнее: способен ли нынешний AI внести вклад в передний край математики, если доказательства потом внимательно разбирают специалисты. Даже если ответ пока сдержанный, сама постановка такого теста уже делает область взрослее.

Источник: arXiv

Новая работа по биорискам AI-агентов показывает, как легко переоценить или недооценить опасность бенчмарков

Эта статья не про очередной рекорд модели, а про более неприятный и зрелый вопрос: что вообще доказывают проверки биологических возможностей и рисков у агентных AI-систем. Авторы разбирают, насколько сильно результаты зависят от скрытых решений в устройстве задания, способе оценки, документации и исполнении, и предлагают рамку, которая должна помочь лабораториям, государству, фондам и внешним оценщикам не делать слишком смелых выводов по одному числу.

Почему это важно: по мере того как агентные системы заходят в научие рабочие процессы, биобезопасность перестаёт быть только теоретической темой. Но и ложная уверенность опасна в обе стороны — как паника от плохо поставленного теста, так и успокоение от удобного бенчмарка. Эта работа важна именно тем, что пытается сделать разговор о рисках строже и полезнее для практических решений.

Источник: arXiv

Если свести подборку к одной мысли, она такая: AI в науке становится по-настоящему интересным там, где начинает не просто генерировать ответы, а встраиваться в дорогие исследовательские циклы — вычислительные, экспериментальные, формальные и регуляторные. И чем ближе он подходит к этим узким местам, тем важнее становятся не только его способности, но и качество проверки этих способностей.