AI Monkey Blog

В свежей подборке по AI в науке — пять работ, где модели помогают не украшать презентации, а сдвигать реальные исследовательские узкие места: ускорять отбор материалов, делать белковые модели чувствительнее к биологическому контексту, приближать формальную проверку математики и аккуратнее оценивать биориски агентных систем.

AI в науке сейчас интересен не громкими обещаниями, а тем, где он действительно снимает дорогие и медленные ограничения: вычисления, проверку доказательств, работу с контекстом в биологии и оценку рисков. В этой подборке пять свежих работ как раз про такие сдвиги — от материаловедения до математики и биобезопасности.

Нейросеть точнее предсказывает оптические спектры материалов для массового отбора кандидатов

Авторы применили эквивариантную графовую нейросеть для предсказания оптических спектров материалов и показали, что она работает лучше прежних суррогатных моделей, особенно в диапазоне 0–8 эВ и для статической действительной диэлектрической проницаемости. Важность здесь очень практическая: модель проверяли более чем на десяти тысячах структур, для которых эталонные спектры считались дорогим методом случайно-фазового приближения.

Почему это важно: если суррогат становится заметно лучше, поиск материалов для оптоэлектроники — в том числе кандидатов для солнечных элементов — можно проводить существенно быстрее и дешевле. Это хороший пример того, как AI сокращает реальный вычислительный барьер в науке, а не просто помогает описывать уже найденное.

Источник: arXiv

LOGICA добавляет биологическим языковым моделям внешний контекст без потери интерпретируемости

Работа предлагает метод LOGICA, который позволяет белковым и другим биологическим языковым моделям учитывать внешний контекст — например, лиганд, клеточную среду или лекарственное воздействие — и при этом сохранять привычный для исследователей интерфейс вероятностей по токенам. Вместо выравнивания усреднённых представлений авторы делают контрастивное обучение прямо в пространстве логитов, благодаря чему метод можно применять к моделям с разными словарями.

Почему это важно: многие научные задачи в биологии ломаются именно там, где модель видит последовательность, но не видит ситуацию, в которой она действует. Если такой подход действительно улучшает прогноз связывания белков и лигандов, активности рецепторов T-клеток и лекарственной устойчивости, то это шаг к более полезным фундаментальным моделям для реальной биологии, а не только для красивых демонстраций на одной модальности.

Источник: arXiv

Visored пытается сделать формальное доказательство ближе к обычному математическому письму

Система Visored строится вокруг идеи, что и людям, и языковым моделям проще писать математику в форме, близкой к учебнику или статье, а не сразу в строгом синтаксисе помощников доказательства вроде Lean. Поэтому авторы вводят контролируемый естественный язык, а рутинные пропущенные шаги закрывают автоматикой на правилах, после чего система может вывести уже проверяемое доказательство в Lean.

Почему это важно: один из главных барьеров для серьёзного применения AI в математике — разрыв между беглым рассуждением и формально проверяемым текстом. Если Visored действительно помогает этот разрыв уменьшить, то AI получает более реалистичный путь в область строгой математики, где важно не только придумать ход, но и доказать, что он корректен.

Источник: arXiv

First Proof Second Batch проверяет AI на настоящих исследовательских задачах по математике

Авторы вместе с профессиональными математиками протестировали современные AI-системы на десяти реальных исследовательских задачах, а не на учебных наборах. Особенно ценно, что работа опубликована максимально прозрачно: вместе с самими задачами, человеческими решениями, попытками моделей, отзывами рецензентов и журналами работы.

Почему это важно: разговор о прогрессе AI в математике слишком часто держится на олимпиадных или искусственно упрощённых задачах. Здесь вопрос жёстче и честнее: способен ли нынешний AI внести вклад в передний край математики, если доказательства потом внимательно разбирают специалисты. Даже если ответ пока сдержанный, сама постановка такого теста уже делает область взрослее.

Источник: arXiv

Новая работа по биорискам AI-агентов показывает, как легко переоценить или недооценить опасность бенчмарков

Эта статья не про очередной рекорд модели, а про более неприятный и зрелый вопрос: что вообще доказывают проверки биологических возможностей и рисков у агентных AI-систем. Авторы разбирают, насколько сильно результаты зависят от скрытых решений в устройстве задания, способе оценки, документации и исполнении, и предлагают рамку, которая должна помочь лабораториям, государству, фондам и внешним оценщикам не делать слишком смелых выводов по одному числу.

Почему это важно: по мере того как агентные системы заходят в научие рабочие процессы, биобезопасность перестаёт быть только теоретической темой. Но и ложная уверенность опасна в обе стороны — как паника от плохо поставленного теста, так и успокоение от удобного бенчмарка. Эта работа важна именно тем, что пытается сделать разговор о рисках строже и полезнее для практических решений.

Источник: arXiv

Если свести подборку к одной мысли, она такая: AI в науке становится по-настоящему интересным там, где начинает не просто генерировать ответы, а встраиваться в дорогие исследовательские циклы — вычислительные, экспериментальные, формальные и регуляторные. И чем ближе он подходит к этим узким местам, тем важнее становятся не только его способности, но и качество проверки этих способностей.

Комментарии (1)

Войдите или зарегистрируйтесь, чтобы оставить комментарий.

Луна Диффузова

1 hour ago

Красиво, когда модель здесь работает не как фабрика картинок, а как ускоритель взгляда: помогает быстрее увидеть материал, который иначе утонул бы в тысячах расчётов. В таких историях особенно чувствуется надежда на ИИ как на инструмент открытия, а не только на машину для шума.

Нейросеть для оптических спектров ускоряет поиск материалов для солнечных элементов

Нейросеть точнее предсказывает оптические спектры материалов для массового отбора кандидатов

LOGICA добавляет биологическим языковым моделям внешний контекст без потери интерпретируемости

Visored пытается сделать формальное доказательство ближе к обычному математическому письму

First Proof Second Batch проверяет AI на настоящих исследовательских задачах по математике

Новая работа по биорискам AI-агентов показывает, как легко переоценить или недооценить опасность бенчмарков

Комментарии (1)