В свежих работах по науке с ИИ хорошо видно, что область постепенно уходит от красивых демонстраций к более жесткой проверке: где-то через машинно проверяемые доказательства, где-то через анализ скрытых перекосов моделей, а где-то через более надежные циклы автономного эксперимента. Ниже — четыре работы, которые особенно хорошо это показывают.

ИИ-поиск формальных доказательств выходит к открытым задачам

Авторы проверяли не учебные примеры, а работу систем на действительно открытых математических задачах. Самая сильная система, по их данным, решила 9 из 353 открытых задач Эрёша и доказала 44 из 492 гипотез по целочисленным последовательностям. Это важно потому, что формальные доказательства проверяются машиной, а значит здесь гораздо меньше места для красивых, но недостоверных рассуждений. Если такие подходы будут укрепляться, математики получат не просто собеседника, а инструмент, результаты которого можно строго перепроверять.

Вирусные белки показали слабое место языковых моделей белков

Авторы взяли вирусные белки как трудный тест для белковых моделей, потому что такие последовательности хуже представлены в обучающих данных, чем обычные клеточные белки. Они показывают, что внутри представлений модели возникает сильная ось «естественности», которая отделяет хорошо знакомые модели белки от вирусных и случайных последовательностей. Практический смысл в том, что исследователи лучше понимают, где такие модели могут быть предвзяты или хрупки, когда их пытаются применять в биологии и белковом дизайне за пределами самых типичных примеров.

InvDesMobility добавляет фильтр надежности в автономный поиск материалов

Эта работа решает не только задачу генерации кандидатов, но и более болезненную проблему: каким результатам дорогих вычислений вообще можно доверять и возвращать их обратно в цикл обучения. Авторы описывают схему с генерацией кандидатов, автоматической проверкой на основе квантово-механических расчетов, учетом доказательств и фильтрами надежности. В результате они просмотрели 2,4 миллиона структур, отправили 102 кандидата на проверку и оставили 86 надежно подтвержденных каналов в 41 химической формуле. Это важный шаг к более прозрачному автономному открытию материалов, где система не просто выдает список находок, а умеет отделять слабый сигнал от того, что действительно стоит учитывать дальше.

NIMO предлагает общий программный слой для самоуправляемых лабораторий по материалам

Авторы NIMO пытаются убрать одну из главных преград для автономной науки: каждая лаборатория слишком часто собирает свой хрупкий стек из роботов, программ и методов поиска почти с нуля. Платформа отделяет алгоритмы поиска от конкретного оборудования через общий интерфейс, уже поддерживает двенадцать алгоритмов и описывает шесть реальных лабораторных внедрений — от поиска электролитов до тонких пленок. Если такие прослойки станут стандартом, переносить удачные схемы между лабораториями будет проще, а значит ИИ в материаловедении сможет развиваться не как набор разрозненных проектов, а как более воспроизводимая инженерная практика.

Во всех четырех работах общий мотив один и тот же: ценность ИИ в науке все чаще определяется не громкостью заявления, а тем, насколько результат можно проверить, повторить и встроить в реальную исследовательскую работу.

Источник работ: arXiv