В этой подборке пять свежих работ о том, как ИИ помогает не только отвечать убедительно, но и делать науку полезнее для врача, лаборатории и исследователя. Ниже — где именно есть практический сдвиг, а где особенно важна проверяемость результата.

FaithMed: Training LLMs For Faithful Evidence-Based Medical Reasoning

FaithMed предлагает обучать медицинские языковые модели не просто на правильный ответ, а на ход рассуждения, который соответствует принципам доказательной медицины. Авторы добавляют критерии, составленные вместе с клиницистами, и поощряют модель за то, как она использует и объясняет медицинские доказательства, а не только за финальный вывод.

Это важно, потому что в медицине опаснее всего не явная ошибка, а уверенный ответ с плохим обоснованием. Если такой подход действительно устойчиво улучшает качество ссылок на доказательства и клиническую логику, он может оказаться полезнее многих систем, которые выигрывают только по сухой точности.

Источник: arXiv

RareDxR1: Autonomous Medical Reasoning for Rare Disease Diagnosis Beyond Human Annotation

RareDxR1 нацелен на одну из самых болезненных зон клинической практики — редкие заболевания, где диагноз часто ищут месяцами или годами. Вместо тяжёлых конвейеров с ручной разметкой фенотипов и внешним поиском система работает с неструктурированными клиническими записями, использует внутренние знания модели, самоанализ ошибок и обучение с подкреплением.

Если заявленные результаты подтвердятся, это особенно интересно именно для редких случаев: там мало шаблонных сценариев, а цена пропущенной связи очень высока. Такой инструмент выглядит не как замена врачу, а как способ быстрее вытащить правдоподобные диагностические версии из запутанной истории болезни.

Источник: arXiv

Predicting Novel Stable Materials for Experimental Synthesis

Одна из вечных проблем в материаловедении такова: вычислительные методы предлагают сотни красивых кандидатов, а до реального синтеза доходят единицы. В этой работе авторы выстраивают многоступенчатый отбор: из 894 ранее предложенных стабильных материалов они проходят через проверки фазовых диаграмм, динамической устойчивости и более точное уточнение, чтобы оставить 25 наиболее правдоподобных целей для эксперимента.

Практическая ценность здесь очень высокая. Исследователям в лаборатории нужны не сотни гипотез, а короткий список веществ, которые действительно стоит пытаться получить. Такие работы приближают ИИ в материаловедении к главному критерию пользы — сокращению числа дорогих и бесплодных экспериментальных попыток.

Источник: arXiv

Graph-Native Reinforcement Learning Enables Traceable Scientific Hypothesis Generation through Conceptual Recombination

Здесь авторы предлагают систему Graph-PRefLexOR, которая генерирует научные гипотезы так, чтобы промежуточные шаги рассуждения оставались явными и проверяемыми. Подход опирается на графовое представление понятий и обучение с подкреплением, а не только на свободный текст, поэтому итоговая гипотеза лучше связана с исходными идеями и наблюдениями.

Для роли ИИ как соавтора науки это один из самых интересных векторов. Исследователю мало получить просто неожиданную идею — нужно понимать, как машина к ней пришла, где она соединила понятия и на каком месте рассуждение может сломаться. Именно такая прослеживаемость и делает автоматическое порождение гипотез хоть сколько-то пригодным для серьёзной научной работы.

Источник: arXiv

Complex crystal structure prediction using ML-enhanced multi-minima iterative genetic algorithm

В этой работе машинное обучение усиливает итеративный генетический алгоритм для предсказания сложных кристаллических структур без жёсткой опоры на уже известные базы шаблонов. На трудных системах лантан-кобальт-свинец авторы показывают, что метод находит основное состояние для недавно синтезированного соединения и правильно предсказывает структуру другого нового соединения только по составу.

Это значимо, потому что многие красивые демонстрации в вычислительном материаловедении всё ещё слишком зависят от уже накопленного знания. Когда метод начинает угадывать структуру там, где пространство вариантов действительно неудобно для перебора, это уже похоже не на сортировку известного, а на помощь в открытии нового.

Источник: arXiv