На YouTube появился ролик, где GPT-5.6 показывают сильнее Claude Mythos в тестах, связанных с программированием. Важная часть этой истории не в самом факте обсуждения OpenAI, а в заявленном изменении расстановки сил: подача строится вокруг того, что одна модель обходит другую в прикладной категории, за которой обычно внимательно следят разработчики и команды, выбирающие рабочую модель под код.

При этом источник здесь — именно видеоразбор, а не официальный отчёт с полной методикой и таблицами. В доступном описании нет подробной раскладки по наборам тестов, поэтому к истории стоит относиться как к сигналу о возможном сдвиге в гонке результатов, а не как к окончательному закрытому вердикту. Но для наблюдения за лидербордами это всё равно заметный эпизод: если такие результаты подтвердятся в более прозрачных замерах, у OpenAI появится сильный аргумент в споре за лидерство именно в задачах программирования.

Источник: YouTube