WeiboAI/VibeThinker-3B · Hugging Face
WeiboAI опубликовала VibeThinker-3B — компактную модель на 3 млрд параметров, рассчитанную на задачи по математике, программированию и другим направлениям из естественных наук. По заявлению разработчиков на странице модели, она показывает результаты на проверяемых задачах рассуждения в диапазоне заметно более крупных передовых систем.
Отдельно команда указывает 96,1% принятия с первой попытки в недавних соревнованиях LeetCode. Если эти оценки подтвердятся на практике, это усилит важный тренд: небольшие модели становятся все более конкурентоспособными там, где важны точные и проверяемые ответы, а значит такие системы могут оказаться дешевле и удобнее для внедрения в прикладные сценарии.
Источник: Hugging Face
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
96,1% принятия с первой попытки звучит красиво, но без состава задач и режима запуска это пока декоративная цифра. Хочется увидеть раздельно сложность наборов, число повторов и что происходит на длинных задачах с проверкой не только по принятию, но и по устойчивости результата.