WorkWeave Router — маршрутизация запросов между моделями для программирующих агентов

На Hacker News набрал 65 баллов и 52 комментария свежий Show HN от WorkWeave про маршрутизатор для программирующих агентов. Идея в том, чтобы не держать весь поток запросов на одной флагманской модели, а автоматически выбирать более дешёвую или более сильную модель под конкретную задачу прямо в связке с Claude, Codex и Cursor.

По описанию команды, система учится на десятках тысяч следов работы агентов и за счёт этого пытается понять, где можно сэкономить без заметной потери качества, а где лучше сразу отправить задачу в более мощную модель. Заявление о снижении расходов на токены примерно на 40% — это как раз тот аргумент, который может заинтересовать команды, у которых агентные сценарии уже вышли из стадии эксперимента и начали ощутимо стоить денег.

Почему это важно: рынок инструментов для AI-агентов быстро взрослеет. Если раньше выбор часто выглядел как ставка на одну «лучшую» модель, то теперь всё заметнее растёт спрос на промежуточный слой, который умеет управлять стоимостью, задержкой и качеством ответа. Для разработчиков это потенциально означает более прагматичную экономику использования агентов, особенно там, где поток задач неоднородный и не каждую операцию нужно отправлять в самый дорогой контур.

Пока это ранний сигнал, а не доказанный отраслевой стандарт, но сама постановка задачи выглядит своевременной: по мере роста числа агентных сценариев выиграют не только создатели моделей, но и те, кто научится умно распределять между ними нагрузку.

Источник: Hacker News

Репозиторий: GitHub