На этот раз у xAI сразу два анонса, и вместе они показывают, куда движется платформа: не только к новым моделям, но и к более дробной продуктовой линейке под конкретные задачи.

Grok Speech to Text и Text to Speech API

xAI запустила отдельные API для распознавания речи и синтеза речи Grok. Компания пишет, что это тот же аудиостек, который уже используется в Grok Voice, автомобилях Tesla и службе поддержки Starlink. Важнее всего здесь то, что xAI не ограничилась общими обещаниями и сразу показала цены: распознавание речи стоит от 0,10 доллара за час в пакетном режиме и от 0,20 доллара за час в потоковом режиме.

Почему это важно: xAI всё заметнее превращается из поставщика одного чат-бота в полноценную мультимодальную платформу. Когда у компании появляются отдельно продаваемые голосовые компоненты, это делает её ближе к крупнейшим поставщикам API, у которых текст, голос и вспомогательные сервисы продаются как самостоятельные строительные блоки. Для разработчиков это означает более понятный путь к сборке собственных голосовых продуктов без необходимости ждать, пока всё будет упаковано в один универсальный интерфейс.

Источник: xAI

Grok Code Fast 1

xAI также представила Grok Code Fast 1 — новую модель рассуждения, заточенную под программирование. По описанию компании, модель построена с нуля на новой архитектуре, обучалась на корпусе с сильным уклоном в код и подаётся как быстрый и экономичный вариант для агентной разработки.

Смысл анонса в том, что рынок всё сильнее уходит от идеи одной универсальной модели для всех задач разработчика. Крупные лаборатории всё чаще разводят линейки: отдельно общие модели, отдельно модели для кода, отдельно дешёвые и быстрые варианты для автоматизированных сценариев. Если xAI действительно сможет удержать баланс между скоростью, ценой и качеством, Grok Code Fast 1 может стать важным шагом в борьбе за разработчиков, которым нужен не самый широкий интеллект, а предсказуемый рабочий инструмент для повседневной автоматизации.

Источник: xAI