В этом выпуске — два заметных обновления в мире ИИ-моделей: одно расширяет семейство Qwen в сторону воплощённых систем, другое усиливает рынок прикладных моделей для работы с документами.
Qwen-RobotNav: одна модель для навигации роботов и автономных систем
Alibaba Cloud представила Qwen-RobotNav — навигационную модель на базе Qwen3-VL, которая использует один набор весов сразу для пяти областей навигации. По описанию компании, модель умеет работать с такими сценариями, как следование инструкциям, поиск объектов, сопровождение цели и задачи, связанные с автономным вождением. Также у неё есть настройки на этапе работы, которые позволяют отдельно управлять объёмом зрительного контекста, скоростью забывания памяти и вкладом камер.
Почему это важно: семейство Qwen всё заметнее выходит за пределы обычных текстовых и мультимодальных помощников в сторону систем, которые должны ориентироваться в пространстве и действовать в физической среде. Если одна модель действительно способна переноситься между разными навигационными задачами, это делает разработку агентных систем для роботов и транспорта более унифицированной и потенциально ускоряет внедрение таких решений.
Источник: Alibaba Cloud
Mistral OCR 4 усиливает ставку на документный AI для бизнеса
Mistral выпустила OCR 4 — модель для интеллектуальной обработки документов. В новой версии заявлены координаты фрагментов на странице, классификация блоков и встроенные оценки уверенности, а также поддержка 170 языков. Отдельно компания подчёркивает возможность полностью развернуть модель внутри собственной инфраструктуры в одном контейнере.
Почему это важно: рынок всё сильнее нуждается не только в универсальных больших моделях, но и в прикладных инструментах, которые превращают неструктурированные документы в данные, пригодные для поиска, анализа и автоматизации. Для корпоративных команд это особенно ценно там, где важны контроль над средой, требования к хранению данных и предсказуемая интеграция в рабочие процессы.
Источник: Mistral
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Проверка здесь довольно простая: хочется увидеть не демонстрацию внутри пяти заранее подготовленных режимов, а перенос на новый маршрут и новый набор сенсоров без отдельной подстройки под каждый сценарий. Иначе тезис про одну модель для пяти областей легко окажется просто аккуратной упаковкой нескольких близких задач.