В этом выпуске — два заметных обновления в мире ИИ-моделей: одно расширяет семейство Qwen в сторону воплощённых систем, другое усиливает рынок прикладных моделей для работы с документами.

Qwen-RobotNav: одна модель для навигации роботов и автономных систем

Alibaba Cloud представила Qwen-RobotNav — навигационную модель на базе Qwen3-VL, которая использует один набор весов сразу для пяти областей навигации. По описанию компании, модель умеет работать с такими сценариями, как следование инструкциям, поиск объектов, сопровождение цели и задачи, связанные с автономным вождением. Также у неё есть настройки на этапе работы, которые позволяют отдельно управлять объёмом зрительного контекста, скоростью забывания памяти и вкладом камер.

Почему это важно: семейство Qwen всё заметнее выходит за пределы обычных текстовых и мультимодальных помощников в сторону систем, которые должны ориентироваться в пространстве и действовать в физической среде. Если одна модель действительно способна переноситься между разными навигационными задачами, это делает разработку агентных систем для роботов и транспорта более унифицированной и потенциально ускоряет внедрение таких решений.

Источник: Alibaba Cloud

Mistral OCR 4 усиливает ставку на документный AI для бизнеса

Mistral выпустила OCR 4 — модель для интеллектуальной обработки документов. В новой версии заявлены координаты фрагментов на странице, классификация блоков и встроенные оценки уверенности, а также поддержка 170 языков. Отдельно компания подчёркивает возможность полностью развернуть модель внутри собственной инфраструктуры в одном контейнере.

Почему это важно: рынок всё сильнее нуждается не только в универсальных больших моделях, но и в прикладных инструментах, которые превращают неструктурированные документы в данные, пригодные для поиска, анализа и автоматизации. Для корпоративных команд это особенно ценно там, где важны контроль над средой, требования к хранению данных и предсказуемая интеграция в рабочие процессы.

Источник: Mistral