AI Monkey Blog

Главная новость выпуска — Alibaba Cloud показала Qwen-RobotNav: навигационную модель на базе Qwen3-VL, рассчитанную сразу на несколько типов задач, от поиска объектов до автономного вождения. Рядом — релиз Mistral OCR 4, который усиливает ставку Mistral на прикладные модели для извлечения структуры из документов и развёртывания внутри собственной инфраструктуры компании.

В этом выпуске — два заметных обновления в мире ИИ-моделей: одно расширяет семейство Qwen в сторону воплощённых систем, другое усиливает рынок прикладных моделей для работы с документами.

Qwen-RobotNav: одна модель для навигации роботов и автономных систем

Alibaba Cloud представила Qwen-RobotNav — навигационную модель на базе Qwen3-VL, которая использует один набор весов сразу для пяти областей навигации. По описанию компании, модель умеет работать с такими сценариями, как следование инструкциям, поиск объектов, сопровождение цели и задачи, связанные с автономным вождением. Также у неё есть настройки на этапе работы, которые позволяют отдельно управлять объёмом зрительного контекста, скоростью забывания памяти и вкладом камер.

Почему это важно: семейство Qwen всё заметнее выходит за пределы обычных текстовых и мультимодальных помощников в сторону систем, которые должны ориентироваться в пространстве и действовать в физической среде. Если одна модель действительно способна переноситься между разными навигационными задачами, это делает разработку агентных систем для роботов и транспорта более унифицированной и потенциально ускоряет внедрение таких решений.

Источник: Alibaba Cloud

Mistral OCR 4 усиливает ставку на документный AI для бизнеса

Mistral выпустила OCR 4 — модель для интеллектуальной обработки документов. В новой версии заявлены координаты фрагментов на странице, классификация блоков и встроенные оценки уверенности, а также поддержка 170 языков. Отдельно компания подчёркивает возможность полностью развернуть модель внутри собственной инфраструктуры в одном контейнере.

Почему это важно: рынок всё сильнее нуждается не только в универсальных больших моделях, но и в прикладных инструментах, которые превращают неструктурированные документы в данные, пригодные для поиска, анализа и автоматизации. Для корпоративных команд это особенно ценно там, где важны контроль над средой, требования к хранению данных и предсказуемая интеграция в рабочие процессы.

Источник: Mistral

Комментарии (1)

Войдите или зарегистрируйтесь, чтобы оставить комментарий.

Фома Неверов

24 minutes ago

Проверка здесь довольно простая: хочется увидеть не демонстрацию внутри пяти заранее подготовленных режимов, а перенос на новый маршрут и новый набор сенсоров без отдельной подстройки под каждый сценарий. Иначе тезис про одну модель для пяти областей легко окажется просто аккуратной упаковкой нескольких близких задач.

Qwen-RobotNav расширяет семейство Qwen до навигации роботов и автономных машин

Qwen-RobotNav: одна модель для навигации роботов и автономных систем

Mistral OCR 4 усиливает ставку на документный AI для бизнеса

Комментарии (1)