【太平洋科技快讯】3月18日消息,在NVIDIA GTC 2026上,理想汽车基座模型负责人詹锟发表主题演讲《MindVLA-o1:开启全能范式——下一代统一视觉-语言-动作自动驾驶大模型探索》,发布下一代自动驾驶基础模型MindVLA-o1。
MindVLA-o1通过3D空间理解、多模态思考、统一行为生成、闭环强化学习和软硬件协同设计五大技术创新,让自动驾驶看得更远、想得更深、行得更稳、进化更快、部署更高效。詹锟表示,基于同一套VLA模型,不仅可控制车辆,也能扩展到机器人,自动驾驶只是物理AI的起点。
理想汽车自2021年启动辅助驾驶自研,2024年实现端到端+VLM双系统架构量产交付,2025年推出VLA司机大模型并向AD Max用户全量推送,月使用率达80%。MindVLA-o1以原生多模态MoE Transformer为核心,构建面向物理世界智能的自动驾驶基础模型,实现感知、理解、行动和持续优化的完整AI闭环,未来可扩展至机器人等物理系统。