北京1月2日电(康耕甫) 近日,理想汽车连续三天推出“2024理想 AI Talk”,分享了对人工智能的最新思考,以及包含智能驾驶和理想同学在内的人工智能技术的最新进展,并宣布基于自研基座大模型Mind GPT的理想同学从车机进入手机,App已于去年12月27日全量上线。此外,理想汽车宣布OTA 7.0版本车机系统已于去年12月底全量推送AD Max用户,新增AI推理可视化、高速端到端等功能,并实现Mind GPT-3o、Mind Diffusion V2.0的能力升级。
理想同学和智能驾驶是理想汽车的两大核心AI产品。理想汽车董事长兼CEO李想表示:“我们在做的理想同学和自动驾驶,通常被视作独立的领域。我们的大语言模型Mind GPT是认知智能,连接数字世界;而自动驾驶被称为空间智能,关乎物理世界。我们同时在这两个领域探索,并坚信认知智能与空间智能的结合——我们称之为VLA(Vision Language Action Model,视觉语言行动模型)——是一个更值得相信和追求的机遇。”
理想同学App,随时随地陪伴你的智能助手
理想同学App是一款人工智能应用,目前具备两大功能:“知识问答”提供多领域的问答能力,包括汽车、出行、财经、科技等领域,并能处理多种文本任务,如撰写文章、翻译和创作文案等;“看世界”依靠视觉感知能力,帮助用户识别菜单、画作、动植物、汽车等上千种通用物品。
从车机进入手机,理想同学从智舱智能助理转变为通用智能助手。从用户需求的角度出发,这是一件顺理成章的事情。很多理想汽车用户的孩子首次接触的人工智能产品就是理想同学,它通过对话帮助孩子们解决各种问题,比如画画或写作业等。理想汽车希望让100多万的车主及其家庭成员,不仅在汽车,还可以在手机、电脑,甚至眼镜等穿戴设备上,体验到一致的人工智能产品。其次,从长远角度来看,理想汽车认为,在掌握基座模型的前提下,真正的大模型产品会覆盖所有的设备,能让用户自主使用所有的服务。
目前,大模型技术尚处于发展早期,很多团队仍停留在聊天机器人的初始阶段,所有参与者都有探索未知边界的机会。理想汽车凭借100多万的家庭基础和在自动驾驶领域的技术积累,能够在追随优秀竞争对手的同时,实现更有效的投入。
L3有监督智能驾驶,不是L2辅助驾驶的延续,而是L4自动驾驶的先导
在自动驾驶的不同阶段,L3为有监督智能驾驶,不是L2辅助驾驶的延续,而是L4高度自动驾驶的先导程序。
辅助驾驶只实现了特定功能,自动驾驶则关乎整体能力。传统的L2辅助驾驶依赖上一代自动驾驶方案,通过预设条件来执行不同场景下的智驾功能,无法穷尽所有的corner case(极端情况)。理想汽车借鉴人类驾驶技能提升的过程,用人工智能的方式做自动驾驶,推出了端到端+VLM的双系统解决方案,利用Scaling Law(规模效应)不断迭代和提升自驾能力,以适应所有可能的驾驶环境。
自7月底推出端到端智能驾驶的内测版以来,理想汽车以每周更新两个模型版本的频率,致力于在今年将综合MPI(城市+高速平均接管里程)提升至100公里。展望未来两年,还将逐步提升MPI至500公里甚至1000公里以上。为了达到MPI 500公里的目标,预估需要2000万Clips(视频片段),意味着积累50亿公里甚至超百亿公里的数据量。
随着端到端+VLM双系统的不断迭代,理想汽车希望在2025年实现L3有监督智能驾驶,并为用户提供一个全场景、一体化端到端的产品。理想汽车认为,达到L3的前提是实现“车位到车位”的智能驾驶,这将自动驾驶服务从干道提前到小区车位,解决最先100米和最后100米的挑战。去年11月底,理想汽车已全球首家全量推送“车位到车位”功能,有效应对了小区道路、环岛、掉头和复杂施工的场景。