在电动化、智能化浪潮下,汽车的智能驾驶技术水平越来越精进。但你有没有想过,自动驾驶是如何一步一步做到同人类一样思考,应对复杂多样的出行场景的?
在智能驾驶技术刚起步阶段,自动驾驶通过感知、规控和决策的规则逻辑来完成思考。每做出一个决策,就需要完成一系列规则和条件的筛选,相当于一个场景对应着一套处理决策。
而人在实际驾驶过程中,并不会把各种出行场景进行分类,再通过一系列规则来做出最后的行动决策。往往都是眼睛捕捉到视觉信息的瞬间,身体便即刻做出反应,这看似简单的“看与动”背后,隐藏着极为复杂且神秘的思考过程。
这也凸显出基于规则逻辑的智能驾驶系统存在一定弊端。其运作依赖大量的数据标注以及丰富的场景支撑,并且始终面临着“corner case”(极端情况)的挑战。也正因如此,这类系统在人们眼中往往显得有些“智障”,给人一种呆板、不够灵活智能的印象。
如今,随着端到端技术被应用于汽车领域,智能驾驶的思维模式愈发贴近人类大脑。有声音认为,只有端到端的智能驾驶技术,才能实现“老司机”般灵活娴熟的驾驶状态。
奔驰的全场景高阶智驾系统证明了这一点。2024诺贝尔奖颁奖典礼举办之际,奔驰中国智驾负责人王忻与诺奖得主梅-布里特·莫泽展开跨界对谈,探讨了脑科学研究能给自动驾驶带来哪些启发。
梅-布里特·莫泽是2014年诺贝尔生理学或医学奖得主,她发现了构成大脑定位系统的细胞,这种细胞能形成坐标系,帮助人精确定位和寻找路径。
可以说,梅-布里特对于人脑如何记忆道路、应对路况,了如指掌,但是谈及智能驾驶是如何处理城市路况的,就不一定清晰知晓了。
“经过大脑中的复杂神经网路和特殊细胞,人类能在大脑中绘制一张“地图”。通过一段时间的练习,人就可以熟练记忆道路。智能驾驶系统为什么能像人脑一样应对陌生城市的路况?”在对话环节中,梅-布里特对此提出疑问。
奔驰中国智驾负责人王忻表示,奔驰的智驾系统会在不同城市收集丰富大量的场景,包括极端场景,通过反复训练系统,不断提升系统表现。奔驰自主研发的专属全新架构梅赛德斯-奔驰MB.OS,让车成为能学习进化的智慧生命体。
当王忻问梅-布里特,“无图”L2++全场景高阶智驾带给其什么样的感觉时,梅-布里特的回答非常坚定:“我感觉真的非常安全!”
奔驰是怎么做到的?王忻解释道:“我们的自动驾驶系统配备多套冗余系统,当关键部件出现故障时,有额外一套系统能够立即接管,双管齐下确保安全。”
有冗余系统的“兜底”,确保了系统即使出现意外故障或错误时仍能保持稳定运行的能力。但要真正做到整体表现堪比“老司机”,还需要“端到端”大模型技术的加持。
“奔驰‘无图’L2++全场景高阶智驾,采用‘端到端’大模型技术,由数据驱动的机器学习方案具备不断进化的能力,具备‘点到点’的智驾能力。”王忻说道。
但这个过程是极其复杂的,需要超级计算机来处理复杂的算法。对比之下,人脑能轻松完成复杂的驾驶任务。
“大脑在驾驶时的能耗仅相当于一个20瓦的灯泡,远低于汽车的能耗。”梅-布里特给出一组令人感叹的数据。实际上,这也是为什么端到端技术成为潮流。在研发过程中,其能够节省大量的数据标注人力、物力,并达到类似或更好的效果。
在王忻看来,人类可以用这么少的能量完成极具复杂的驾驶任务,正是当前自动驾驶技术需要进一步研究的方向。而梅-布里特也认为,如果理解了大脑中的算法,并将这些算法转化为汽车中的人工智能,便能在执行相同任务时减少能量消耗,使自动驾驶技术取得更大的突破与优化。
写在最后:
特斯拉一直被视为自动驾驶领域里“端到端”技术的先行者。2023年,特斯拉CEO马斯克在试驾FSD V12时表示“光子进,行为出,和人类一样”,强调了端到端方案与人类思考逻辑的相似性,即人类通过眼睛接收光子等视觉信息输入,然后由大脑进行处理并输出行为动作。
如今,奔驰也在端到端大模型技术上有如此布局,在很大程度上证明了奔驰在智驾技术上具备很不错的实力。唯一的悬念是,奔驰什么时候能够真正在技术落地上秀一秀肌肉,早日将强大的端到端智驾系统带入车端,让所有用户都能享受到前沿科技带来的便捷。