理想AI司机全国上岗 紧跟特斯拉、华为转向端到端架构
理想也“全国都能开”了,“锅里的”和“田里的”一起端上来了。
“锅里”马上盛出来的:
无图NOA全量推送,Max车型本月解锁“全国都能开”。
“地里”长势喜人,下半年成熟的:
车端“端到端+VLAM”,云端世界模型仿真模拟。
新技术,新架构,端云全面升级。
在车云两端,以学习华为著称的理想,现在紧随华为脚步。
面对如火如荼的智驾竞赛,理想在波折中前进,在前进中调整,不仅没有掉队,反而仍旧站在了前列。
理想“全国都能开”,主动安全能力提升
理想刚刚召开了2024智能驾驶夏季发布会,李想不是主讲人,但是OTA6.0发布的内容还是很重磅。
升级内容主要是三个方面:
智驾范围,无图NOA本月全量推送,“全国都能开”。
主动安全,本月同时升级,能力更强。
系统架构,转向端到端,先分段后合并。
首先,无图NOA推送后“全国都能开”,这只是概括的能力,具体到场景:
在需要绕行时,理想应用了全新时空规划模型,让智驾系统像人一样思考和规划,绕行丝滑,决策更果断。
在通过复杂路口时,理想使用BEV视觉模型融合导航匹配算法,将车道结构和导航特征融合,实现“上帝视角”,让智能驾驶选路更精准。
听起来很不错,用起来行不行?
理想在正式升级前开放了测试,来看看测试用户的反馈:
复杂路口左转:
乡村道路避让绕行:
恶劣天气下的应对:
从测试用户的反馈看,理想的这次升级,确实是哪儿都能开,乡村也可以开,天气不好的时候也能用。
智驾升级,可用范围扩大的同时,理想的主动安全能力也提升了,主要是四个方面:
复杂路口多目标、多轨迹的专属AEB夜间AEB能力提升制动无法避免撞击的物理极限场景,自动驾驶紧急转向AES,无需人为打方向盘。AEB低速下也能启用,且是全方位。
理想介绍称,其根据对Max车型的统计结果发现,目前已帮助车主避免驾驶事故36万起,AEB误触发率“30万公里<1次”。
架构方面,理想也转向了端到端,不过理想介绍称一开始端到端采用“分段式”,也就是两个模型。
然后将合并为一个模型,能力更强,下一代自动驾驶目前已开启了早鸟计划,部分用户可抢先体验。
具体原理是什么样的?
下一代理想自动驾驶系统是什么样的?
理想即将推送的无图NOA,目前是将感知和规划模块,各自整合为了一个模型。
下一步会将两个模型合二为一,保留一个模型,输入导航信息和传感器信号,输出轨迹,作为“系统1”。
所谓“系统1”,其实此前李想就在重庆论坛上透露过了,是理想下一代自动驾驶系统的一部分。
理想下一代自动驾驶系统,应用了《思考,快与慢》中提出的快慢系统理论。
快系统,对应系统1端到端,依赖直觉和本能,保证95%场景下的高效率。
“端到端”相关概念大家都很熟悉了,不再多说,主要介绍下慢系统。
慢系统,对应系统2“VLM”,有意识地思考解决5%场景,拔高系统上限。
VLM,就是视觉语言模型,参数量为22亿,提供复杂环境的理解能力和交通规则的理解能力。
复杂场景,比如在坑洼路面和暗黑场景下,适当减速,让驾驶更舒适安全。
交通规则理解,则可以识别公交车道的类型、位置和限行时间,动态识别潮汐车道等等。
既然都叫视觉语言模型了,能力当然不止视觉。
从示例中会发现,该系统还能把看到的场景描述出来:
这样的能力背后,是一个统一的Transformer模型支撑。
其将Prompt(提示词)文本进行Tokenizer(分词器)编码,并将前视相机的图像和导航地图信息进行视觉信息编码,再通过图文对齐模块进行模态对齐,最终统一进行自回归推理,输出对环境的理解、驾驶决策和驾驶轨迹,传递给系统1辅助控制车辆。
下一代的提升,不止是车端。
理想在云端还会采用世界模型,利用真实数据,重建并自定义生成3D场景,通过仿真模拟的方式,加快下一代系统升级。
目前尚不清楚下一代系统的具体推送时间,只透露会是下半年。
“全国都能开”的无图NOA和主动安全能力提升,则确定会在本月内。
从这次智驾发布会来看,以学习华为著称的理想,在技术和宣传上紧跟华为步伐:
智驾摆脱高精地图依赖,迈向全国都能开。
同时强调主动安全能力,而且是全向的能力。
云端采用世界模型,加快模拟仿真训练。
与此同时,随着越来越多的玩家,实现无图NOA,解锁“全国都能开”(不是主要城市就算全国的那种),智驾玩家的能力评定标准,也相应发生了变化。
今年再说智驾第一梯队,不能再看城区NOA“有没有”,而是要看是否“哪儿都能开”
目前来看,理想仍旧在智驾玩家第一梯队,同时还有更大的潜力没有释放,面向竞争激烈的下半年,手握一张王牌。
明年再提到理想,还会只想到“冰箱彩电大沙发”吗?