华为智驾最大的风险是什么?
2024 年 3 月开始,特斯拉开始在北美地区大范围推送 FSD v12,带来了相当明显的体验升级,让端到端成为行业追逐的热点。
近日,小鹏汽车创始人何小鹏在美国加州体验了 FSD(全自动驾驶)V12.3.6 版本后,对其进步表示感慨。他称,全程体验下来,FSD 的表现非常丝滑,绝大部分路况处理都让人安心,几乎接近人类司机的驾驶水平。
与此同时,国内公司也在迅速跟进这条技术栈。华为、小鹏、元戎启行等企业纷纷规划端到端的上车方案。
其中,华为智能汽车解决方案 BU CEO 靳玉志表示,华为 ADS(自动驾驶系统)的目标是超越特斯拉 FSD。他表示,接下来每次大版本更新都显著提升了行业水平,即使是纯视觉的方案要超越特斯拉 FSD,而带激光雷达的方案更是要碾压特斯拉。
最近,华为宣布,阿维塔将首批搭载华为乾崑 ADS 3.0(高阶智能驾驶),并宣布大降价。ADS 高阶功能包一次性购买标准价格为 3.6 万元,调整后价格为 3 万元,相比原价降低了 6000 元。
那华为要如何在体验上碾压特斯拉 FSD 呢?在端到端成为行业共识的背景下,华为需要跨越哪些门槛才能继续保持领先?更重要的是,在「遥遥领先」的背后,华为智驾最大的风险是什么?
01、大力出奇迹
在此之前,首先要回顾下华为如何成为智能驾驶第一梯队?
业内普遍认为有两大原因:一是华为在智能驾驶的起步早,可以追溯到 2013 年。当时,华为成立了车联网事业部,正式开始布局自动驾驶技术。而在此之前,2012年谷歌获得了第一张自动驾驶牌照。与百度在同一时期开始进行路测相比,华为在时间上并没有落后。
相比之下,目前一些备受瞩目的自动驾驶公司,例如小马智行、Momenta 等,都是成立于 2016 年。
另一种说法是得益于华为庞大的资源投入和团队规模。
在很长一段时间里,在智能驾驶领域,团队规模直接影响研发成熟度。尤其是处理大量的特殊情况(Corner Case),需要大量的程序员和测试工程师来开发和验证。
问界产品搭载了华为智驾系统 | 图片来源:问界
相比规模在 1000 人左右的主流车企和自动驾驶公司研发团队,华为车 BU 的研发团队总计达 7000 人。余承东曾表示,其中 70%至 80%(约 5000 人)专注于自动驾驶的研发。这使得华为拥有国内外规模最大的自动驾驶研发团队。
知乎博主「卿颜」表示,华为在研发和新技术上的投入力度和决心是业内少见的。华为在多个团队同时推进自动驾驶技术的研发,并拥有大量的测试车,其中主要使用的是价格昂贵、易于改造的车型,显示出其在硬件上的投入。
在软件方面,华为曾是 Matlab(美国 MathWorks 公司出品的商业数学软件,被称为「工科生必备神器」)的大客户,购买了非常完整的许可证,甚至包括一些暂时用不到的许可证。华为一年在 Matlab 上的花费可能超过多个大主机厂的总和。虽然目前由于禁令影响,情况有所变化,但华为在软件上的投入同样显示了其在技术研发上的决心。
与此同时,自动驾驶技术长期以来采用分治法,将过程分成感知、预测、规划、控制,然后再拆分为雷达、建模、车规标准、智能协同、高精地图、软硬件配合等多个组成部分。这种方法对习惯大兵团作战的华为研发团队来说再熟悉不过了。
华为在自动驾驶领域的研发过程,充分利用了其在大规模团队协作和项目管理方面的经验。分治法让各个部门专注于各自的技术难题,同时确保整体项目的协调推进。
这几种说法都有合理性,但不容忽视的是,华为有来自其他业务的技术储备。华为并不是从零开始涉足自动驾驶。相比其他国内厂商,华为在电驱动等汽车技术上有着深厚的积累。
同时,自动驾驶对软硬件能力的要求极高。从芯片制造、算法优化到系统建立和软件适配,每一个环节都需要扎实的技术积累。
目前,华为的软硬件一体化能力是支撑其快速发展的关键。与其他厂家通常购买各种器件芯片并结合自研算法不同,华为不仅开发底层操作系统,还拥有独特的 AI 芯片、激光雷达、电机、电控系统和毫米波雷达等关键技术。简单说,一辆智能电动车除了轮子、外壳和座椅,其他所有技术华为都能提供。
这种一体化优势,使得华为在优化各类器件性能和数据处理方面,具备了极高的效率和灵活性。
02、能跨越到端到端时代吗?
目前,业界普遍认为端到端开启了新一轮的自动驾驶产业革命。华为的高级智能驾驶系统也经历了三个阶段:
ADS 1.0:于 2021 年推出,基于 Transformer 的 BEV 架构,依赖高精度地图。
ADS 2.0:在 2023 年发布,减少了对高精度地图的依赖,采用 RCR 算法进行车道实时识别和路径规划,大幅提升了系统在城市环境中的泛化速度和更新频率。
ADS 3.0:2024 年发布,采用端到端大模型。与特斯拉宣称的「大一统」模型不同,华为 ADS 3.0 感知部分使用 GOD(通用障碍物识别)大感知网络,而决策规划部分通过 PDP(预测-决策-规划)网络来实现。
虽然业内都在追逐端到端,但业界对它的定义存在着分歧和争议。一些技术原教旨主义者认为,许多公司所宣传的「端到端」并非真正意义上的端到端;而实用主义者则认为,只要技术基本符合原理并且产品性能得到提升,精确定义端到端的内涵并不是关键。
辰韬资本联合多家单位发布了 2024 年度《端到端自动驾驶行业研究报告》,表示自动驾驶技术架构演进为四个关键阶段:
感知「端到端」:感知模块通过多传感器融合技术实现了模块级别的全面覆盖,但决策规划仍主要基于规则。
决策规划模型化:决策规划模块从传统的预测、决策、规划功能分离,演变为集成到单一神经网络中的模型。
模块化端到端:感知模块不再输出人类理解的结果,而是特征向量;训练时需通过梯度传导同时进行,增强模块之间的协同性。
One Model/ 单一模型端到端:不再区分感知、决策规划等功能,整体流程由同一深度学习模型完成,从输入信号到输出轨迹一体化。
业内认为,华为和很多国内厂商的方案,大多处于「 决策规划模型化 」 阶段,距离模块化端到端或 One Model 端到端自动驾驶量产落地还有距离。
未来,华为在迈向端到端自动驾驶新时代时,面临着三大关键挑战:
首先是数据需求的激增。特斯拉从超过 20 亿英里(约合 32 亿公里)的行驶数据中挖掘了数万小时的视频数据用于 FSD 训练。一位自动驾驶工程师表示,他们在训练端到端模型时,原本积累的路测数据只有 2%可以用。这显示出端到端模型对数据量的庞大需求。
除了数据量,数据质量同样至关重要。小马智行的 CTO 楼天城曾表示,要训练出高性能的端到端模型,数据质量的要求比一般性能模型高出几个数量级。这是整个自动驾驶行业面临的重大挑战之一。
华为今年 4 月时候宣布,到 6 月训练算力将达到 3.5 EFLOPS | 图片来源:华为
第二、在端到端自动驾驶的发展过程中,训练算力的需求越来越高,远超以往任何阶段。
部分业内人士认为,使用 100 张高算力 GPU(如 NVIDIA A100)就能开始端到端自动驾驶的初步训练。然而,特斯拉等领先企业的实践表明,要实现优异的端到端效果,所需的计算能力远远超出这个数量。
特斯拉此前预计 2024 年 2 月公司算力规模将进入全球前五,10 月算力将达到 100 E FLOPS(每秒浮点运算次数),相当于约 30 万块英伟达 A100 的算力总和。
相比于国内厂商,特斯拉的目标高得让人惊讶。华为表示,2024 年 6 月智驾 ADS 训练算力将达 3.5EFLOPS,蔚来、理想、小鹏的智驾算力中心算力分别是 1.4 EFLOPS、1.4 EFLOPS、0.6EFLOPS。
第三,端到端将带来自动驾驶团队的组织重塑。一般来说,企业的组织结构通常能够促进组件层面的创新,因为产品研发通常由多个小组分别研究,只要产品的基本结构不变,这种方式就非常有效。然而,当需要进行结构性技术变革时,这种组织体系可能会阻碍创新,因为它限制了人员和团队以全新方式进行交流和合作的能力。
随着端到端技术的使用,之前的分治法和 KPI 分拆模式可能会限制性能的提升,产生意想不到的反效果。过于关注单一 KPI 的优秀表现,可能会牺牲其他指标的稳定性。
因此,许多企业正在调整策略,减少原有团队规模,转向 AI 大模型和数据基础设施的开发。高质量的数据和顶尖的 AI 人才将成为关键资源。与此同时,以往的垂直组织体系,要转向网格状结构,同时拥有垂直和横向团队,以实现多目标优化而非单一目标的优化。
端到端神经网络架构提升了数据及 AI 能力在整个产业链上的重要性,并带来了企业所需能力和资源投入的深刻变化。这也意味着,智能驾驶的游戏规则重新改写,能够跟进这场竞赛的玩家屈指可数,许多公司将因此掉队。
华为在规则驱动时代确实有自己的资源和先发优势,但跨越要端到端时代保持领先,转弯的半径要比友商大很多。