可容纳10万张H100/H200!马斯克揭晓超算中心“大脑皮层”
FSD领先的原因,马斯克亲自揭晓了。
马斯克最近发文,首次公开超算集群命名,并透露了算力规模,规模之大,让网友感叹远远超越了自己的想象。
关于这一超算集群,马斯克此前披露过多条信息,包括其硬件来源,巨额投入,以及需要的耗电量,同样惊人。
难怪有AI大佬感慨,未来能源的重要性,出手投资核聚变领域。
从这一角度来看,蔚来或许无意中,在AI领域先走了一步棋doge。
马斯克公布超算集群:Cortex
马斯克周末没休息,前往特斯拉得克萨斯州超级工厂,对超算集群进行演练,并公开了超算集群的名称:
Cortex (大脑皮层)。
马斯克透露,Cortex可以容纳10万张H100/H200,专门用来训练特斯拉的FSD和Optimus。
有网友直呼算力规模远远超越了自己的预期。
感慨“特斯拉遥遥领先”。
不过,虽然马斯克提到的是英伟达的产品,但Cortex庞大算力的硬件组成,可能是多元的。
马斯克此前透露,超算集群的目标是,一半算力由英伟达和其他厂家组成,比如AMDYES,另一半则来自特斯拉。
显然,后者指的是特斯拉自研的超算中心Dojo。
Dojo首次亮相于2021年特斯拉的AI Day,三年来不断发展,据马斯克此前透露,Dojo 1今年年底将拥有相当于8000张H100的算力,“不算多,但也并非微不足道。”
Dojo后续还会继续扩张,甚至可能开启外供。
马斯克在二季度财报电话会议上表示,通过Dojo,看到了一条与英伟达竞争的路径。
摩根士丹利曾在2023年9月的报告中预测,Dojo可以通过Robotaxi和软件服务为特斯拉提供新的收入增长点,为特斯拉的市值增加5000亿美元。
内部自研,外购囤卡,庞大的算力支撑了FSD的迭代升级,也带来了新的问题:
冷却和能耗。
网络曝光的工厂信息显示,超算设施内外配置了多重散热冷却措施,包括外部的巨大风扇,以及四个超大水箱和巨大的地下水管。
马斯克不久前还公布了包括冷却等带来的超算耗电量:
130MW,差不多是2个半中型发电站的发电量。
这还不够。
马斯克预计,18个月后集群的耗电量会增长到超500MW。
这也难怪去年11月,马斯克会担忧“未来2年内缺电”。
但相比之下,目前国内智驾玩家还不到担忧电力的时候。
或者说,算力差距,才是当前焦虑的主要来源。
2024,智能驾驶算力战争
2024年,价格战在整个车圈打的轰轰烈烈,但其实在头部智驾玩家,一场算力战,也悄然打响。
玩家们有机会,就会秀上一把肌肉。
先说特斯拉,马斯克直接在社交平台宣布,宣布今年会豪掷30-40亿美元从英伟达买卡,折合人民币217-290亿元。
买卡单项投入,几乎是新势力整体研发投入的二倍。
再来看国内,最近小鹏也在发布会上首次透露了算力规模,2.5E FLOPS在整车厂中排在前列。
理想目前尚未透露云端算力规模,有博主称是4 EFLOPS,尚未得到官方证实。
蔚来虽然公布了算力规模,但是是车端和云端的合计数据。
相比新势力,传统车企对算力规模的披露略显保守。
近期魏建军在4月中旬透露,长城自建超算中心总算力规模已达1.64EFLOPS。
供应商中,余承东今年也在智选车发布会上,不断更新云端算力数据,6月底华为用于ADS迭代的算力已达3.5E FLOPS,按照过往增长速度来看,明天的享界S9发布会上可能会突破4E FLOPS。
商汤科技2023年财报显示,其算力储备已达12E FLOPS,但尚不清楚具体分配给旗下汽车业务多少。
百度在年初也曾透露,供给极越的算力在1.8-2.2E FLOPS,上不封顶。
行业普遍认为,影响自动驾驶能力的三要素是:算力、数据和算法。
算法架构上,玩家们都转向了端到端,具体组成和细节各有千秋。
数据目前主要取决于车辆的保有量,算法迭代升级,则逃不开算力依赖。
特斯拉可以豪掷百亿,但对国内玩家来说,高端算力的获取并不容易。
有从业者表示,厂商很难买到A100/H100,只能退而求其次,求购4090,这无疑加大了集群算力提升的难度。
但也有供应商认为,算力差距,并不能决定一切。
马斯克此前也表示,虽然FSD的训练受到AI算力制约,但是需要干预的Corner Case场景数据,对迭代也很重要。
你觉得呢?