当前位置:首页 > 焦点 > 国内

【汽车人】车载算力芯片,正值历史转折点

作者:
黄耀鹏
时间:
2023-09-08 08:10:25

 

车载算力这一块,高通和英伟达尚未完成驱逐传统芯片大厂的过程。一旦大家都实现算力充分集中,可能全球车载算力需求,都会沦为“双寡头”的盘中餐。

 

文 /《汽车人》黄耀鹏

 

就像燃油车时代要讲动力一样,智能电动车要讲算力。软件定义汽车的趋势,已经成为共识,软件能力的基础就是算力,而算力来源于算力芯片。

 

动力的计数单位是马力、扭矩这些指标,而算力则是Tops(每秒进行1012次二进制计算)、Flops(每秒浮点计算次数),日益被业内人士接受和熟知。

 

对于CPU(中央处理器)、DMIPS(106次算逻运算指令,常用来衡量处理器的整数运算能力),就相对陌生。如果智能座舱比较流畅地运行AR、360全景、流媒体、HUD等,至少要超过20000DMIPS。

 

 

其实,广义上的算力芯片,不只是各种PU——CPU、GPU(图形处理器)、NPU(神经网络处理器)、TPU(张量处理器),还包括手机和车载比较流行的SOC(系统级芯片,自动驾驶和智能座舱常用SOC方式搭载)和MCU(微控制单元)。

 

顺便说一句,SOC既然是系统芯片,往往集成了各种PU(看需求)和动态、静态存储,可以视为一个微型的PC机。

 

MCU地位下降

 

虽然MCU用途很广泛,多媒体、音响、导航、悬挂、车窗、雨刷等无所不包,但是现在算力的演化趋势,就是拿走了大部分的控制功能。而MCU用途,正在收窄为核心算力SOC的“协处理器”。

 

用通俗的语言描述,就是紧挨着大脑的“小跟班”。一方面可以充当安全处理器(冗余决策);另一方面可以分担一些中央SOC的功能,减轻后者的计算压力,比如管理电池、网关和预处理雷达数据。

 

从主角变成配角,这个趋势虽然没有普及化,但前景已经比较明确。这让MCU的生产商颇为落寞。恩智浦、英飞凌、瑞萨、德仪,这些传统汽车芯片厂家,本世纪以来都在MCU上赚了大钱。但是市场已经开始接受了新势力的方案,就是将大算力的各种PU作为汽车“大脑”的做法。

 

 

现在的趋势是,跨国厂商早就开始研发相应E-E架构,但马上拿出来可能还有困难。趋势是没办法回头的。MCU企业曾经幻想,让车企放弃昂贵的各种PU方案,回到相对传统的架构。

 

从什么时候这个幻想破灭了呢?这要追溯到2019年,特斯拉推出HW3.0芯片,144Tops的算力轰动业界。一时间,高算力芯片炙手可热。自那以后,只要用了大算力平台(无论是自研还是买的),产品的软件体验(座舱和ADAS)马上能上一个档次。

 

 

这就让传统芯片企业的风头,都被英伟达和高通掠走了。始作俑者特斯拉,主动终结Mobileye自动驾驶芯片供货之后,又与英伟达分手,自此一直采用自研芯片(代工方为三星和台积电)。

 

主流和非主流

 

现在的市场上,只要是2021和2022年上市的、20万元以上的中国品牌车型,座舱芯片齐刷刷都是8155(准确地说是高通的SA8155P)。2023年高通在智能座舱芯片的市占率高达90%。

 

自动驾驶算力芯片,竞争对手就稍微多一点,但跑不脱英伟达、地平线这几家。德仪、Mobileye、华为海思也拿到一小部分市场。

 

2023年上半年的数据,在中国乘用车市场上,具备NCA功能的计算方案市场份额,英伟达独占52.57%,其余为地平线(30.7%)、德仪(8.62%)、Mobileye(4.05%)、华为海思(4.05%)。

 

 

有意思的是,座舱芯片除了8155之外,选择其实很多,华为的麒麟710A、恩智浦的i.mx8和6D/Q、联发科的MT2712、德仪的JT6、意法的Accord 7和Accord 5等。但比亚迪似乎剑走偏锋,敢于使用高通的非车规SOC,例如625、665、6350、7325等(手机芯片)。

 

众所周知,非车规芯片的功能与车规芯片没什么不同,只不过后者的环境适应性要求要苛刻得多。汽车使用非车规芯片,可以缩短开发周期,价格便宜,但可能引起黑屏、宕机等故障。

 

比亚迪的应对方案是额外配置一颗安全芯片(就是刚才提到的“冗余决策芯片”),以保证主芯片出问题时,能保住核心程序继续运行。这种极致削减成本(开发周期也是成本)的做法,也是其核心竞争力的一部分。

 

算力巅峰:神仙打架

 

这样一来,就很清楚了,算力芯片领域,眼下是高通和英伟达“神仙打架”的局面。

 

值得一提的是,高通是唯一一家没有被限制向中国出售芯片(不止是汽车芯片)的美企。8155能够占有率这么高,有这方面因素。但即便如此,美国的政策翻脸如翻书,国产替代一样充满紧迫性。

 

高通和英伟达,一直在车载算力芯片上较劲。一方面,比拼算力芯片的巅峰能力;另一方面,都在推出超级算力芯片,统一双智运算,试图把对方的地盘也抢过来。

 

 

去年9月,英伟达发布了高达2000Tops算力的Thor,号称“驾舱一体”。意思是,这不是一块纯粹的自动驾驶芯片,而是专为汽车的中央算力架构而生。一块芯片控制所有车载功能,满足所有算力需求。此举无疑顺应了E-E架构由分布式向集中式演进的趋势。

 

此前发布的254Tops算力的英伟达Orin相形见绌。而且,Thor和Orin一样,都可以叠加多颗使用。当然,史上最强“叠叠乐”,仍是英伟达产品,即DGX GH200(CPU和GPU的组合)。叠加256颗,即可组成1E(1015)Flops算力。但是5兆瓦的功率(相当于一个小城市的用电功率),决定了它只能在冷却完善的机房里运行。

 

在GH200上可以运行任何大模型,超算能力可以让其充当强大的云端服务器和训练大模型。这样,英伟达就在AI大模型训练硬件上一骑绝尘,并可以建立从云端到车端的连接。既然拥有了空前强大的模型工具,甚至可以用AI发明更强的GPU,这意味着算力正走向“奇点时刻”:用AI发明AI,起码现在就奠定了硬件基础。

 

 

高通更强于算逻运算。与英伟达不断强化图形计算能力不同,高通更擅长发展移动CPU这样的路线。不过两者殊途同归,高通2023年1月发布的SA8775,也走向了驾舱一体路线。高通声称,这款4nm芯片,通过组合可以实现与英伟达Thor能力相当的2000Tops算力。

 

这其实就是暗示单块8775无法做到这么高的算力。2022年高通以45亿美元收购自动驾驶芯片公司维宁尔,今年收购通信芯片公司Autotalks,都是为了补强短板,在算力领域与英伟达对抗。

 

“双寡头”的变数

 

不过,车载算力的天花板,不但远比超算里面的单颗芯片低,其造价和周期也比后者长。一句话,同样算力,车规芯片有成本劣势。

 

全新的手机SOC,技术储备支持“拾级而上”的话,两年就能做到。而车规芯片要完成一系列认证,可能研发时间要加倍。

 

这就决定了汽车芯片的迭代周期没有手机快。不光是因为车规芯片的周期问题,也由于车载硬件方案,要跟随整车研发周期。因此我们看到2019年发布的8155、Orin,都还是装车主力。尽管它们的下一代芯片最晚在2022年发布,但采用者依然寥寥。

 

不过,由于中国新能源汽车的竞争非常激烈,这个进程正在加速。整体而言,算力芯片上车周期,比国外快1-2年。这已经是很大的差距了。毕竟后者距离算力完全集中,还有很长的路要走。

 

 

即便不考虑车规验证周期,算力芯片本身,也很容易产生“寡头”。一旦某个芯片公司取得先发优势,它们会凭借出货量和市场份额,迅速摊平研发成本。利润回笼前就可以进入下一轮研发。优化、开发、积累新的技术,越跑越快,以至于对手从望其项背到丧失上桌资格。

 

而且寡头化还有个激励因素,就是制程的提高,让流片费用变得非常昂贵,可能单芯就达到数千万美元,失败成本非常高。如果安全性、稳定性、散热性达不到设计,这钱就打水漂了,代工厂是不负责的。这就促使强者愈强。

 

现在算力这一块,高通和英伟达尚未完成驱逐传统芯片大厂的过程——因为跨国整车厂的节奏没跟上,让后者还有订单。一旦大家都实现算力充分集中,可能全球车载算力需求,都会沦为“双寡头”的盘中餐。

 

这里面唯一的变数,是中国芯片供应商。目前寒武纪、黑芝麻、华为海思等芯片公司日子都不大好过,出货量太少令其很难追上英伟达的节奏。但是美国的制裁,让英伟达只能向中国客户提供专供版显卡,车载芯片这一块倒尚未限制,但客户们都为这一天积极做准备。这让中国芯片供应商,仍保有商业机会。

 

 

车企造芯,基本也是投资功率器件、传感器、MCU、电源管理等。算力芯片门槛太高,直接孵化有困难。合资和战投,是不错的入手方式。地平线获得大众的投资,财务可能一时无忧,但长期看,必须在算力芯片和架构方案的正面战场上赢得市场地位,才能有效解除警报。

 

在雷蒙多访华结束前的一天,华为上架了Mate 60系列。就目前已知的信息,Soc为7nm制程。技术细节还不清楚,有些舆论在猜测为DUV多次曝光方案,替代了EUV(实际上可能并非如此)。

 

7nm全球代工厂就那么几家,不可能给华为代工。因此华为可能掌握了纯国产的、部署于境内的、美国技术含量为零的7nm代工线,而且产能巨大。因为Mate 60系列首批备货就超过500万部(据说加单至1500万-1700万部,未经证实)。

 

这条生产线必然存在(已经有传闻是中芯代工),而且美国既不掌握其上游技术,就连部署在哪里都不知道。虽然很可能华为用非常规手段绕过设备制程这道坎,至少说明高制程芯片生产,对中国人来说并非高不可攀。而且实现的速度,远超所有人预料。

 

 

在2018年,当时最新上市的Mobileye EyeQ4(28nm制程)自动驾驶芯片,算力为2.5Tops。Mobileye认为,算力并非瓶颈,凭借算法和5个并行核心的多任务模式,就可以处理8颗摄像头数据,足以应对L4场景。它们引以为豪的是该芯片功耗只有3W。

 

5年过去了,业内对算力的认知、运用和由此产生的需求,都在飞跃发展。2.5Tops算力应对L4的认知,就像上世纪80年代IBM认为,只需要5台大型机(其算力远不如现在的主流手机),就足以满足全球的计算需求。

 

《汽车人》认为,就算限制在车载场景,算力需求也很难看到终点,就像我们很难预料AI的终点一样(可能所有事物的前方,都有一个大模型,包括人本身)。

 

人类从历史中学到的唯一教训,是从来不会汲取教训。这句话倒是仍然有效。【版权声明】本文系《汽车人》原创稿件,未经授权不得转载。
主办:汽车人传媒 | 汽车人网
ICP备案号:京ICP备18011211号-2
京公网安备 11010802029366号
@北京青青艺盛文化传媒有限公司
关注汽车人传媒
  • 中国汽车先锋力量
  • 来这了解更多车讯
联系方式
  • 連絡電話:8610-6343-5270
  • 連絡電話:8610-6343-5270
  • 郵便番号:100036
关注汽车人传媒
  • 中国汽车先锋力量
  • 来这了解更多车讯
关注汽车人时刻
  • 最火最热的一线车
  • 讯,在这等你。
关注汽车人传媒
  • 中国汽车先锋力量
  • 来这了解更多车讯
关注汽车人传媒
  • 中国汽车先锋力量
  • 来这了解更多车讯