马来西亚#文爱油车时间的三大件是长津湖，智驾时间的芯片便是上甘岭|算法|gpu|英伟达|cpu|thor

发布日期：2024-10-10 00:10 点击次数：191

马来西亚#文爱

世上无难事，只须肯攀高，许多东说念主可爱登山，追求的是登顶和翻越峻岭之后的设立感。

自芯片荒以来，原土车企这几年时候也爱上了登山，他们登的那座山叫芯片。

在东邪西毒里，借着欧阳锋的口，王家卫说，年青的时候看着大山，就想知说念山背面是什么，年事大了，就不想知说念了。

芯片是中国的老浩劫，亦然一座很难翻越的关山，在这座大山的背后，是一个又一个异构筹画单位。

咱们以黑芝麻（参数丨图片）A1000的异构筹画架构图为例，张开先容一下以智能驾驶和智能座舱为主要应用场景的汽车大算力芯片里面的各样异构筹画单位。

这类大算力芯片一般会包含CPU、GPU、NPU、DSP、ISP、安全MCU、视频输入输出、筹画机视觉引擎、各样通讯接口。

CPU不错针对不同应用的及时性和安全条目遴荐出手不同的操作系统，治理内存、存储、文献系统、系统外设等各样资源，进行逻辑筹画，提供安全赞成。

GPU主打图像处理，认真治理多个高隔离率清爽器的图形渲染和纹理处理，赞成优先处理模样屏之类的及时应用。

DSP进行滤波、降噪等数字信号处理，既不错提供定点筹画智商，也不错进行复杂的浮点筹画；ISP既不错用于图像的感知，也不错用于图像的合成。

NPU是环球现在最垂青的神经网罗处理器，偶然也被称为BPU或AI引擎，主要用于神经网罗的推理责任。

天然了，鉴于AI照旧发展了六七十年，CPU和GPU也具备一定的AI智商，CPU不错进行轻量级单次推理的低蔓延AI任务，GPU的并行特质和大迷糊量使其可用于处理媒体、3D和渲染中的AI任务。

芯片计划的主要责任是对各式各样的筹画单位进行机动的组合，遴荐合理且灵验的算力类型和算力规格，情愿应用场景的各样性需求，并达到算力、功耗、老本的最好均衡。

不外，在现在这个时间，大算力芯片计划最主要的任务是聚焦最新的神经网罗架构，使其NPU或AI引擎的计划不错作念到与当代神经网罗协同优化。

早起的鸟儿有虫吃，早起的虫子被鸟吃。

有的规模存在先发上风，有的行业存在后发上风。关于算法不停变化的智驾来说，自动驾驶芯片作念得越晚，就越是大略安妥手艺阶梯的不停演变。

在2021年的GTC大会上，英伟达推出了Orin X的下一代芯片Atlan，到了2022年的GTC大会上，豪横的黄教主砍掉了照旧花了好几亿好意思金的Atlan，凯旋推出了新的芯片-雷神Thor。

此次转变的中枢原因并不在于Atlan的芯片算力有点低，要知说念，诚然Atlan的芯片算力为1000T，Thor的芯片算力也曾一度提高到2000T。

然而，到了2024年的GTC大会上，出于一些不成言说、难以琢磨的原因，这颗芯片的算力又被阉割成了1000T。

事实上，跟Atlan比拟，Thor最中枢的滚动在于加入了Transformer引擎。

之是以几亿好意思金说吊水漂就吊水漂了，黄教主连眼睛齐不眨一下，是因为在2021年的AI Day上，特斯拉推出基于Transformer的BEV，一下子灵通了悉数这个词自动驾驶行业的视线：CNN的时间截止了，Transformer的时间到来了。

华为也曾在2022年推算过,到2027年,自动驾驶系统中的CNN和Transformer的筹画比例将从2022的七三开进化成届时的三七开。

为了赞成占据更大比例的Transformer筹画，芯片层面必须引入原生的Transformer引擎，作念好底层赞成，智力保证表层自动驾驶算法的精度、时延。

这个几亿好意思金的训戒揭示了一个深入的预见，要作念出一颗得胜的自动驾驶芯片，必须相等了解自动驾驶算法。

在NOA市集屈居英伟达之下、在一体机市集独占鳌头的地平线将我方标榜为披着芯片厂商外套的算法厂商的中枢原因就在这里。

自动驾驶系统里面有千千万万个小模子，这些模子会用到哪些具体的算法，需要芯片在硬件层面提供什么样的赞成，荒芜检会自动驾驶芯片厂商在算法上的实力。

男女搭配，干活不累，软硬协同，智力得回力大砖飞的系统。

对智能系统而言，芯片仅仅基础，奈何与软件深度协同并将协同效应最大化才是制胜的重要。

厂商若不提供不错开释硬件性能的底层软件，对诞生者而言，芯片便是一块板砖。

接下来，先摆事实再讲预见，谈一谈为何芯片厂商需要已矣软硬协同。

摆事实，自2016年起，特斯拉罗致英伟达的Drive PX 2开启了自动驾驶的自研之路，版块号为HW 2.0，物理算力是24TOPS，其后升级为HW 2.5，物理算力提高到80TOPS。

2019年，特斯拉推出第一颗自研的自动驾驶芯片，算力为72TOPS。

算力下跌了，但在以FPS为度量见解的确凿性能上，HW3.0相较于HW2.5提高了足足21倍!

这个比较不单证明了特斯拉的超等强悍，还告诉了咱们一个铁一般的事实：唯有深谙自家芯片的硬件特质和手艺神秘，才有可能计划得当的算法压榨硬件算力，将软件性能证实到极致。

再讲预见，系统的性能=筹画算力x筹画带宽x筹画算法。

这里的筹画算力是硬件处理器不错开释的峰值筹画着力，环球津津乐说念的芯片算力若干个TOPS指的便是这个见解。筹画带宽指的是对峰值筹画智商的灵验诓骗率，取决于芯片架构、编译器的优化进度。

筹画算法指的是算法效果，不错相识为软件在硬件上的驻留时候或者资源占用情况，停留时候越长，对硬件后劲或者说性能的挖掘就越大，这个见解取决于芯片厂商提供的算子的效果和表层算法诞生商的算法实力。

看到了吧，芯片从来不仅仅芯片，而是芯片+底软的合座处理决策，要是作念芯片仅仅拿着各式IP核搭积木那么粗拙，国度何至于每年要入口四五千亿好意思金的芯片？

作念芯片到底有多难，三天三夜也讲不完，隔邻的手机厂商最了解这少量。

君不见马来西亚#文爱，已历程去了10年的时候，小米于今还莫得拿出第1颗着实自研的手机芯片？

马来西亚#文爱 油车时间的三大件是长津湖，智驾时间的芯片便是上甘岭|算法|gpu|英伟达|cpu|thor