导读:在过去的几年时间,汽车行业对于芯片的认知,已经不再是传统二级(甚至是三级、四级)供应商的角色。由于去年开始的芯片短缺潮以及汽车智能化、电动化对于芯片需求的激增,汽车制造商如今是“谈芯色变”。
对于一部分没有足够自研能力的车企来说,目前市面上可选择的计算平台,大家的评判依据仍然是传统的CPU、GPU算力,同时借助这些芯片厂商提供的底层软件平台来进行系统开发。
实际上,从去年开始,一部分车企已经开始在域控制器层级(芯片的下一级供应链)寻求自研(生产环节委外代工,或者内部Tier1自建产线),同时车企与芯片公司之间的连接成为常态,这是对传统供应链关系的一次关键重构。
智能汽车产业正在寻求构建一种开放协同的关系。在软件定义汽车的时代,软件的性能“天花板”取决于芯片以及硬件能力的最大化利用。
“为了弥补硬件的局限性,您的软件需要变得更好。但,再聪明的软件也无法在旧硬件上正常发挥。”这是特斯拉CEO马斯克的逻辑。
一、开放协同是未来
未来,智能汽车将成为比PC、智能手机更大的母生态,芯片和操作系统则是这个母生态的“数字底座”。而开放的“数字底座”,将是行业的大势所趋。
这一点,已经得到全球主要汽车芯片供应商的一致认同,而且也是后续竞争客户的“杀手锏”。甚至已有车企提出要自研或定制芯片,原因是特斯拉自主设计FSD芯片,已经在差异化上与通用芯片拉开距离。
在高工智能汽车研究院看来,定制SoC不意味着车企需要全部自研IP。事实上,ARM的开放授权模式在智能手机时代的成功,已经验证了可行性:加速整个产业迭代速度、缩短迭代周期、降低研发成本。
作为全球率先基于自研BPU(Brain Processing Unit)实现汽车智能芯片前装量产的地平线,也给出了自己的答案。在近日举行的中国电动汽车百人会论坛上,地平线创始人兼首席科学家余凯博士提出,在提供SoC级高性能汽车智能芯片的同时,地平线将进一步开放,尝试向部分车企开放BPU IP授权。
芯片公司跟主机厂的合作模式大概分为几种。一是“Mobileye模式”,芯片公司把芯片架构、芯片以及操作系统,还有智能驾驶的软硬件系统,全部开发完,以黑盒的形式交付给整车厂;
二是“英伟达模式”,芯片公司提供芯片架构和SoC级别芯片以及操作系统,帮助车企完成自动驾驶软硬件系统开发;
三是“TogetherOS模式”,芯片公司提供芯片架构和SoC级别芯片,整车厂采用操作系统开发自动驾驶软硬件系统。
目前,地平线的开放模式为第二、三种,基于征程系列芯片和操作系统TogetherOS,赋能车企造车。在TogetherOS模式下,整车开发不光包括整个自动驾驶的应用软件,也深入到操作系统的底层,能够更高效地调用操作系统之下的各种资源。
基于芯片底层的开放合作,可以从理想汽车与地平线的合作案例得到验证。
在理想汽车创始人李想看来:“在智能电动汽车时代,开发效率决定着一家企业的生死存亡。”而软件定义汽车意味着汽车功能迭代周期大幅缩短,车企与具备算法能力的芯片企业紧密结合将是必然趋势。
2021款理想ONE的NOA导航辅助驾驶研发周期和此前相比缩减了一半,在保证品质的前提下,满足了智能汽车对产品迭代升级速度的要求。而地平线更为灵活的商业模式和更高效、更配合的协同研发,使得理想汽车可以在底层能力上与地平线高效配合,大幅缩短功能开发时间。
在余凯博士看来,在创新的时代,速度极端重要,同时要开放协同,把中间的边界打开。“我们和理想汽车的合作,七八个月的时间从项目启动到量产,实际上也是创造了一个世界级的纪录。”
结果就是,理想汽车打造了业界最强的AEB,以最快的时间自主开发全栈的NOA功能,以及实现世界上第一个基于800万像素摄像头的高等级辅助驾驶方案。
然而,这还不够。
地平线计划将开放践行到底,支持车企自主研发自动驾驶芯片,并提出第四种“BPU授权模式”:向整车厂开放最核心的BPU IP授权,同时提供软件工具包、芯片参考设计以及技术支持,助力部分车企开发自研芯片,提升差异化竞争力,加快创新研发速度。
这意味着,整车核心系统的开发,从芯片到操作系统、到整个自动驾驶的软硬件系统,实现高度协同,并实现完全的透明化。
对于汽车行业来说,智能汽车时代意味着用户体验的逻辑跟传统燃油车时代完全不一样。过去是面向供应链优化流程导向的形态,而未来更偏向于智能手机,汽车制造商需要持续领先,这就需要一个更加开放的创新生态。
余凯博士认为,ARM是值得学习的榜样,因其走出了和传统芯片公司不一样的路线,通过开放自己的芯片架构授权,缩短了迭代周期、降低了研发成本,推进了物联网时代和智能手机时代全球产业的创新和进步。
正如Windows和Intel共同加速了PC时代的成熟发展,ARM和Android共同创造了智能手机时代的繁荣生态。如今,通过IP+SoC+OS,地平线希望能打造一个开源开放的创新生态,打造智能汽车时代的“Wintel”和“AA”。
二、从算力到能力
而在高工智能汽车研究院看来,开放协同的背后,要求的不仅仅是算力,而是能力,并且这种能力可以实现快速的、低成本的“移植”。
事实上,不管是智能座舱还是高阶智能驾驶,从芯片到软件再到数据驱动,仍然处于摸索阶段。除了相对成熟的CPU、GPU、MCU等处理单元,大部分仍是采用ASIC或FPGA来做AI加速。
“三年内,负责AI高性能处理的IP,将彻底改变SoC的游戏规则。”这是一些行业人士给出的判断。
原因是,GPU只能在一定规模的矩阵下实现高利用率。这意味着,GPU在理论上提供较高的AI计算吞吐量(通常称为 “峰值吞吐量”),但在运行AI应用时,实际性能可能低得多。同时,传统GPU架构的功耗限制了应用场景。
相比而言,FPGA可提供一种不同的AI优化的硬件方法,比如独特的精细化空间可重构性。这意味着可以通过配置FPGA资源(比如,专门设计的软核处理单元),以极为准确的顺序执行精确的数学函数。但FPGA始终是过渡性产品方案,不仅仅成本,还有应用开发工具以及工程师的稀缺。
而在行业人士看来,对于自动驾驶系统来说,需要做的不仅仅包括图像和视频感知,还包括语音、语义处理,以及决策、规划等比较复杂比较高阶的人工智能程序,同时也需要非常关注解决方案的性能、成本、功耗的平衡。
这意味着,深度学习或者是神经网络处理器是最佳的解决方案。而类似地平线的BPU架构,目标就是满足深度学习和决策推理算法的能力发挥。
我们从特斯拉自研FSD可以看出,深度学习处理能力才是未来智能驾驶迭代升级的关键。比如,FSD除了常见的CPU、GPU、ISP,核心就是两颗自研的深度学习和预测的神经处理单元NPU。
而地平线提出的“AI计算的新摩尔定律”,就好比此前英伟达提出的GPU计算时代(原因是此前基于半导体物理学的局限,意味着CPU性能每年只能提升10%)。
对此,地平线总结出这样一个公式:真实AI效能=物理算力(即以TOPS表示的峰值算力)*计算资源的有效利用率*AI算法的效率。
如今,在汽车行业已经进入一个全新的智能化时代,更高的AI性能和能效是核心衡量指标。比如,峰值算力只是一个基础指标,而深度学习计算架构、操作系统、编译器、动态运行库以及软件算法决定了真正的能效。
目前,地平线基于“新摩尔定律”设计的征程系列AI芯片,是唯一围绕BPU打造,满足车规级、功能安全,并且实现大规模前装量产的SoC。而征程5芯片则基于更先进的神经网络,加速性能越高,同时能用更低的功耗,去完成更多的数据的计算。
类似BPU这样的架构,聚焦深度学习和决策推理算法能力,同时要求高性能、低功耗、低成本的专用。这个时候,算力 (单位: TOPS)并不反映汽车智能芯片实际性能,而每秒准确识别帧率(单位: FPS) 才是更真实的性能指标。
通常GPU在跑深度神经网络算法的时候,算力利用率有时会很低,而地平线的征程3和征程5则有很高的算力利用率。
结果是,征程5的算力虽然只有英伟达Orin的一半,但在进行自动驾驶任务时其FPS却高达1283,大幅领先Orin。这代表更快速的感知、更低的延时,以及更高的安全性和行驶效率。
地平线的BPU是一款典型的异构多指令多数据的系统,架构中心处理器是完整的系统,存储器架构设计进行了特别优化,能使数据自由传递,进行多种计算,让不同部件同时运转起来,提高AI运算的效率。
相比而言,如果按照通用处理器的方法,大多数时候会脱离开应用场景,并且需要有很多算力的取舍。而BPU恰恰更加关注应用,关注算法的取舍,因此其在对芯片架构的取舍、规模以及元器件的掌握都比较准确。
而在BPU架构的背后,地平线也有很多创新技术,包括高性能低延迟的数据并发处理技术。比如,用脉动阵列去提高并行计算速度,用近存计算使得存储跟计算不那么泾渭分明,而是紧密地耦合。
在目前车规级SoC的研发中,通过ARM、Imagination、Synopsys等IP核供应商,不管是芯片公司还是汽车制造商都可以快速通过“堆核”进行自研或者定制,但唯独缺少类似BPU这样的开放授权的车规级IP。
不管是基于BPU为核心的SoC,还是向自研芯片的汽车制造商开放BPU IP,实际上都是一种“赋能”。对于芯片公司来说,过去寻求提供算力来帮助车企追赶特斯拉,未来的趋势则是提供一种能力。
这也是地平线开放BPU IP授权模式的价值所在,给整车迭代提上媲美特斯拉的速度。
来源:高工智能汽车