征程6介绍
与以往征程系列前几代产品不同的是,征程6(我们业内称为J6,“钩6”)并不是一款芯片,而是根据算力大小,分成了J6B/J6L/J6E/J6M/J6H/J6P 6款!
1 J6P芯片参数
- CPU:18核心的ARM Cortex-A78AE,算力是410K DMIPS
- BPU:如上文介绍,采用了纳什架构第四代BPU,560TOPS算力(注意上图左下角的一行小字:560TOPS算力是等效1/2稀疏网络下的算力,必须严谨!)
- 算法支持:对Transformer算法的支持效率在业内领先,同时支持大规模交互式博弈等前沿算法,表明其在处理复杂AI任务上的优越性能。
- 功能安全:通过ISO 26262 ASIL-D功能安全流程认证,主动安全AEB ASIL-B产品级功能安全认证。
2 四芯合一的芯片架构
J6芯片所实现的“四芯合一”是指将以下四种关键处理单元集成在同一颗系统级芯片SoC上:
- CPU(Central Processing Unit):负责通用计算任务,处理非特定的计算工作负载,是芯片的控制中心,执行操作系统的指令和应用程序的逻辑控制。
- BPU(Brain Processing Unit):地平线自主研发的神经网络处理单元,专门针对人工智能算法和深度学习任务进行了优化,如图像识别、自然语言处理等,是实现智能驾驶核心算法的关键。
- GPU(Graphics Processing Unit):图形处理器,除了传统意义上的图形渲染,现代GPU也广泛用于并行计算,特别是在机器视觉、环境感知等需要大量并行处理的场景中。
- MCU(Microcontroller Unit):微控制器单元,常用于实现嵌入式控制功能,具有功能全、体积小、集成度高等特点。在J6中,MCU被集成用以处理功能安全相关的任务,确保系统的可靠性。
这种高集成度的设计不仅提升了系统性能,还显著提高了性价比,降低了部署难度,使得单颗征程6芯片就能够支持包括感知、规划决策、控制、座舱感知等在内的全栈计算任务,适用于多种智能驾驶应用场景。
这种多合一实际上就是SIP(System in Package),SIP威廉希尔官方网站 是一种先进的半导体封装威廉希尔官方网站 ,它允许将多种功能芯片、元器件(如处理器、存储器、传感器、RF组件等)以及被动元件(如电阻、电容)集成在一个封装内部,形成一个具有完整或部分系统功能的封装模块。与传统的单一封装只包含一个主要芯片(如SoC)不同,SIP威廉希尔官方网站 通过并排排列、堆叠或采用3D封装等方法,将多个独立的芯片和组件紧密集成,从而实现了更高的集成度和更小的封装尺寸。
征程6系列不是人们之前猜测的3款芯片,而是6款,足以覆盖智能驾驶的各个场景和价位。发布会上重点介绍了征程6B、6E、6M和6P,笔者认为B应该是Base,L是Light,E是Efficiency,M是Medium,H是High,P是Performance或Premium。地平线没有公开征程6L和6H的参数,预估6H的AI算力是256-300 TOPS,CPU算力是250-300K DMIPS。6L的AI算力是30-40TOPS,CPU算力是40-50K DMIPS。
征程6系列与5系列相比,升级最明显的是CPU算力。征程5的CPU是8核心Cortex-A55,算力大致是25-30K DMIPS,这次除了最低的征程6B,其余CPU算力都大幅度提高。
征程6系列的另一个升级是BPU架构,所谓BPU就是地平线对AI加速器的另一种称呼,B代表Brain,可以称为类脑处理器,第一代BPU,地平线致敬数学家伯努利,伯努利分布是最简单的离散型概率分布模型。第二代BPU,地平线致敬英国数学家贝叶斯,他推导出贝叶斯定理,贝叶斯定理是一个由结果倒推原因的概率算法,当年默默无闻,在人工智能的今天大放异彩。
征程6的第三代BPU架构则致敬博弈论创始人纳什,称之为纳什架构。约翰·纳什,生于1928年6月13日,著名经济学家、博弈论创始人、《美丽心灵》男主角原型,并且还是前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家(经济学家,约翰·C·海萨尼和莱因哈德·泽尔腾)在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。
博弈论主要针对智能车与智能车,智能车与非智能车之间决策交互产生的影响,目前大部分智能驾驶都是基于单车的,未考虑其他车辆对智能车决策的影响,这使得智能车有时候看起来不十分灵活,比如对向车主动让道让智能车先走,但智能车无法理解对向车的意图,还是傻傻地等对向车先走。也就是智能驾驶的策略,大多都有强化学习的影子,强化学习(Reinforcement Learning,RL)旨在通过与环境(可以是虚拟的也可以是真实的)的交互来使智能体(我们的「模型」)学习。RL 一开始是根据 Markov 过程提出的,我们让智能体处于不确定的固定环境中,并试图通过奖励/惩罚机制来学习到一个最优策略。在单智能体的情况下,这种方法被证明是收敛的。但是,如果是将多个智能体放置在同一环境中(多智能体强化学习,MARL),情况就复杂多了。
假设我们正在试着用智能车来改善城市的交通情况,这时每辆车的决策都会影响其他车的决策与表现,比如智能车与智能车之间很可能会发生冲突,因为可能对于两辆智能车而言,沿着某条路线行驶都是最方便的(获得最多的奖励)。博弈论有个RL算法,它使用深度神经网络进行函数逼近,迭代计算子游戏的收益矩阵(Gt)。这个子游戏就是上文提到的 stage games。在每个时间 t 处(每个 stage game),都会计算出符合 NE 的回应(σ),并得到最优策略(π),然后添加新的策略来扩展 Gt 为 Gt + 1,继续重复上述过程。这是最高明的智能驾驶决策算法。
征程6全系列的AI加速都是纳什架构
征程6B主打极致性价比,CPU可能是6核心的Cortex-A55,制造工艺可能是14或28纳米,征程6B的国际意向客户是博世和电装,国内意向客户是四维图新、福瑞泰克和Minieye。主要对手可能是Mobileye的EyeQ5M/H和EyeQ6L。
征程6系列主打产品是E/M。
征程6系列将于2024年内开启首个前装量产车型交付,并预计于2025年实现超10款车型量产交付。面向中阶智驾市场,地平线推出普惠城区性价比方案最优解——征程6M,以及极致体验高速NOA最优解——征程6E,并提供符合AEC-Q104车规标准的SiP模组和Matrix 6域控参考设计,以超高集成度实现更低的功耗和更优的系统成本。发布会上,地平线官宣与多家Tier1、软硬件合作伙伴达成征程6E/M的合作,并公布到2024年第二季度将有超过50家生态伙伴推出基于征程6E/M的准量产级产品。
大家最关注的还是征程6系列的旗舰征程6P。
征程6P的AI算力是560TOPS,地平线谨慎地做了标注,560TOPS是在1/2稀疏网络下的等效算力,地平线未提及精度,应该还是INT8位。这个算力实际远超4片Orin合并的算力,再强调一次,以目前车载领域用的最顶级车载以太网交换机带宽不超过1.25GB/s,典型的PCIe 4.0交换机,带宽不超过32GB/s,即便是价格远超Orin 的PCIe 6.0交换机,带宽也不超过120GB/s。想要像服务器行业那样是用4个H100就让算力增加4倍,带宽至少要做到900GB/s,而这根本做不到,用最顶级的车载以太网交换机连接4个Orin,算力顶多是1.2倍单个Orin算力,也就是300TOPS。这也是英伟达要花十几亿美元开发NVLINK的原因,也是NVLINK被美国管制严禁出口的原因。
CPU是18核心的ARM Cortex-A78AE,算力是410K DMIPS,英伟达Orin-X是12核心,内核也是ARM Cortex-A78AE,算力是227K DMIPS,因为Orin的GPU发热量比较大,所以其CPU的频率较低,而地平线的GPU算力只有200GFLOPS,发热量很低,所以CPU频率可以高点,算力几乎是英伟达的两倍,华为的昇腾610的CPU则是16核心,算力是200K DMIPS
征程6P里面添加了一个微型GPU,算力很低,只有200GFLOPS,主要是为了将智能驾驶领域的图像输出到仪表或中控屏上。
为了降低成本,更好管理供应链,也为了减少软件复杂度, 征程6P内部添加了一个达到ASIL-D级的MCU岛,算力是10K DMIPS ,目前 大家都是使用单独的安全MCU来控制车辆底盘,通常是英飞凌的TC397,TC397价格比较高,且价格波动大,供应状况不稳定,最高算力是4K DMIPS,典型算力是2.7K DMIPS 。地平线没有公布详细信息,应该是 和高通SA8650/SA8255/SA8775那样的4核心ARM Cortex-R52内核,运行频率估计是800-1000MHz 。
存储带宽方面,升级到了LPDDR5,带宽达205GB/s,与英伟达Orin相同。前视感知支持1800万像素,图像带宽5.3Gpixel/s。
- 内部采用TB/s级高性能总线,访存延时低至130纳秒。
- 为应对新一代大模型Transformer较多的矢量运算,特别添加了VPU,即矢量浮点运算加速单元。
- 地平线征程P6的晶体管数量高达370亿,英伟达Orin只有170亿,Xavier只有90亿。
与征程6系列一同发布的还有 全场景智能驾驶解决方案SuperDrive ,它聚焦拟人化体验突破,打造好用的智驾系统2.0。凭借动态、静态、OCC(Occupancy占用网络)三网合一的端到端感知架构,数据驱动的交互式博弈算法,SuperDrive在任何道路环境下都能兼顾场景通过率、通行效率和行为拟人,在拥堵汇流、路口交互-动态Driveline、礼让骑行人、拥堵换道、城市环岛通行等城区复杂场景下,均能够为用户带来优雅不怂、从容笃定的智能驾驶体验。
SuperDrive复杂场景体验突破
动态、静态、Occupancy三网合一的感知端到端架构是精准还原客观物理世界的有效手段。在此架构下遮挡准召率提升70%,动态代码行数降低90%,网络负载降低50%,有效解决当前行业感知架构时延高、规则多、负载重的问题。数据驱动的交互博弈可带来更拟人的最优解,使得SuperDrive像老司机一样灵活处理复杂交通流,在拥堵场景下变道成功率提升50%,路口通过率提升67%。
审核编辑 黄宇
-
芯片
+关注
关注
455文章
50714浏览量
423158
发布评论请先 登录
相关推荐
评论