和国外差距有多大?聊中国自动驾驶芯片

来源:汽车之家
       自动驾驶系统,最关键的部件是什么呢?是传感器?是控制软件?还是处理芯片呢?我个人认为在目前这个阶段来说,处理芯片是一个最关键的部件,它的性能直接影响自动驾驶系统的好坏。过去,顶尖的芯片技术一直是国外企业垄断的,但随着中国芯片企业近年的快速追赶,情况已经有所改观。今天我们就来聊聊中国自动驾驶芯片究竟处于一个怎样的水平?

汽车之家

● 自动驾驶芯片是干什么用的?

  虽然目前L3级别有条件自动驾驶车辆在中国尚未落地,但从一些带有高阶L2驾驶辅助系统的车辆上我们可以发现,这些车辆都带有数量不少的传感器用以检测车辆周围的障碍物,从而为控制系统决策提供数据支持。这些传感器包括毫米波雷达、超声波雷达、摄像头等。这些传感器每秒钟会产生数GB(1GB=1024MB=10242KB)的数据,自动驾驶芯片需要流畅地处理这些数据才能保证系统及时作出正确的决策,从而确保车辆的行驶安全。

汽车之家

  可能大家对每秒数GB的数据没有概念,这里举一个生活中的例子。普通的USB3.0接口U盘,其读取速度峰值接近200MB/s,要从这个U盘中读取1GB的文件大约需要5秒左右的时间,足见每秒数GB的数据量是相当大的。

汽车之家

  自动驾驶系统除了需要解决大流量数据传输问题,还需要解决的就是如何能快速处理这些海量数据,而强大的自动驾驶芯片正是那把正确的钥匙。

● 国外的自动驾驶芯片处在怎样的水平?

  虽然本文主要是讲中国自动驾驶芯片的,但知己知彼,百战百胜,在审视本土状况之前,我们还是先要来简单了解国外的情况。国外自动驾驶芯片真正能够大规模进入量产车市场的无非三家,英伟达、Mobileye(现已被英特尔收购)、特斯拉。

汽车之家

  其中,走实用路线的Mobileye目前市场占有率在70%以上,市场上的产品主要是应用于L2驾驶辅助系统的EyeQ3芯片(算力0.256TOPS,“TOPS”是每秒万亿次运算的意思,详细介绍请看这篇文章相关介绍,本文标注的算力如无特别说明均指的是8位整数计算能力)以及具备L3级别自动驾驶能力的EyeQ4芯片(算力2.5TOPS)。像是小鹏G3、蔚来ES6(参数|询价)/ES8、广汽新能源Aion LX就采用了EyeQ4芯片作为其驾驶辅助系统的核心。

汽车之家

汽车之家

  相较于英伟达上代自动驾驶平台旗舰之作DRIVE PX Pegasus 320TOPS的算力,新的DRIVE AGX Orin平台的旗舰配置实现了成倍的性能增长。此外,DRIVE AGX Orin平台的扩展柔性化程度相比以往平台进一步提升,能够通过硬件配置的增减,满足从一般驾驶辅助到L5级别完全自动驾驶等不同级别车辆的需求。

汽车之家

  特斯拉Autopilot 1.0系统采用的是1颗英伟达Tegra3芯片+1颗Mobileye EyeQ3芯片;Autopilot 2.0系统采用的是1颗英伟达Tegra Parker芯片+1颗Pascal架构GPU芯片;Autopilot 2.5系统采用的是2颗英伟达Tegra Parker芯片+1颗Pascal架构GPU芯片。

汽车之家

  已经搭载在最新下线特斯拉车型上的自研FSD芯片,单颗芯片算力为72TOPS,Full Self-Driving Computer集成有两颗独立工作的FSD芯片,一颗“挂了”,另外一颗马上“顶上”,提升了整套系统的安全性和稳定性。

汽车之家

  当然了,除了上面三家锋芒毕露的企业,还有不少企业在垂涎自动驾驶芯片这块蛋糕,其中包括高通、赛灵思、恩智浦等,但这些企业真正走向量产车的自动驾驶芯片还不成规模,限于篇幅,这里就不作介绍了。

● 迅速崛起的中国自动驾驶芯片企业

  好了,看完国外的情况,我们目光回到国内。自动驾驶芯片市场火爆,国外科技巨头抢滩登陆,中国企业究竟实力怎么样呢?下面我们一起来看看。

◆ 寒武纪

  中科寒武纪科技股份有限公司(下称“寒武纪”)的前身是中国科学院计算技术研究所下,由陈云霁和陈天石两兄弟领导的一个课题组。该课题组在2008年开始研究神经网络算法和芯片,并在2012年开始陆续发表研究成果。

汽车之家

  2016年,上述课题组提出的深度学习处理器指令集DianNaoYu被ISCA2016所接受,实验表明搭载该指令集的芯片相较于传统执行X86指令集的芯片,在神经网络计算方面有两个数量级的性能优势。随着课题组的研究成果趋于成熟,中科寒武纪科技股份有限公司正式成立,并着手将其芯片和指令集向商业领域转化。也是在2016年,寒武纪发布了首款商用深度学习处理器寒武纪1A。

汽车之家

  聊完这家公司的身世,下面我们来看看它的产品。目前寒武纪有两款最新的人工智能芯片IP授权,分别是Cambricon-1M和Cambricon-1H。性能指标最强的Cambricon-1M-4K在1GHz时钟频率下拥有8TOPS的算力;性能指标最弱的Cambricon-1H8mini在1GHz时钟频率下拥有0.5TOPS的算力。所有型号的详细算力参数可以参看下表。

寒武纪终端智能处理器IP
产品计算能力(1GHz运行频率时的8位整数运算能力)
Cambricon-1M-4K8TOPS
Cambricon-1M-2K4TOPS
Cambricon-1M-1K2TOPS
Cambricon-1H161TOPS
Cambricon-1H81TOPS
Cambricon-1H8mini0.5TOPS

  Cambricon-1M和Cambricon-1H被定义为终端智能处理器IP。我们在手机或者汽车这些终端上出现的人脸识别、指纹识别、障碍物识别、路标识别等应用都能通过在芯片中集成上述处理器IP实现加速。

汽车之家

  上面提到的“边缘”一词来自于“边缘计算”。 边缘计算是指在靠近智能设备(终端)或数据源头(云端)的一端,提供网络、存储、计算、应用等能力,达到更快的网络服务响应,更安全的本地数据传输。边缘计算可以满足系统在实时业务、智能应用、安全隐私保护等方面的要求,为用户提供本地的智能服务。思元220在边缘计算中扮演着提高数据安全、降低处理延时以及优化带宽利用的角色。

汽车之家

  目前寒武纪高算力芯片产品被定义为智能加速卡,可用于服务器中加速人工智能运算。谷歌的AlphaGo人工智能机器人打败韩国世界围棋冠军李世石的新闻相信各位有所耳闻,AlphaGo人工智能机器人的背后其实是谷歌自研的TPU芯片。寒武纪的高算力芯片产品的特性和应用也与谷歌TPU类似,当然它们之间也可以算是竞争对手了。

汽车之家

  所不同的是思元270-S4采用的是被动散热设计,最大热设计功耗为70W,定位为高能效比人工智能推理设计的数据中心加速卡。这也意味着该卡会有“功耗墙”设定,即当加速卡功耗达到阈值上限时会降低算力以保证较低的功耗和发热。

  思元270-F4相当于是“满血版” 思元270-S4,最大热设计功耗150W,采用涡轮风扇进行主动散热。良好的散热和充足的供电使得思元270-F4能够发挥出思元270芯片的全部性能。该卡定位是为桌面环境提供数据中心级人工智能计算力,简而言之就是为台式机配的高性能人工智能加速卡。

汽车之家

汽车之家

  虽然思元270在制造工艺上只采用了台积电的16nm工艺,但整体能耗比还是做得比较不错的。虽然单卡算力不及最新的英伟达旗舰计算卡,但5张思元270-S4/思元270-F4并行的话,峰值算力也能达到英伟达A100的水平。只是英伟达A100更先进的工艺应该在能耗比上面会有一定的优势。

汽车之家

  其中思元100-C搭载了视频和图像解码单元,采用被动散热方式,最大热设计功耗为110W;思元100-D不搭载视频和图像解码单元,采用被动散热方式,最大热设计功耗为75W。目前思元100系列产品已经于2019年在滴滴云和金山云上得到应用。其中滴滴云采用思元100板卡加速弹性推理服务,该服务用于深度学习推理任务;而金山云则采用思元100板卡加速语音、图像、视频等人工智能应用。

寒武纪智能加速卡
产品计算能力(8位整数运算能力)功耗备注
思元270-S4128TOPS70W被动散热
思元270-F4128TOPS150W主动散热
思元100-C32TOPS110W被动散热,支持解码
思元100-D32TOPS75W被动散热,不支持解码

  前面讲的尽是服务器级的计算卡,这是不是偏离了我们应该聊的自动驾驶芯片话题呢?其实不然。前面也提到了,寒武纪目前是一家专注于人工智能芯片开发的企业,自动驾驶领域确实涉足不深,但通过和其他国内友商的联合还是有一些建树的。

汽车之家

  WiseADCU CN1自动驾驶运算域控制器提供了L3或以上级别自动驾驶系统所需的算力以及传感器连接数量需求,实现了仿真、模型、系统、架构、编码、加速、算法七个关键控制点的自主可控。

汽车之家

  实际上威盛集团由于处理器产品性能竞争力弱,早就退出了主流X86处理器市场的竞争,市场中就剩下英特尔和AMD在角力。兆芯成立后,吃透了威盛的X86技术,并在威盛当时最新的处理器架构基础上进行全面的改进和优化,先后推出了ZX-A、ZX-C以及ZX-C+等处理器产品。

汽车之家

  6月2日,科创板上市委发布2020年第33次审议会议结果公告,寒武纪上市获得通过,从受理到审批通过,寒武纪只用了68天,刷新了科创板审核速度。寒武纪上市后成为A股中唯一一家人工智能芯片公司,该领域的市场空间在2022年有望超过500亿美元,发展潜力巨大。打通了A股融资渠道的寒武纪究竟能否凭借其独特的技术优势进一步发展壮大呢?这谁都说不准,但可以确定的是,寒武纪的成功上市让很多投身于该领域的公司赢得了信心,看到了希望,中国人工智能芯片时代或将由此开启。

◆ 地平线机器人

  好了,聊完寒武纪,我们来聊聊另外一家人工智能芯片企业——地平线机器人技术研发有限公司(下简称“地平线”)。地平线是由前百度深度学习研究院常务副院长余凯于2015年创立的,专注于自动驾驶与人工智能芯片的一家公司。余凯也是百度自动驾驶的发起人。

汽车之家

  余凯建立的地平线,一直以来坚持的是软件和硬件相结合的方向。他认为,算法、芯片和云计算将构成自动驾驶的三个核心支点。相比起前面介绍的寒武纪注重打造高性能硬件芯片,地平线的商业模式是把以“算法+芯片”为核心的嵌入式人工智能解决方案,提供给下游厂商。打个比方比较好理解,如果说寒武纪卖的是处理器芯片,那么地平线卖的就是安装了操作系统的整机。产品方面,相较寒武纪从终端到云端的芯片产品布局,地平线虽然自研芯片,但更偏重的是以产品功能来划分产品线。

汽车之家

  硬件上,征程二代芯片内部集成了两个Cortex A53核心、两个自研的BPU(Brain Processing Unit,可用于加速人工智能算法)核心、DDR4内存控制器以及输入输出控制器,算力达到4TOPS,典型功耗为2W,这比起目前主流的Mobileye EyeQ4芯片的算力和能耗比都更优秀。

汽车之家

  这些智能音箱有较强的自然语义识别功能,能够识别人们发出的语音命令,结合物联网技术,人们通过简单的语音命令除了能够让音箱播放在线音频资源外,还能够控制各种家电,如开关、灯泡、风扇、空调等。这就是AIoT的一个最简单的应用例子。

汽车之家

  从硬件方面看,旭日二代芯片内部集成了两个ARM Cortex A53核心、两个自研的BPU核心、DDR4内存控制器以及输入输出控制器,算力达到4TOPS,典型功耗为2W。从参数上看,旭日二代和征程二代好像没什么差别,实际上征程二代可以看做是旭日二代的车规版,它满足AEC-Q100标准,在工作温度、电磁辐射等标准上会更高一些。虽然征程二代和旭日二代均采用台积电28nm工艺制造,但旭日二代芯片尺寸为14x14mm,比征程二代芯片17x17mm的尺寸更小,更有利于内嵌到AIoT设备当中。

地平线机器人人工智能芯片
产品计算能力(8位整数运算能力)功耗备注
征程二代4TOPS2W车规级芯片
旭日二代4TOPS2W-

汽车之家

汽车之家

地平线机器人自动驾驶平台
产品计算能力(8位整数运算能力)功耗备注
Matrix二代16TOPS-基于征程二代芯片
Matrix三代192TOPS48W基于征程三代芯片

  和寒武纪一样,地平线同样拥有自研的人工智能加速芯片技术。所不同的是,地平线更注重软件和硬件的整合,从而为下游厂商提供成熟的解决方案。在资本市场,地平线同样受到追捧,其投资者众多,其中包括了世界半导体行业巨头英特尔和SK海力士以及国内的一线汽车集团等。未来地平线是否会和寒武纪一样登录科创板目前还不得而知,但CEO余凯对于在科创板上市是持积极态度的。我个人是支持有更多像地平线这样的企业登录科创板,更充分的竞争可以避免垄断同时促进该领域的加速发展。

◆ 西井科技

  西井科技创办于2015年,它起初是一家做类脑芯片的厂商。所谓的类脑芯片简单来说就是以人脑的工作方式设计制造出来的芯片。目前大行其道的冯•诺依曼结构处理器芯片,其计算模块和存储单元是分离的,芯片工作的过程中需要通过数据总线来连接计算模块和存储单元,数据传输上的开销太大从而限制着这类芯片的工作效率和能耗比的提升。

汽车之家

  类脑芯片模仿的是大脑神经元的工作形式,大脑的处理单元是神经元,内存就是突触。神经元和突触是物理相连的,所以每个神经元计算都是本地的,而从全局来看神经元们是分布式在工作。类脑芯片由于具有本地计算和分布式工作的特点,所以在工作效率和能耗上相比冯•诺依曼结构处理器芯片更有优势。

汽车之家

汽车之家

  虽然这种类脑芯片看着和普通的处理器芯片在外观上没有什么不同,但其实内部运作原理与传统的处理器芯片有着本质的区别。国内除了西井科技开发出了类脑芯片,像是清华开发的天机(TianJic)芯片和浙大开发的达尔文(DARWIN)芯片都是类脑芯片。所不同的是,西井科技的DeepSouth芯片是全球首块可商用5000万类脑“神经元”芯片。

汽车之家

  西井科技这艘大船拿着投资人动辄过亿的投资款,肯定是要追求盈利的。不管公司的技术有多超前,无法商业化在逐利的资本市场必然是无法接受的。随着人工智能和自动驾驶产业的兴起,西井科技找到了技术商业化的契机。

汽车之家

  相比起我们前面两个厂商动辄上百TOPS算力的产品,西井这两款产品的算力确实有点拿不出手。但西井科技的这两款芯片能够实现片上学习,可以随时新增样本进行增量训练来提升推理准确率。

西井科技人工智能芯片
产品计算能力(8位整数运算能力)功耗备注
DeepWell1.8TOPS(AT 800MHz)1W(双核)/0.5W(单核)基于钠架构,类脑芯片
VastWell4TOPS(AT 1GHz)<2W基于钾架构,类脑芯片

  可能大家看到这里还是没看懂西井科技这两块芯片的优势所在,我在这里稍微解析一下大家就能够明白。目前的自动驾驶算法都是通过高性能服务器进行模型训练(让计算机去看摄像头或激光雷达等传感器获取的环境数据,学习目标判断方法),然后将训练好的模型再部署到车载硬件之中(把机器学习到的高效目标判断方法固化到车载自动驾驶系统之中)。

汽车之家

  在实际应用方面,西井科技并没有一头冲进乘用车自动驾驶系统领域,而是在智能港口和智能矿场干出了自己的一片天地,并把触角伸向了智慧医疗和智慧物流领域。2017年10月,公司与全球知名港机巨头振华重工建立长期合作伙伴关系,这是西井科技进军智能港口的重要一步。

汽车之家

  自动驾驶卡车要在港区自动装卸集装箱,需要自动驾驶系统精细的车辆控制、敏锐的环境识别以及准确的定位,这些都需要港区高清地图配合。西井科技的无人集装箱卡车定位精度在5cm以内,这是实现集装箱自动装卸的关键。全球首辆港区作业无人集装箱卡车作业成功,充分展现了西井科技在卡车自动驾驶系统以及高精度地图绘制领域的实力。 

汽车之家

汽车之家

  除了自动驾驶和高清地图绘制外,西井科技还为企业打包了一整套智能港口和智能矿场解决方案,利用人工智能技术提升港口和矿场的运作效率,同时能够进一步降低其运营成本。深挖行业中存在的机遇,逐步筑起行业壁垒是西井科技面对人工智能芯片市场激烈竞争的重要策略。

汽车之家

  作为全球最早落地行业应用的自动驾驶团队,西井科技旗下自动驾驶品牌Qomolo逐路目前涵盖了无人驾驶跨运车、无人驾驶新能源集卡和无人驾驶矿卡三大项目。

汽车之家

  面对乘用车自动驾驶芯片领域的激烈竞争,我认为短期内西井科技不会进入该领域。相反它会通过深耕已有的智能港口、智能矿场以及无人驾驶重卡市场,进一步筑高上述市场的壁垒,扩大自身的行业影响力和竞争力。但不能忽视的是,西井科技掌握的类脑芯片技术或有可能成为未来自动驾驶芯片领域的一个风口。

  上文详细介绍中国3家知名自动驾驶芯片公司及其产品,相信大家应该对目前国内自动驾驶芯片现状有了一个更深了解。除了这三家公司,数字地图供应商四维图新通过收购杰发科技也布局自动驾驶芯片市场,但量产芯片目前尚未落地。百度的昆仑芯片以150W的功耗实现了260TOPS的算力,竞争力很强,但其定位为云端全功能人工智能芯片,主要用在服务器之上。百度在自动驾驶领域的亮点还是在于其Apollo自动驾驶软件平台。

● 全文总结:

  寒武纪、地平线、西井科技这三家公司都有着各自的特色和亮点。寒武纪专注于芯片研发,产品算力最强;地平线除了研发芯片,还提供完整的自动驾驶软件方案,对主机厂开发更友好;西井科技掌握独特的类脑芯片设计,在智能港口、智能矿场以及无人驾驶卡车领域已经站稳了阵脚。整体来看,中国自动驾驶芯片在性能和功耗上和外国芯片相比并不差,如何在中国开放L3级别有条件自动驾驶车辆落地这个时间节点用产品和服务先发制人是中国自动驾驶芯片企业的制胜关键。究竟鹿死谁手,让我们拭目以待吧,好戏即将上演!

北京朝阳区青年路27号院 电话:010-58071949 89224557
网站设计/技术支持:中国普网京ICP备2020044305号