自动驾驶芯片战即将打响
车东西
2017/09/28 13:59
前几日,特斯拉与AMD合作研发自动驾驶芯片的绯闻沸沸扬扬,一度让外界猜测特斯拉与英伟达的合作有所变动。昨日,英伟达CEO黄仁勋在GTC China则表示,即使特斯拉用了别家的计算芯片,自己也对特斯拉的车也照买不误。
  计算芯片这一自动驾驶的大脑,被再度推上了风口浪尖。尽管不慎放出“假消息”的格罗方德出面否认了,但坊间的极大关注也表明,芯片,是众自动驾驶公司的一块心病。
  做平台的计算巨头如英伟达、英特尔、高通,“自古以来”为车厂供货的半导体商,以及做单点技术的初创公司,都在不断地试图制造属于自己的自动驾驶芯片,以在自动驾驶竞赛中掌握绝对制高点。
  一、特斯拉“寻新欢”是假?
  上周,从AMD拆分出来的晶圆厂格罗方德(GlobalFoundries,GF)无意间透露出来消息:特斯拉、AMD、GF三方,正在自动驾驶上“搞事情”。消息一出,自动驾驶圈子炸了锅。AMD股价应声而涨,英伟达股价则小幅下挫。
  对于合作,报道称特斯拉将在AMD的芯片IP基础上,开发自己的自动驾驶芯片,格罗方德则是代工厂。
  然而第二天,GF就跳出来否认,称“与特斯拉没有直接合作关系”。但是,这个说法很有意思,仅仅是撇清了自己和特斯拉的“直接关系”。而特斯拉与AMD两方,对此消息则是不予置评,既不否定,也不承认。
  特斯拉当然不会承认,因为:
  1、现在特斯拉的车型还装着英伟达家的Drive PX 2自动驾驶车载电脑到处跑呢。
  2、英伟达CEO黄仁勋的车库里还停着特斯拉Model S和Model X。
  3、英伟达今年那款性能爆棚的深度学习利器DGX-1,老黄直接送了马斯克资助的OpenAI一台,还是亲自交到后者的手中。
  但是从马斯克的经历中就可以看出,他并不是一个安分的人。和Mobileye的分手已是前车之鉴,和英伟达现在虽然你侬我侬,但也架不住特斯拉的目标是星辰大海。
  基于三点原因,特斯拉会热衷于研发自己的自动驾驶芯片:
  1、对核心硬件有更强的掌控力。
  2、研发自己的自动驾驶芯片,能够在硬件加速上形成差异,更有可能建立起自动驾驶技术的优势。
  3、Drive PX 2功耗为250W,而价格则直接是1.5万美元。如果特斯拉选择自己造自动驾驶芯片,那么成规模之后,有助于降低成本。
  因此,出于提升对核心硬件掌控力、拥有更强计算竞争力以及成本等因素的考虑,自研自动驾驶芯片对特斯拉来说确实是一个可选项。
  最直接的证据就是特斯拉作为一家汽车公司(至少目前来看是这样),所拥有的50余人的芯片团队,以及团队的带头人——去年年初加入的吉姆·凯勒。
  凯勒早年任职于AMD,参与缔造了X86-64架构(AMD为桌面端处理器作出的最伟大的贡献),拿出了能和英特尔正面抗衡的K8架构;后又进入苹果,负责了A4与A5处理器;再一个回马枪杀回AMD,奉献了Zen架构——锐龙正是在Zen架构的基础上,逼得今年的英特尔不再挤牙膏。
  特斯拉的芯片团队由这样一位在行业功勋卓著的传奇人物坐镇,必然是有所布局的。
  昨日,英伟达CEO黄仁勋在GTC China上接受采访时,面对“如果特斯拉与其他厂商做了自动驾驶芯片,你是否还会买特斯拉”这一问题,也并未在回答中急于澄清和特斯拉的合作关系。
  这次把格罗方德牵扯进去,则说明特斯拉的自动驾驶芯片至少已经到了流片测试的阶段。
  不过特斯拉不太可能去挑战英伟达的GPGPU(通用计算型GPU)在深度学习中的地位,因此这枚芯片大概率会是一款针对自动驾驶的专用计算芯片。
  二、三大巨头决战自动驾驶芯片
  特斯拉与英伟达的分分合合只是自动驾驶芯片大战中的冰山一角。在这个关键领域中,自动驾驶芯片延续了与其高度相关的深度学习所采用的几类硬件技术路线:GPU、FPGA、ASIC,引来全球各方公司同台竞技。
  首先不得不提的是英特尔、英伟达、高通三大芯片巨头,它们带领的竞争为这场芯片战争奉献了绝大多数戏码。而且,他们也恰好反映了自动驾驶芯片的不同技术路线之争。
  1、英特尔:豪掷320亿美元,买出一片天
  在深度学习兴起的这两年,英特尔颇有些哀伤。因为CPU天生擅长串行与通用计算,在面对需要大规模并行计算的深度学习时,暂时处于被GPU压制的状态。因此,英特尔绕过GPU,在2016年以167亿美元完成了对世界第二大FPGA公司Altera的收购。
  FPGA,现场可编程门阵列,是一种处于CPU、GPU和ASIC之间的芯片。相较于CPU、GPU的通用计算属性(没错,GPU虽然比CPU“专业”不少,但仍属于通用计算),FPGA的功能更加专一,并且更加接近底层I/O,运算实时性比CPU/GPU更高,一旦完成编程,就能进行特定的运算,比CPU、GPU更加高效。同时,它又比专用芯片ASIC更加灵活——芯片可以被反复编程,以满足不断变化的计算需求。
  高实时,低功耗,可灵活编程,这全都切中了自动驾驶对计算芯片的要求。英特尔在年初推出的自动驾驶计算平台Intel Go中,也使用了FPGA芯片。奥迪新A8自动驾驶所仰赖的核心计算单元zFAS,也使用了Altera的FPGA芯片,内建被英特尔收购的Movidius视觉算法,负责物体数据和地图数据的融合,与自动停车功能的实现。
  另外英特尔在服务器市场拥有不俗实力,这意味着在云端,其可以部署强大的计算能力。结合低延时又高效的FPGA,英特尔可以在云端处理大量并发的实时计算。这种模式尤其适合人们对智慧城市大脑的设想:每一辆无人车的数据都上传到一个中枢,由其处理并洞悉每一辆车的状态,去命令他们如何驾驶。
  当然,无人车与城市中枢之间需要高带宽、时延极低的数据通道连接起来,这也是英特尔对5G如此上心的重要原因之一。对此,英特尔在今年推出了首款车载5G通信平台。
  但是,虽然这一套设想很先进,但标准、基础设施建设,将耗费大量的时间和财力,短期内实现难度仍然较大。因此,进入眼下有切实市场的辅助驾驶至关重要。
  2016年10月,英特尔发布针对ADAS市场的凌动处理器A3900系列,为车载信息系统和ADAS功能提供计算支持。为了符合车规,英特尔还对A3900做了特别设计,最高耐受150°高温。并且,应用了16nm制程和Apollo Lake架构的A3900在功耗表现上也相当优秀,最高不超过12W。
  但ADAS的芯片市场已经有了众多传统汽车半导体商,还有Mobileye这一称霸的公司,英特尔怎么可能说切入就能切入?
  不能平地起高楼的一种解决方法是,直接买一栋。今年3月,英特尔一狠心一咬牙,以153亿美元的天价收购了以色列ADAS公司Mobileye。对于其他公司来说,Mobileye或许不值153亿美元,但是对于英特尔来说,这钱不得不花——今年初建立自动驾驶联盟时,只有宝马才买了英特尔的账。
  而Mobileye一方面为英特尔提供了切入自动驾驶市场的渠道——前者在全球ADAS市场的份额超过70%;另一方面,Mobileye的核心产品——ADAS专用芯片EyeQ系列,使英特尔形成了针对车辆端的计算芯片解决方案——英特尔的凌动/至强+Mobileye的EyeQ+Altera的FPGA。这153亿美元,其实是英特尔为自动驾驶买的门票。
  在英特尔投入巨资过后,Mobileye直接绕过了其ADAS的第四代专用芯片EyeQ4,将在明年量产EyeQ5。值得一提的是,Mobileye宣称,EyeQ5的计算能力能够满足L4-L5级的自动驾驶。
  当下,自动驾驶的车辆终端和云端还没有实现实时的高带宽传输,因此车辆终端的计算力显得尤为重要。
  2、英伟达:生态、性能一骑绝尘
  英伟达无疑是人工智能时代计算巨头中最大的受益者。GPGPU(通用计算型GPU)在深度学习领域的统治力无需多言,目前大部分深度学习在训练阶段,都是由英伟达的GPU支持的。
  一方面,这得益于其GPU相对于CPU而言针对深度学习更强的计算能力,另一方面在于,英伟达为其GPU通用计算所做的开发易用性工作开展得是如此之好,大大降低了开发者的上手难度。
  这不,昨天GTC上,老黄又带来了更新过后的深度学习应用平台TensorRT 3,把各种深度学习框架都囊括了进去。
  而在运用其GPU为车辆端的深度学习应用(Inference)提供支持方面,英伟达的做法颇有些“浮点运算能力越高越正义”的意味。
  在自动驾驶时代之前,英伟达很早就通过Tegra 系列处理器进入了众多整车厂的供货商名单,比如和英伟达保持了8年合作关系的奥迪,以及颇受老黄喜欢的特斯拉,不过早年英伟达的Tegra负责的主要还是车载娱乐方面。(最新消息,彭博社报道特斯拉或将其娱乐信息系统芯片供应商换为英特尔)。
  而今年具备L3自动驾驶功能的奥迪新A8,其由采埃孚打造的自动驾驶计算平台zFAS,使用了英伟达的Tegra K1芯片,负责处理车辆的环视影像。然而,zFAS主要负责实现自动驾驶功能的芯片,是Mobileye的EyeQ3和Altera的Cyclone。这一点显然无法让英伟达满意,乃至都不愿意提到这一点,但Tegra K1的单精度浮点运算性能也只有350GFlops,而EyeQ3整合了完整算法支持的一整套ADAS功能,使得K1的性能看上去并没有那么诱人。
  其实,在新奥迪A8亮相之前,英伟达已经连续推出两代性能十分强悍的自动驾驶车载电脑,其中被力推的Drive PX 2最强版本Drive PX Autochauffeur使用了两颗名为Tegra Parker的SoC,内建6核CPU以及基于帕斯卡架构、拥有256个CUDA单元的显示核心。Tegra Parker的上一代Tegra X1单精度浮点运算能力就达到了1Tflops,Parker性能据称达到1.5T,两个Parker SoC加起来性能达到3T。然而英伟达觉得还不够,又在两个SoC之外加入了两张帕斯卡架构的独立显卡。最终的结果是,Drive PX 2 autochauffeur的单精度浮点运算能力达到了8TFlops,是Tegra K1的20倍还多(可怜的K1,人家只是一枚SoC而已)。
  这一计算平台是足以满足L3自动驾驶的运算要求的,如果多个平台叠加使用,Drive PX 2还能满足全自动驾驶的计算要求。然而Drive PX 2高性能的背后是不菲的代价——这一计算平台的功耗高达250W,乃至于产生的巨大热量需要水冷散热;而价格高达1.5万美元。其单位计算量消耗的能量与成本都不菲,对于需要过车规、压成本的量产型自动驾驶功能来说,这些都是坏消息。
  这也是英伟达目前在自动驾驶车载计算芯片(其他对功耗、成本有较高要求的终端也成立)面临的一大困境:
  论训练阶段的大规模高性能计算,由于完整的生态,英伟达暂时谁都不虚;然而在人工智能的终端设备上,英伟达高性能GPU高能耗,以及令人咋舌的价格,让不少正在研发自动驾驶的公司都感到纠结——Drive PX 2性能当然足够强劲,但要量产的自动驾驶功能,显然承受不起10万的加价,和要水冷的板卡。
  当然,英伟达对Drive PX 2骇人的功耗看得很清楚。Drive PX 2之后,英伟达立马推出了新一代基于Volt架构GPU的SoC Xavier,单精度浮点运算性能达到20Tflops,是Drive PX 2 Autochauffeur的2.5倍,而功耗仅仅为30W。Xavier开了挂一般的强悍性能使它可以支持L4-L5的自动驾驶运算需求,同时低功耗和较小的体积又能够适应车辆需求。
  可以说,英伟达靠这颗芯片为其GPU进一步打入自动驾驶的应用推断(Inference)阶段铺平了道路,全球知名的汽车供应商博世和采埃孚,都与英伟达达成了合作,将基于Xavier开发车载电脑。在强大性能与功耗之间双双取得大幅度进展的Xavier,将成为英伟达在自动驾驶芯片市场上的撒手锏。
  不过,Xavier的量产时间为明年初,大规模出货则要等到明年第四季度。
  因此,对于英伟达来说,目前其GPU针对当下性能要求适中(满足L2-L3)的自动驾驶计算芯片,暂时仍缺乏一个足够便宜的整体方案。
  3、高通:寄望5G,恩智浦是未知数
  2014年,高通推出车载芯片骁龙602A,主要面向车内的娱乐影音计算需求。有趣的是,在两年后的宣传中,这款芯片被声称可以通过深度学习算法支持自动驾驶。但搭载了602A的2017款奥迪Q7,并不支持自动驾驶。
  看得出来,整车厂对这样一块单核频率最高1.5G的SoC还是不够信任。
  2016年初,高通又再次发布基于旗舰SoC打造的820A,特意加入了对深度神经网络的硬件加速支持。推出这一车载SoC,高通主要面向的是ADAS市场。
  不过,即使是820A,也是在一年之后才迎来了首个基于它打造的ADAS产品系统原型,由国内创企纵目科技推出。
  由于专注于移动端,高通在高性能计算上的积累不如英特尔与英伟达,其骁龙SoC虽然在单位能耗上相对英特尔与英伟达的计算平台都占据优势,但在峰值性能输出上则被其功耗限制。当前的情况是,自动驾驶公司的很大一部分“安全感”仍然来源于自动驾驶芯片的绝对计算力,骁龙SoC又并非为ADAS专门打造的计算平台,因此想要打开市场,面临的阻力不小。
  对于这个问题,高通去年10月宣布收购了全球最大的汽车半导体厂商恩智浦(当然不仅仅是因为ADAS)。
  恩智浦2016年在全球汽车半导体市场的份额高达14.6%。在被高通宣布收购之前,恩智浦就推出了ADAS专用芯片S32V234,主要用于处理视觉信号,可同时处理两路视频。值得一提的是,考虑到ADAS对安全性的要求,S32V234在设计之初就加入了ECC(错误检查与纠正),FCCU(故障收集与控制单元)等安全机制。
  而后在此基础上,恩智浦发布了BlueBox车载电脑,内部除了搭载S32V234芯片,还加上了应用8核A72的高性能处理器LS2088以及其他传感器芯片,除了支持ADAS,还能够实现多传感器数据的融合。恩智浦当时称,BlueBox能够为L4级别的自动驾驶提供运算支持,而功耗不超过40W。
  作为全球最大的车载半导体厂商,与车厂、供应商有着紧密的联系。某种意义上,高通的这一次对恩智浦的收购与英特尔对Mobileye的收购有着异曲同工之妙——直接买一个行业领头羊来开辟新业务。只是恩智浦470亿美元的价格,比Mobileye高得多。
  但一个坏消息是,高通对恩智浦的收购并不一帆风顺,虽然美国在今年4月爽快地通过了许可,但欧洲人比较谨慎。这个月欧盟的反垄断调查机构再次暂停了对收购案的审查,理由是”双方披露的关键性细节仍然不够多”。交易迟迟未能完成,高通便无法同恩智浦作为一个整体施行其战略。作为对比,今年3月才宣布的英特尔对Mobileye的收购,上个月已经正式完成了。
  好在,高通还有一张王牌可打——V2X车联网。今年9月4日,高通推出新一代V2X通信芯片组9150 C-V2X,符合3GPP标准,同时支持4G与5G网络,能够实现车对车(V2V),车对基础设施(V2I),车对行人(V2P)三种场景的通信。并且该芯片组无需SIM即可实现通信。
  作为实力强大的通信方案商,高通一直在着力推动C-V2X标准的落地。一方面通信产业是其老本行、安身立命之所。另一方面,在车辆终端计算上不太被信任的高通,可以通过这样的方式,扬长避短——如果在自动驾驶车辆计算平台上由于功耗、成本限制遭遇瓶颈或是被竞争对手阻击,那么通过5G的高速传输特性,将数据送至云端处理再快速下发,通过发达的车联网来实现自动驾驶。如果这一逻辑成立,那么高通将在云计算领域投入更多以提供云端的计算支持。
  但对高通来说,当务之急仍是对恩智浦的收购需要快些完成。
  三、其他玩家:不容小觑的潜藏力量
  在自动驾驶的计算芯片战场上,英伟达通过GPU生态的先发优势建立起了壁垒。而攻擂者英特尔与高通,则通过大手笔的收购,希望快速切入自动驾驶芯片市场。但这三个公司虽然是这个市场中实力最强的天王,但有许多地头蛇,虽然关注度不及三大公司,但其实力也不容小觑。
  比如英飞凌。英飞凌作为老牌的半导体厂商,一直也和汽车行业保持着紧密的联系,为它们提供着车载娱乐信息芯片。在2015年,英飞凌也针对ADAS市场,给出了自己的芯片组Real 3 3D,可实现司机疲劳检测等功能。而在奥迪新A8使用的zFAS自动驾驶计算单元中,也使用了英飞凌提供的Aurix芯片,A8最关键的Traffic Jam Pilot,是由这块芯片最终实现的。
  另外说到自动驾驶,必然要给谷歌留一个席位。尽管谷歌从来没有对外透露过自家用的是何种芯片,但日前英特尔CEO科再奇的一封信却声明,英特尔在9年前开始与谷歌的自动驾驶项目合作,为其专门打造了计算芯片。
  更详细的信息随后被披露。谷歌的方案使用了英特尔提供的至强处理器,以及Altera提供的Arria FPGA芯片,和英特尔家的XMM通信芯片,这与英特尔提供给其平台之上合作伙伴的组件类似。但有意思的是,对于谷歌是否加入了英特尔搭建的联盟,英特尔方面却没有回应。
  另外,负责推断的部分是由谁负责,究竟是英特尔的芯片,还是英伟达的GPU,或是谷歌自家的TPU,都不明朗。需要说明的是,谷歌的TPU,就是一种专用于推断阶段的ASIC。当然,在其第二代Cloud TPU上,谷歌也为其增添了深度学习训练的能力。
  而国内的自动驾驶初创公司地平线机器人,则透露近期会推出其首款处理器“盘古”。虽然”盘古“头上更多的名号是AI芯片,但从公开的消息来看,盘古的核心能力是基于深度学习对大规模的图像进行处理。
  而在今年一月,地平线与英特尔合作,在后者的Altera FPGA芯片之上集成了自家的深度神经网络IP,做出了一套ADAS系统。以地平线本身对自动驾驶业务的看重,“盘古”显然是要重点应用在自动驾驶之上的。
  但国内并非只有创业公司在准备着自家的自动驾驶芯片。今年7月,四维图新宣布首款ADAS芯片量产。一家图商怎么就做起了ADAS芯片?
  四维图新这家公司是由软到硬都切入自动驾驶,一方面在提供高精地图服务,另一方面四维图新去年5月收购了联发科旗下的汽车半导体公司杰发科技。今年3月杰发科技正式过户到四维图新名下时,传出第二季度将推出ADAS芯片的消息。如果读者留心,会发现四维图新去年在对外宣传中爱用的一个说法是“ADAS高精地图”。
  至于这块ADAS芯片会给谁用?最近两个月,四维图新密集地与蔚来、威马、爱驰亿维等新造车公司达成了合作,领域包含车联网、自动驾驶等。对新造车公司来说,四维图新提供ADAS芯片和高精地图“硬件+服务”的支持,岂不美哉?
  在主流手机市场已经趋于饱和的当下,各个公司正在试图结束以手机为核心的移动互联网时代这个说法。巨头们、初创们抢夺的下一代终端,正是汽车,并且是自动驾驶的汽车。
  在零件多达两万个的汽车中,正在掀起新一轮的电子革命,而这些公司,都想成为零部件中,发号施令那一个。
  这其中有昔日PC时代的王者,也有移动互联网时代的龙头;既有一路见证半导体变迁的老牌公司,也有乘着人工智能之风起舞的初创。齐齐分食自动驾驶万亿大蛋糕。
Baidu
map