全自动驾驶何时才能实现?

图片来源:elijah nouvelage/Reuters

现在,我们应该轻松惬意地坐在自动驾驶车辆的驾驶员位置上,刷剧也行,甚至还能打个盹儿,这个过程中,车辆会安全地将我们送到目的地。

这是几年前一些汽车行业高管和技术专家预测的画面。然而,在耗费了数以十亿美元计的研发资金后,自动驾驶技术仍远未达到可以取代人类驾驶员的地步。

于是,一些车企和科技初创企业收缩了雄心壮志,或是推迟了研发时间表。去年10月,福特汽车(Ford Motor Co.)和大众汽车(Volkswagen AG)关闭了它们共同投资的无人驾驶汽车公司Argo AI,福特首席执行官吉姆·法利(Jim Farley)在一场季报电话会议上向分析师表示,开发自动驾驶汽车,“我们还有很长的路要走。”

与此同时,监管机构也在介入。去年12月,负责安全事务的美国联邦机构表示,它们正对通用汽车(General Motors Co.)子公司Cruise进行调查,此前有报道称,其无人驾驶出租车造成了几起追尾事故。此外,还有多起事故牵涉到特斯拉(Tesla Inc.)的驾驶辅助技术。

国际汽车工程师协会(SAE International,前身为Society of Automotive Engineers)将自动驾驶技术分为五个等级。第一级汽车拥有车道居中行驶技术或自适应巡航控制技术,后者能让车辆与前车保持一定车距。第二级汽车兼具这两种技术。这两个级别的车辆——如今市面上已很常见——掌控汽车的依然是人类驾驶员。

第三级和第四级车辆可以在有限的条件下实现自动驾驶,例如在某些类型的道路上以及在某些气候条件下。第五级车辆则能像娴熟的人类驾驶员一样,但凡后者可以应对的路况和气象条件,均能实现自动驾驶。

《华尔街日报》(The Wall Street Journal)邀请了三位专家来讨论自动驾驶汽车的未来,他们分别是:加州大学伯克利分校(University of California, Berkeley)电子工程与计算机科学教授亚历山大·M·拜恩(Alexandre M. Bayen)、卡内基梅隆大学(Carnegie Mellon University)电子与计算机工程系教授拉吉·拉吉库马(Raj Rajkumar)以及咨询公司埃森哲(Accenture)高级董事总经理、同时参与埃森哲移动业务的尤尔根·里尔斯(Juergen Reers)。

以下是线上访谈的节选,文字经过编辑。

媲美人类水平的人工智能

《华尔街日报》(以下简称WSJ):汽车会有一天实现五级自动驾驶技术吗,那会儿是不是甚至没有方向盘和脚踏板了?如果可以,那一天要等到何时?

里尔斯:这需要与人类能力相当的人工智能(AI),对于如何实现这一点,目前还没有一种被普遍接受的理论。只要还没有人类水平的AI,自动驾驶就受到限制。

亚历山大·M·拜恩教授

图片来源:WSJ绘制

拜恩:一旦描绘出“在特定时间实现全自动驾驶”的前景,往往就会引发不切实际的期望,事实上,自动驾驶技术的发展本质上就是渐进性的。目前还不清楚最终是否会诞生一种不受路况和气候条件限制的全自动驾驶技术。市场将会给出答案。

拉吉库马:实际上,这也许永远都不可能——或者至少要等到很多年或是数十年之后。不管是现有技术,还是在可预见的将来能够实现的技术,都无法满足它。不过,更多虽然受限但十分有用的解决方案将尽早得到应用。

WSJ:我们来谈谈第五级以下的自动驾驶汽车需要的技术吧。首先,说到那些能够取代人眼的系统,例如雷达、摄像头、全球定位系统(GPS)和激光探测和测距系统(LiDAR,亦称作激光雷达)——就是那种以激光为基础,能够创建车辆、建筑物、行人以及车辆周围道路的3D图像的系统,这些方面有什么需要改进的吗?

里尔斯:总体来说,技术水平已经相当先进了,但一个关键的挑战是成本。高级别的自动驾驶需要较高的冗余性。若是将摄像头、雷达、激光雷达系统与高清地图以及高算力结合起来,对个人使用来说,这种四级自动驾驶汽车的成本就太高了。所以我们预计这类车将用作摆渡车,一次搭载多名乘客,理想状态下一周七天、每天24小时不间断运行,以此来吸收成本。

拉吉库马:有两个明显的问题。第一,出于经济考虑,一些企业只想依赖摄像头——由于智能手机中的摄像头已是无处不在,并且体型小巧、价格低廉,因此最终出来的系统,价格会很亲民。但遗憾的是,未来很长一段时间内,如今这种仅仅使用摄像头的视觉技术都无法匹敌人眼的认知能力外加人类的神经处理能力。

第二,激光雷达是一种关键部件,虽然它的成本在下跌,但仍然偏高。而雷达、超声波和GPS已完全在可接受的成本范围内。

WSJ:人工智能呢?批评人士说,和人类驾驶员不同,AI无法推理、缺乏直觉,而且过于依赖提前编入数据里的行车状况,无法应对不熟悉的情况。

埃森哲高级董事总经理尤尔根·里尔斯

图片来源:WSJ绘制

里尔斯:AI是实现自动驾驶功能的一个关键前提条件。但它无法覆盖所有“极端情境”(如车前跑过一条狗,或是建筑工地上出现变道等低概率事件),因为它既不会推理,也缺乏直觉。AI中的神经网络会通过所谓“模型盲曲线拟合”(model blind curve fitting)将误差范围降到最低。而要做到这一点,它需要数百万例子。AI无法像人类那样仅凭小规模数据就能学有所获。

拉吉库马:鉴于AI领域最近取得的重大进展,自动驾驶难题已完全被视为AI问题。它们并不相干!人类建造了庞大的客运航空业、铁路网络、核电站和宇宙飞船,所有这些都实现了不同程度的自动化。它们并没有使用AI,靠的是以科学为基础的工程学巧思。今天的AI并不是制造自动驾驶汽车所需要的,它只是自动驾驶汽车工具箱中的众多工具之一。

应对“极端情境”

WSJ:AI系统如何改进才能应对程序里没有、但又可能引发危险驾驶状况的“极端情境”?

拉吉·拉吉库马教授

图片来源:WSJ绘制

拉吉库马:当摄像头看到这样的场景时,相应的神经网络也许能或者不能正确识别,尤其是如果AI接受训练的数据集中没有包含这种障碍物的话,更是如此。换做雷达或是激光雷达,它们可以探测到障碍物,但或许无法判断障碍物的类型。尽管如此,车辆还是会意识到有某种障碍物存在——不管是小孩、狗、奶牛、猫、袋鼠,或是穿着滑稽服装的行人——因此它会减速或是停下。传感器的冗余性是关键。依靠AI来应对无数已知和未知的场景与障碍物,是行不通的。

拜恩:如果我们有足够的经验和数据可以训练神经网络识别狗和猫,但对于羊或奶牛却没有足够的经验和数据,那该怎么办?我们会让车在法国乡村行使吗?

AI行业正在努力解决这些问题。“迁移学习”(transfer learning)这个领域的重点便是学习一组特定场景,然后将其应用到以前未知的场景中。因此,奶牛和羊兴许也可以被识别出来。

WSJ:人类驾驶员还有一些能力也是AI不具备的,例如当碰到行人正从马路沿走下,或是在十字路口碰到旁边开来一辆车时,他们可以看懂行人和驾驶员的肢体语言或面部表情。技术将来能做到吗?

拉吉库马:人们还在继续研发能够判断人类意图、解读人类表情及具有其他功能的技术。但这些技术并非万无一失。鉴于技术有时会得出错误结论,因此在可预见的将来,自动驾驶汽车很有可能是保守且谨慎的。

拜恩:算法可以检测到猫、狗、羊以及奶牛在移动;机器视觉中的标准工具可以做到这一点。但这些动物的意图是什么?从很多方面来说,对人类行为的建模和预测,比这要更复杂。

混合自动驾驶领域(过程中伴随人机交互)仍处于起步阶段,因此,全自动驾驶汽车与一个未知人类的交互能力依然是机器学习尚未完全解决的一个问题。

里尔斯:自动驾驶汽车在识别及应对更复杂的模式方面将继续进步,这个观点我认同。眼下,在匹配数据集里的复杂模式方面,神经网络的出色表现已经令人赞叹。但它们只是在依靠关联性。而关联性有时不一定站得住脚。不应该指望自动驾驶汽车能模仿人脑。

去年10月,福特和大众关闭了它们共同投资的无人驾驶汽车公司Argo AI。

图片来源:Justin Merriman/Bloomberg News

WSJ:自动驾驶技术能应对雾天、大雪这样的天气状况吗?这种情形下,道路标识会看不清,车辆上的摄像头镜头和传感器也会受影响。

拜恩:传感和驱动会有所改进,收集的数据会越来越多,车辆能够学习和接受的天气状况也会增加。航空业有一个很好的类比。从历史上看,航空工程学让人类建造的飞机越来越牢固。渐渐地,飞机能够在愈加危险的气流颠簸中飞行。尽管如此,视传感数据和具体情况,还是有一套“安全操作”。待在这个操作范围内对于保证安全很重要。

拉吉库马:传感器生产商和汽车厂商一直在寻找各种方法来保持传感器的清洁。例如,将它们置于车内、装在车辆外部的遮盖物里、安装加热元件来除冰及除雪、使用雨刮器,等等。

更重要的问题在于,传感器能否在不同的气象和光线条件下检测到路上的物体。正因为此,早期的无人驾驶出租车才会投放到极少出现雨雪的地区。这种情况再次表明了冗余传感系统的必要性。摄像头的镜头或许会有污渍,但雷达依然能在恶劣的天气状况下看清路面,而即便碰上中雨和中雪,激光雷达也可以很好地工作。

里尔斯:我也认为传感器会有很大的改进。但在严峻的条件下,它依然面临限制。我们需要平衡汽车技术的改进与智慧城市背景下基础设施的升级,比如让传感器成为交通信号、道路标识等的补充。

基础设施因素

WSJ:对自动驾驶汽车来说,它与红绿灯等基础设施以及与其他车辆之间的沟通有多重要?

拜恩:只要监测重要安全事件的任务仅由车辆来承担,它们就需要更高程度的审查与认证。如果一部分监测功能可以通过整合基础设施来实现,那么更高程度的车辆自动化应用起来的速度会更快。

拉吉库马:有了蜂窝车联网(Cellular vehicle-to-everything,简称CV2X)技术,车辆就能与配有适当装备的其他车辆、交通信号、道路标识、行人及云端设备等实现通信。

这项投资的回报在于,在没有AI的情况下,车辆可以准确知晓数百米外红绿灯的准确状态——这是计算机视觉范围的五至十倍以上!它还可以接收有关道路封闭、车祸以及交通拥堵的信息。

里尔斯:CV2X潜力巨大。但目前,不同汽车厂商和地区所使用的系统仍有差异,这对互通性构成了阻碍。因而,建立统一标准是成功的关键因素之一。此外,CV2X还要求对基础设施进行投资。

WSJ:今天的汽车也会发生事故,但它并没有被禁,如此看来,我们对自动驾驶汽车安全性的期望是不是过于严格了?

拉吉库马:对于人类引发车祸这件事,我们已经习以为常,但由于自动驾驶汽车是一种新鲜事物,因此哪怕是一次事故,或是一次死亡事件,都会受到媒体和公众的极大关注。迄今为止,自动驾驶汽车造成的死亡人数可能有30人左右,而单是美国,每年就有约四万人死于公路交通事故,相比之下,前一个数字已经很小了。对计算机的完美表现有了期待后,如何让自动驾驶技术变得更安全,这种压力就落在了开发人员和研究者的肩上。

里尔斯:要想建立和保持信任,需要有严格的监管,力度甚至要超过传统汽车。当然监管不应束缚创新,这一点毋庸置疑,但我认为,监管问题目前来说不是一个主要挑战。

(本文作者Bart Ziegler是前《华尔街日报》编辑,他的联系方式为reports@wsj.com。)