展会信息港展会大全

特斯拉又要融资!马斯克用自动驾驶画5000亿市值“大饼”
来源:互联网   发布日期:2019-05-05 17:34:27   浏览:15281次  

导读:特斯拉宣布了新的融资计划:增发至少 20 亿美元的股票和可转换债券组合。这一混合融资计划将是特斯拉现金枯竭的资产负债表新的资金源头。特斯拉向美国证监会提交的文件显示,公司已将新股的公开发行量从 270 万股增至 310 万股,每股发行价格 243 美元。 此...

特斯拉宣布了新的融资计划:增发至少 20 亿美元的股票和可转换债券组合。这一混合融资计划将是特斯拉现金枯竭的资产负债表新的资金源头。特斯拉向美国证监会提交的文件显示,公司已将新股的公开发行量从 270 万股增至 310 万股,每股发行价格 243 美元。

此次融资计划之前,特斯拉正在经历一段艰难的时期,尤其是其面向大众市场的 Model 3 轿车的生产规模上,公司同时向欧洲和中国的客户交付汽车也遭遇物流问题。另外,马斯克过去一直强调特斯拉已经不需要融资了,但今年第一季净亏损超 7 亿美元的财报显然又让他改口了。

融资计划宣布之后,特斯拉管理层与高盛、花旗等机构举行了投资者电话会议。在这个电话会议中,自动驾驶成为马斯克稳住投资者的最大王牌。

据彭博社援引两名知情人士透露,马斯克在投资者电话会议中称,自动驾驶对特斯拉来说是“革命性的”,是根本驱动力,也是特斯拉成为一家“市值 5000 亿美元的公司”的关键。在电话会议中,马斯克再次承诺了他此前关于特斯拉自动驾驶技术的时间表:最快明年年中,路上将会有 100 万辆拥有全自动驾驶能力的特斯拉电动车,而且到那时,车主可以通过 Robotaxi 贡献自己车辆进行盈利,每年可获利三万美元。

然而,马斯克对特斯拉自动驾驶如此自信,特斯拉所谓功能完整的自动驾驶汽车能在多大程度上解放驾驶者?自动驾驶技术真的已经到了临界的突破点吗?特斯拉的自动驾驶技术和时间表真的能够支撑马斯克5000 亿市值“大饼”吗?

这些问题都值得深入探讨,予以厘清。

(来源:特斯拉)

在软件工程领域有一个被称为“90-90 法则”的幽默格言,据传第一个讲这个笑话的人是贝尔实验室的 Tom Cargill。它是这样说的:“(开发软件时)前 90% 的代码要花费 90% 的开发时间,剩余的 10% 的代码要再耗上另 90% 的开发时间。”

接下来,我们要基于这个角度来解读一下特斯拉自动驾驶技术的集中体现自动驾驶芯片这件事情。

在 4 月 22 日特斯拉举办的自动驾驶活动日中,他向世人展示了该公司在完全自动驾驶技术领域最新取得的令人瞩目的进展。特斯拉还展示了一款新的神经网络计算芯片 FSD,似乎已经可以与这一领域的领导者英伟达(Nvidia)竞争。

特斯拉也向人们解释了 FSD 如何利用自己庞大的客户及其车辆来收集数据,从而可以被用来帮助训练其神经网络。

马斯克这次想要向人们传达的一个重要信息是,特斯拉距离拿下完全自动驾驶汽车的“圣杯”已经近在咫尺。马斯克说道,按照计划到今年年底,特斯拉的自动驾驶汽车将能够达到,在没有任何人为操作干涉的情况下,在地面街道或者高速公路上的任何两点之间自动驾驶。

在达成这一目标之后,按照马斯克的术语,自动驾驶汽车就已经到达“功能完整(feature complete)”了,但在这一阶段,自动驾驶汽车仍然不时需要人类驾驶员来监控车辆并在发生突发状况时进行人为干预。不过按照马斯克的推测,之后只需要六个月的时间,自动驾驶软件就能够拥有足够的可靠性,不需要人为监督干涉就可以完全自动驾驶。按照马斯克的期待,到 2020 年底,特斯拉将拥有数千辆特斯拉自动驾驶汽车,来为使用类似于优步等出租车服务的乘客提供无人驾驶出租车服务。

马斯克的理解也许是,一旦特斯拉的自动驾驶汽车在今年下半年达到了所谓的“功能完整(feature complete)”,它们就已经完成了自动驾驶开发的前 90%的工作了。但是在这里,最大的问题是,真的已经完成了 90% 了吗?或者按照 Tom Cargill 的 90-90 法则来看,剩下的工作真的只需要 10% 的开发时间吗?

自动驾驶研发难在第二阶段

图丨 Waymo 公司的工程师使用上图所示的的复杂的图表来显示道路情况(来源:Waymo)

我们可以将把自动驾驶汽车的开发分为两个阶段来进行。在第一阶段,开发的重点是建立自动驾驶汽车对世界的静态理解。比如说,现在汽车正在行驶的这条路在哪里?周围的其他车又在哪里?附近是否有行人或自行车?现在所在的特定区域有什么交通法规?

当汽车软件能够完成自动驾驶第一阶段的任务之后,理论上讲,自动驾驶汽车就应该能够在空旷道路上的任意两点之间完美驾驶了,甚至即使在拥挤的道路上,它也应该能够做到避免碰到任何其他事物。这也就是被马斯克称为「功能完整」的自动驾驶程度。Waymo 公司在 2015 年左右实现了这种自动驾驶水平,而特斯拉的目标是在今年晚些时候也达到这一目标。

但是,如果你想让自己的汽车达到可以为人们提供无人驾驶出租车服务的水平,你还需要深入第二阶段的开发,这一阶段的重点是如何处理与周围其他事物之间各种复杂的交互场景,包括与其他驾驶员、行人和其他道路使用者的各种复杂交互。

如果解决不了第二阶段的问题,自动驾驶汽车就会经常因无法做出决策而“冻结”在原地。它将很难完成在较为拥挤的情况下上高速,在环形交叉路口导航以及在无保护的情况下打左转等各种任务。而且你有可能会发现,在有很多行人过马路的地方,这辆自动驾驶汽车会因为担心有人会突然跳到车前而不知所措,或者在建筑工地或繁忙的停车场附近时,它也会不知道该做何反应。

这些仅仅解决第一阶段却未解决第二阶段任务的自动驾驶汽车,当然最终也很可能会将你带到目的地,但其乘坐过程很可能是一个缓慢且不稳定的过程,以至于用过一次之后,就没有人想再用它。这样的汽车很有可能因为其笨拙的驾驶风格而令道路上的其他人抓狂,甚至可能导致整个公众都会反对使用自动驾驶技术。

除此之外,在第二阶段的开发中,开发人员还需要处理各种越来越不寻常的“罕见状况”,比如在单行道上遇到逆行的汽车怎么办;比如一辆卡车在结冰的路面上突然失控而且开始向后打滑驶向后面的车队怎么办;又或者是突然遇到了森林大火、洪水或龙卷风而使道路无法通行,该如何应对。这一阶段要处理的有些情况可能如此罕见,以至于公司可能测试其软件许多年,也无法真正囊括所有这些在现实中可能碰到的情况。

在过去三年里,Waymo 公司一直都处于自动驾驶开发的第二阶段。而相比之下,马斯克似乎认为第二阶段的开发就显得有点微不足道了。马斯克似乎相信,只要特斯拉的汽车能够识别道路上的车道标记和其他物体,它就已经做好准备迎接完全无人驾驶阶段的到来了。

特斯拉新型自动驾驶芯片,优势能维持多久?

图丨一辆特斯拉无人驾驶开发阶段的样车,使用的是英伟达公司的 Drive PX 2 AI 人工智能技术(来源:英伟达)

在过去十年中,通过更深层的网络、更多的数据和更多计算能力的组合,研究人员对神经网络的性能已经做出了不断改进,在深度学习领域实际上已经进行了革命性的进展。在早期的深度学习实验中,主要是通过并行使用消费级的 GPU 来进行的。而在最近,谷歌和英伟达等公司已经开始专门为深度学习工作负载而设计定制的芯片。

自从 2016 年以来,特斯拉自动驾驶汽车的先进驾驶辅助系统(Autopilot)一直是由英伟达公司的 Drive PX 平台来支持的。但在去年,特斯拉已经弃用英伟达的平台,转而采用自己的定制芯片 FSD。

在发布会上,马斯克邀请了自己在 2016 年从苹果公司聘请的芯片设计师 Pete Bannon 来解释他的工作。Bannon 在活动中表示,开发这款新的系统主要目的就是直接代替之前的整个基于英伟达平台的系统。

Bannon 说到,“这是两台互相独立的计算机,它们独自启动并运行自己的操作系统。每台计算机都有独立的电源,即使其中一台计算机崩溃,汽车也还将能够继续正常驾驶。”

Bannon 说,每个自动驾驶芯片都拥有 60 亿个晶体管,该系统被设计用于以大规模的并行方式来执行神经网络中所使用的各种操作。每个芯片都有两个计算引擎,可以在每个时钟周期执行 9,216 次乘加运算乘加运算也是神经网络计算的核心运算。每个 FSD 系统将拥有两个这样的芯片,FSD 系统的总计算能力为每秒 144 万亿次运算。

特斯拉说,这款新的芯片比该公司之前使用的英伟达芯片优化了 21 倍。当然,比起 2016 年供特斯拉用的那款芯片,英伟达也早已开发生产出更新的芯片;但特斯拉仍表示,即使与英伟达公司目前最新的运算速度为 21 TOPS(即每秒 21 万亿次运算)的 Drive Xavier 芯片相比,特斯拉的这款 FSD 芯片也更强大,FSD 芯片的运算速度为 144 TOPS。

但是英伟达认为,上面的比较方法并不公平。该公司表示,首先自己的 Xavier 芯片可提供 30 TOPS 的运算速度,而不是 21 TOPS。更重要的是,英伟达称它们通常会将 Xavier 封装在拥有强大 GPU 芯片的芯片上,从而使其拥有 160 TOPS 的计算能力。而且,和特斯拉的做法一样,英伟达也将这些系统成对封装,以增强其冗余可靠性。因此他们的 Xavier 芯片的整个系统最终拥有 320 TOPS 计算能力。

当然最终真正重要的,并不是系统的理论操作速度,而是整个系统面对实际工作负载时的实际运算执行情况。特斯拉称,自己的芯片专门为高性能和低功耗而设计,因此十分适用于自动驾驶应用,在自动驾驶领域可以提供比英伟达用途更广泛、性能更好的芯片。

不过无论如何,两家公司都在研究下一代芯片和系统设计,这样看来,目前两家公司所拥有的任何优势都可能转瞬即逝。

马斯克信赖“数据护城河”

神经网络的一个最经典的,也是与自动驾驶汽车关联很大的一个应用,应该就是图像识别了。自动驾驶软件需要辨别附近的物体是汽车、自行车、行人、路灯柱子,还是一袋垃圾。这些信息可以帮助软件来判定某一个对象在未来可能会如何移动,以及可能遇到的问题的严重程度。

神经网络非常适合来处理这种图像分类问题。为了训练神经网络,程序员们通常会建立一个大型的图像数据库,并对数据库中所包含的对象进行类型标记。然后,系统会使用称为反向推测的技术来“训练”网络,从而达到可以正确地对各种图像进行分类。

在过去十年中,研究人员发现,随着投入的数据越来越多,计算能力越来越高,深度神经网络也变得越来越准确。但至关重要的一个问题是,只有这些增加的数据可以真正代表现实世界的完全复杂性时,才能为深度学习的训练真正增加价值。神经网络的学习非常直观,如果它在学习时所看到的训练数据一直都只是某种类型的数据,那么它也只能学习识别这种特定类型的对象。

特斯拉的人工智能领域的大师 Andrej Karpathy 在 4 月 22 日的演讲中给出了一个很好的例子。Karpathy 说,当特斯拉的汽车在实际驾驶中遇到异常情况,特斯拉公司可以调回当时的异常情况的数据并进行分析。比如说,如果公司担心自己的软件在识别固定在车辆上的自行车方面做得还不够好,它可以要求特斯拉的车辆在驾驶时尤其注意附近的自行车和汽车的图像。然后特斯拉可以雇用人员来专门检查这些图像,并验证它们是否包含挂在车辆尾部的自行车,再将这些图像添加到特斯拉的图像训练数据集中,从而帮助软件今后的版本可以更好地理解自行车和车辆组合在一起的各种情况。

在自动驾驶开发的最后阶段,“长尾”将十分消耗时间(长尾在本文中指那些出现频率低、但危险性可能很高的情况)

特斯拉所提出的策略,也许非常适合让特斯拉完成前述的自动驾驶开发的第一阶段:只要道路不是那么拥挤,整个过程中没有什么突发的、奇怪的事情发生,它将使自动驾驶汽车能够实现在任何两点之间行驶的程度。

之后,特斯拉将进入开发的第二阶段:处理复杂的与人类之间的互动情况,以及之后的一长串的罕见但却存在有很大的潜在危险的各种情况。

特斯拉在活动中对此问题的基本论点是,它们将能够从特斯拉的车队中获取数据,这些数据将使特斯拉在解决第二阶段的各种问题方面具有很大的优势。

Karpathy 说,“解决这些问题需要先从所有实际收集到的数据中识别出这些情况,然后进行软件迭代,最后才能够真正为神经网络提供正确的处理解决这类问题的数据,而上面所说的整个过程的速度,与能够从实际驾驶过程中收集到的数据中包含这些情况的频率成正比”。

但是,虽然特斯拉可能有能力获得大量的数据,但并没有足够的带宽来将特斯拉汽车的每一分钟驾驶的记录数据反馈给公司总部。相反,只有在特斯拉的工程师告诉汽车需要注意哪些类型的情况,并且之后当汽车真正遇到与其中一种类型匹配的情况时,汽车才会将现场的短视频剪辑反馈给特斯拉总部。

这也就意味着只有工程师有足够的先见之明,发送了从汽车那里请求这种类型数据的指令时,特斯拉总部才会收集到这类极少数情况下的数据。如果某些情况十分罕见奇怪,以至于工程师们从来都没有考虑过会发生这类情况,那么这类情况的数据即使特斯拉汽车曾经遇到过,其现场数据也可能永远都不会进入到特斯拉的自动驾驶训练数据集中。

幸运的是,特斯拉有一些其他技术来标记自己的软件不能很好理解的情况。当人类驾驶员在发现自动驾驶仪(Autopilot)做错了什么的时候,软件会记录下来这种情况。此外,即使当人类驾驶员在操作且自动驾驶仪处于非活动状态时,特斯拉汽车仍然会在“阴影模式”下启动运行其自动驾驶软件,来计算假如自动驾驶仪处于活动状态时会采取哪种措施。

这种做法有一个问题就是,他们所处理的通常是一个非常嘈杂的信号。人类驾驶员每天都要停用数十万次自动驾驶仪,对于需要从这些数据中搜集一场情况的人类来说,这些数据实在是太多太细微了。而且软件越好,这种方法的使用就越像是在大海捞针。

当然,这并不是说特斯拉的这种方法不起作用。雇佣人员来从特斯拉车队收集的数十亿英里的数据中寻找异常情况,当然比 Waymo 雇用人类驾驶员来驾驶数百万英里的方法更省人力成本。但正如 Karpathy 所说的那样,“在接近 100% 之前的 99.99……% 中的最后几个 9 的工作,将是非常困难棘手的。”无论公司有多么多的原始数据,这一过程都将非常耗费时间。

了解人类的行为,真的很难

图丨 Delphi 的驾驶界面,其中描绘了自动驾驶汽车的视图。图中蓝线是地图信息,点是 LiDAR 标记的点,途中的 X 点是雷达发现标记的点。当没有行人进入时,人行横道变成绿色(来源:Arstenica)

自动驾驶汽车不仅需要建立对世界在这一秒的静态理解,它还需要建立对世界的动态理解,即世界在未来几秒内会如何变化,尤其是,自动驾驶软件需要了解人类的行为方式。

特斯拉的这次活动中所关注到的最具远见的问题之一就是上述这个关键话题。而特斯拉也给出了自己对这一问题的解答。

在发布会上,有人提问:“特斯拉的这款自动驾驶系统确实在理解路标、物体的位置以及汽车的驱动方式已经做的很好;但是对于各种非科学的情况下呢,比如说停车时,在环形交叉路口谁先谁后,以及道路上还有类似于马车等非人类驾驶的交通方式存在的情况下,自动驾驶系统如何处理?”

马斯克的回答是,“我们的芯片实际上已经做的确实很不错,它会使用类似于插件的工具,将可以很好地处理这类问题。”

而 Karpathy 则提出了一个更具体的回答:“我们现在正在使用大量的机器学习来训练自动驾驶系统的预测能力,首先给自动驾驶创建一个世界的形象表示,在这个形象表示之上又会有一个明确的计划器和一个控制器,这里还有各种用于预测的如何进行遍历和谈判的各种启发式方法等。确实,我们必须解决最后的“罕见情况”,而且自动驾驶的长尾会有特别多的情况,在对视觉环境的处理上会有“罕见情况”,在对于各种情况的反应或者与其他道路使用者的谈判方面也会有“罕见情况”需要解决。但是我们有很大自信是,这些“长尾“问题,最终肯定是靠一种车队机器学习组建来解决的。因为我认为,如果靠人工编写各种程序或者规则来解决这类问题,将很快遇到瓶颈。”

活动中的这些谈话已经从几个方面向我们透露了一些信息。

首先,很明显 Karpathy 比马斯克更深入地思考了这个问题。这一问题的切入点虽然是自动驾驶需要能够预测另一个驾驶员行为的各种情况,但实际上这是在路上最简单常见的人与人之间的互动。马斯克回答的特斯拉汽车在这一方面做的“相当不错”,并不能说明特斯拉采用的方法是可行的。

相比之下,Karpathy 似乎更深地认识到这其中的复杂性。他说道,“最终肯定是靠一种车队机器学习组件(a fleet-learning component)来解决的”,这表明特斯拉在为针对这类问题所需开发的组件方面尚未取得很大的进展。相反,他承认 Autopilot 的计划模块使用了“大量启发式”方法来处理所遇到的与其他道路使用者之间的交互。

马斯克说:“从本质上讲,现在人工智能和神经网络主要被用于物体的识别,我们基本上仍然将它用作处理静止帧上的物体,并也将对象识别为静止帧,然后再将其绑定在之后的感知/路径规划层中。”

从马斯克的这些答案来看,要想实现马斯克制定的实现自动驾驶的激进的开发计划,可能时间有点紧张了。支持特斯拉可以比其竞争对手实现更快的开发速度的论点,是特斯拉可以使用神经网络训练从特斯拉车队收集到的大量数据。

但是,即使 Karpathy 和马斯克自己也承认,特斯拉才开始尝试使用神经网络来处理更复杂的感知和路径规划方面的问题。很难令人相信,特斯拉能够在仅仅 15 个月的时间内,就可以完成使用神经网络完全重写其感知和路径规划软件,然后对这一软件进行各种严格测试的所有的工作。

即使 Waymo 公司已经拥有在机器学习领域的众多优势,这一问题还是困扰了它们三年或更长时间。那么,特斯拉要在未来几年内就达到与 Waymo 不相上下的水平,这个说法有说服力吗?

弃用激光雷达和高清地图是愚蠢的?

图丨由 Ouster 的相机和激光雷达系统拍摄的三层图像示例。顶部图像显示环境光,中间图像显示反射激光,底部图像显示的是周围物体的深度的数据。下面的图片是传统激光雷达“点云”格式的三维渲染(来源:Ouster)

这次活动的另一个主题是,马斯克认为激光雷达和高清晰度地图在自动驾驶方面是不适用的。他认为,依赖这些系统的自动驾驶系统将会是“不堪一击”并且容易出现故障的。特斯拉的竞争对手最终也将不得不放弃使用这些系统。

马斯克的说法可能是正确的,但我们不知道的是,开发这样的系统是需要两年、十年还是三十年的时间来实现这一目标。

确实,如果软件过度依赖于激光雷达或高清地图,其效果可能会适得其反。例如,自动驾驶汽车可能会盲目地沿着高清地图上布置的路径行驶,而不检查周围的情况,以确认真实场景是否比地图创建时发生了变化。

但是,如果可以聪明地使用它们,激光雷达和高清地图仍将可以带来很多其他价值。特斯拉的粉丝总喜欢说,只要你有足够好的视觉算法,激光雷达是完全不需要的,但自动驾驶软件其实也只是通过内在概率来做出判断。

例如,软件可能会计算出一个对象有 97%的可能性是一个灯柱,另一个十分难以辨别的对象有 83%的可能性只是一个传感器的伪影(伪影:指由于传感器的物理原理或算法而导致的拍摄或扫描影像中出现了实际不存在的各种形态的影像)。

而如果汽车可以借助高清地图帮助,它将可以在地图上检查该位置是否应该确实是一个灯柱。如果是这样,那么汽车将可以更有信心地前进。如果高清地图上没有显示这里有灯柱,那么汽车就需要考虑其他的可能的解释。

相似地,激光雷达也可以帮助自动驾驶系统确认在明显的传感器伪影方向上是否确实存在实际物体,进而帮助汽车判断是否可以安全地忽略它。

汽车感知世界的方式越多,某个传感器的误导性数据最终导致自动驾驶系统的错误性操作的可能性就越校激光雷达和高清地图都为无人车提供这类数据,它们可以帮助自动驾驶软件确认或取消来自其他传感器的数据。

但更值得注意的是,马斯克对激光雷达的批评点,主要关注于对车辆周围构建静态物体模型的相对简单的任务上。

在演讲中,Karpathy 专门花时间解释了特斯拉使用相机来检测车道线,以及确定相机框架中的物体距离的策略。也许特斯拉已经在不使用激光雷达和相机的情况下,快速取得了解决这些问题的进展。

但实际上,Waymo 已经在过去的许多年或多或少解决了这些问题,也许 Waymo 严重依赖激光雷达和高清地图的方案,可能并不是解决此问题最具成本效益或技术优雅的方案。但这一系统一直运作良好。对于一家也仍在努力解决同样问题的公司来说,特斯拉将 Waymo 的解决方案视为不可行,实在有点难以理解。

赞助本站

人工智能实验室
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港