编译 | 言征
出品 | 技术栈(微信号:blog51cto)
ChatGPT在互联网上引起轰动后不久,2022年12月,特斯拉的帕洛阿尔托总部也在进行类似的开发。该公司自动驾驶系统的工程师达瓦尔·施罗夫向首席执行官埃隆·马斯克提出了一个概念。施罗夫提出了一个专为汽车量身定制的类似于ChatGPT的系统。
他们的目标不是依靠预定义的规则来确定汽车的最佳路径,而是使用从大量训练数据中学习的神经网络。拥有十年经验的特斯拉团队经验丰富的成员Shroff解释说,这些数据包括数百万个人类驾驶行为的例子。
八个月后,马斯克体验到全自动驾驶(FSD)汽车的性能与他之前驾驶的数百辆相比有所提高。流畅性和可靠性归功于引入新概念的新版本FSD12。
马斯克认为,这项创新不仅有可能改造自动驾驶汽车,而且代表着向能够在现实世界场景中运行的通用人工智能的飞跃。Shroff提出的新系统不是传统上依赖数十万行代码,而是通过处理数十亿个描述人类驾驶行为的视频帧来学习驾驶。这种方法反映了新的LLM聊天机器人所采用的自我训练方法,该方法通过处理人类文本中的数十亿个单词来产生响应。
1.端到端的自动驾驶
特斯拉并不是唯一一家采用端到端技术的公司,还有Comma.ai和OpenPilot,班加罗尔男孩曼卡兰·辛格用它通过一部旧的安卓手机为他的Alto供电。他在印度进行FSD之旅的消息引起了人们的关注,因为汽车制造商经常告诉我们船上有多少计算能力才能实现这一点。
Wayve.ai甚至决定用伦敦最艰难的街道来测试其自动驾驶技能。该团队取得了一些令人印象深刻的成果。八个月前,他们发布了一个使用视频、文本和动作输入来训练系统在路上行为的90亿参数世界模型。
2022年5月,Wayve与微软合作,利用科技巨头的基于云的超级计算机Azure来训练其神经网络。
马斯克指出了端到端方法的一个重要方面:车辆不再接收明确的指令,如“在红灯处停车”或“在变道前验证”。相反,它通过“模仿”在训练过程中使用的1000万个视频中观察到的行为来自主判断这些动作。
这意味着他们一直在使用数百万个视频的数据集,并对每个视频中的驾驶员进行了评估。机器学习模型已经过训练,可以模仿被认为“驾驶技术好”的驾驶员的行为。
从理论上讲,这具有巨大的潜力,因为当面对不熟悉的场景时,模型可以更有效地进行概括。从本质上讲,该模型可以根据其训练来确定最恰当的行为,而不是陷入预定义的指令中。
2.投入巨资登月计划的三分之一自动驾驶依旧发展缓慢
然而,还有一个问题有待解决。即使是技术最娴熟的驾驶员,也经常违反交通规则。例如,超过95%的人倾向于缓慢通过停车标志,而不是完全停下来。
由于新的FSD系统是有意设计来模仿人类行为的,因此美国国家公路安全委员会负责人目前正在调查这种行为是否可被视为自动驾驶汽车可接受的行为。
此外,尽管过去十五年来不计成本地挥霍和无休止的道路测试,但无人驾驶技术仍然停滞在试点阶段。“我们看到投入了大量的资金,但得到的成果却非常有限,”Wayve的创始人兼首席执行官亚历克斯·肯德尔指出。
这促使了总部位于英国的Wayve公司以及Waabi和Ghost等初创公司大力关注神经网络。他们将其称为AV2.0,并乐观地认为,更胜任且成本效益更高的技术将使他们超越当前的市场领导者。
多年来,自动驾驶汽车因各种高调错误而备受关注,这些错误很难被忽视。投资者在开发自动驾驶汽车方面投入了超过1000亿美元,占NASA将人类送上月球所花费的三分之一。总之目前看,人类的一大步比能自动驾驶的汽车要便宜。