8月8日,robotaxi首秀。这很可能是划时代的车。按照马斯克的原话:它会让特斯拉市值冲上10万亿美元。一百年后人们都会谈论这个重要时刻。而马斯克真正想要的是,通过robotaxi(自动驾驶出租车)颠覆交通运输的现存模式。
三体引力波依照沃尔特·艾萨克森力作《马斯克传》美版(simon&schuster出版),选取相关章节译成中文,为大家呈现这段不输于编剧笔法的惊人内幕。
“它跟chatgpt一样,只不过是给汽车使用,”自动辅助驾驶团队成员达瓦尔·什罗夫(davar shrove)对马斯克说。 他把自己在特斯拉的ai项目,拿来跟openai新推出的人工智能聊天机器人做比较。 openai是马斯克和奥特曼在2015年共同创立的实验室。马斯克花了近十年时间,投入开发各种不同形式的人工智能,包括自动驾驶系统、人形机器人optimus、脑机接口neuralink等。什罗夫的人工智能项目主要是开发最先进的机器学习技术,也就是能够学习人类行为的自动驾驶系统,他说:“我们处理了大量信息,都是关于真实人类如何应对复杂驾驶场景,然后训练计算机神经网络模仿人类的驾驶行为。”
什罗夫偶尔会加入三剑客詹姆斯、安德鲁、罗斯的队列,组成四剑客。马斯克要求和什罗夫见面,想说服他离开特斯拉自动辅助驾驶团队,去推特工作。但什罗夫想留在特斯拉,他希望说服马斯克,自己负责的ai项目对于特斯拉甚至整个世界来说,非常重要。他把自己提出的ai新技术,命名为“神经网络路径规划器”(neural network path planner),赋予特斯拉的自动驾驶软件向人类学习的能力。
他们两人原定在2022年12月2日周五见面,实际上马斯克当天的行程已经排满,只能硬塞。当天早上,什罗夫按照马斯克的要求抵达推特总部,马斯克刚参加完 cybertruck 赛博皮卡发布会,从内华达赶回。他向什罗夫道歉,表示自己忘记了要飞到新奥尔良和法国总统马克龙会面,需要讨论欧洲的内容审核规则。他请什罗夫当天傍晚再来面谈。当马斯克等待与马克龙会面期间,发消息给什罗夫,再次要求推迟面谈时间。“我会迟到四个小时,你愿意等我吗?”但就在同一时间,他又突如其来地发消息给独立调查记者维斯夫妇,请他们当晚飞到旧金山与他会面,协助处理推特文件。
当天深夜,马斯克回到旧金山,终于有机会坐下来与什罗夫谈一谈。什罗夫解释了,他正在开发的神经网络路径规划器项目诸多细节。 “我认为,让我继续进行目前的工作,真的非常重要。”什罗夫说。 马斯克听了他的解释后,再次燃起对这个ai项目的热情,也认同什罗夫的说法。他知道,未来特斯拉不只是一家汽车公司,也不只是一家清洁能源公司。如果能够整合全自动驾驶、optimus 机器人、dojo 机器学习超级计算机,它会成为一家人工智能公司,不仅能通过聊天机器人在虚拟世界运行,还能在实体工厂与现实道路上运行。 他早已在考虑聘请一批人工智能专家,与openai正面对决,特斯拉的神经网络路径规划团队正好能填补这份工作。
多年来,特斯拉的自动辅助驾驶系统一向采取基于规则的算法(rule-based approach)。系统由摄像头采集视觉数据,辨识车道标线、行人、车辆、交通信号等,以及八个摄像头拍到的视频信息。接着,软件会根据一套规则运行,例如:红灯亮时要停车,绿灯亮时要开车;保持在车道标线中间;不能跨越双黄线驶入对向车道;只在其他任何车辆的速度都不足以撞到你时,才通过路口等等。特斯拉工程师手动编写和更新几十万行 c++ 代码,把这些规则应用在各种复杂情境里。
而什罗夫正在开发的神经网络路径规划器项目,可以为软件系统增加新能力。“汽车不再只根据规则决定适合的路径,”什罗夫说,“还会依赖神经网络。神经网络是根据数百万个人类行为的真实案例计算机进行深度学习。”换个说法,神经网络会模仿人类。每当面对某个情境,神经网络会根据人类在成千上万种类似情境的行为,选择其中一条路径。就跟人类学习说话、开车、下棋、吃意面……几乎所有事情一样,我们会遵循某套既定规则,但多数时候,我们都是观察其他人怎么做逐渐学会技能。这是计算机科学之父图灵在1950年发表的《计算机与智能》论文中,设想的机器学习方法。
特斯拉拥有全球名列前茅的强大超级计算机,用来训练神经网络,采用芯片大厂英伟达(nvidia)设计的图形处理器(gpu)。马斯克的目标是在2023年改用dojo,也就是特斯拉从零打造的超级计算机,用视觉数据训练人工智能系统。dojo用的芯片和基础设备,全都是特斯拉人工智能团队自主设计的,算力高达每秒约800亿亿次浮点运算,是全球性能最强大的人工智能超级计算机之一 。这台超级计算机能用来训练自动驾驶软件和optimu人形机器人。“能够同时训练它们真的很有趣,就好像它们正在努力探索世界。”马斯克说。
2023年初,神经网络路径规划器项目已经分析了从特斯拉用户车上采集的1,000万帧视频画面。这是不是意味着系统的表现只能达到一般人类驾驶的平均水准呢?“不是,因为我们只采用了人类成功应对某个情境的数据。”什罗夫解释。人类标记员会评估所有视频画面,然后给出评分,许多标记员的工作地点在纽约水牛城。马斯克告诉他们,找出“uber五星驾驶员所采取的操作行为”,然后利用这些视频训练计算机。
马斯克会定期巡视特斯拉位于加州帕罗奥图的办公大楼,自动辅助驾驶团队就在其中一个开放空间工作。有时他会半蹲在一旁,跟工程师即兴讨论。有一天,什罗夫向马斯克展示他们最新的开发进度。马斯克觉得很不错,但有个根本问题:真的需要采用这个新方法吗?会不会有点过了头?他有个座右铭:绝不用巡航导弹打苍蝇,用苍蝇拍就够了。采用神经网络规划路径器,只为了应对不太可能发生的极端情况,是否过度复杂而没有必要?
什罗夫向马斯克展示,在哪些情况下,神经网络算法的表现会优于规则算法。在一个模拟场景中,道路上散布着垃圾箱、掉落的交通锥,以及任意丢弃的垃圾。由神经网络路径规划器引导的汽车,必要时会打破一些规则,跨越车道线,由此避开障碍物。“当我们从规则算法转为神经网络时,就能做到这一点,”什罗夫对马斯克说,“如果使用神经网络,汽车永远不会撞到任何东西,即使是在混乱的场景里。”每次看到类似的技术大跨越,马斯克就会变得异常兴奋。“我们应该举办一场詹姆斯·邦德风格的展示会。四周炸弹全部爆炸,ufo从天而降,然后我们的自动驾驶车疾驶而过,完全没撞到任何东西。”他兴奋说到。
机器学习系统在自行训练时,通常需要有目标或指标做为引导。马斯克偏爱的管理方法,正好是直接指定哪些指标最重要。他告诉团队的指标是:使用特斯拉全自动辅助驾驶的汽车,在没有人为干预下的行驶里程。“我希望每次开会时,第一张投影能够显示最新的没有人为干预的里程数,”他下令,“当我们训练人工智能时,要优化的目标是什么?答案是提高两次人为干预之间的里程数。”他告诉开发团队, 要像电玩游戏一样,让玩家每天都可以看到分数,“看不到分数的电玩游戏很无聊。如果每天都能看到没有人为干预的里程数持续增加 ,就会让大家更有动力。”
于是团队成员在工作间安装了几台巨大的85吋显示屏,实时显示全自动辅助驾驶汽车在不受人为干预下,平均能行驶多少里程。每当他们看到某种类型的干预行为反复出现,例如驾驶员在变换车道、车道合并或转入复杂路口时把握了方向盘,他们就会同时启用规则算法和神经网络算法,试着找到最优解。他们在办公区摆了一面铜锣,每当成功解决人为干预的问题时,就敲锣庆祝。
▲特斯拉ai技术主管pariljain称,全自动驾驶系统(fsd)已在美国200万辆特斯拉车上使用,辅助驾驶系统(autopilot)正在全球600多万辆特斯拉车上运行。
2023年4月中旬,马斯克决定亲自测试一下新的神经网络路径规划器,让测试车在帕罗奥图市区绕行。什罗夫和自动辅助驾驶团队已经装配好一辆测试版特斯拉,内置的自动驾驶软件接受过神经网络训练,有能力模仿人类驾驶行为。在这个软件里,遵循基于规则的传统代码占比非常低。马斯克坐在驾驶座,旁边坐着的是自动辅助驾驶软件总监阿肖克·埃卢斯瓦米(ashok elluswamy)。什罗夫与其他两位团队成员马特·鲍赫(matt bauch)和克里斯·佩恩(chris payne)坐在后座,他们三人已在特斯拉工作了八年,办公桌彼此相邻,都住在旧金山,住宅只隔几个街区。多数人的办公桌上都会摆放家人照片,他们三人的办公桌却放着同一张照片:那是三人在万圣节派对的合影。堂弟詹姆斯·马斯克曾是这个团队的第四名成员,在马斯克收购推特后被紧急征调过去。而什罗夫逃过一劫。
当测试小组离开特斯拉帕罗奥图办公园区的停车场时,马斯克在地图上选定一个行驶目的地,点击了全自动辅助驾驶模式,然后双手离开方向盘。当测试车驶入主要干道时,立即面临第一个吓人挑战:一个骑车人正朝向他们而来。“我们所有人都屏住呼吸,因为骑车人会做出什么随机反应,很难预料。”什罗夫说。但马斯克一点也没在意,也没有把手放回方向盘。结果这台车自动礼让骑车人先行。“完全是真人驾驶会采取的做法。”
什罗夫和他的两位团队成员开始详细解说,他们如何从特斯拉车载摄像头搜集的数百万条视频片段,才训练出来全自动辅助驾驶软件。相比于采用人工编写代码、设定数千条规则的传统算法,新的软件架构简单很多。什罗夫说,“它的运行速度快了10倍,我们最终还直接删除了30万行代码。”鲍赫表示,这就好比人工智能机器人在玩某种极其无聊的电玩游戏。马斯克听了,扑哧笑了出来。测试车继续在车流中自主行驶,马斯克掏出手机,开始发推文。
测试车行驶了25分钟,经过大街小巷,完成复杂的转弯,成功避开骑车人、行人、宠物。行驶过程中,马斯克完全没有碰触方向盘,只有几次踩了油门,因为他觉得这台车过分谨慎。例如,在四向停车信号前过分遵守规则。但有时候,测试车一度采取的应变行动,甚至让马斯克觉得比自己可能做出的反应还要好。他说:“哇,太棒了,即使是我的人类神经网络,都可能反应不过来,但是这台车做得太棒了。”他实在太开心了,开始吹口哨,吹着莫札特的g大调《小夜曲》。
坐拥特斯拉、推特两大数据库的马斯克,对在场的所有人说:“各位做得太棒了,真的非常了不起。”接着,所有人一起参加自动辅助驾驶团队的周例会,20名成员几乎全穿着黑色t恤,围着会议桌而坐,聆听最终评判。很多人原本不相信神经网络项目能成功。马斯克宣布,现在他相信了,他们应该投入大量资源,继续推动这个项目。
讨论过程中,马斯克抓住团队提到的一个关键点:神经网络必须接受至少100万条视频片段的训练,才能运行顺畅,如果训练超过150万条,就会表现得非常优异。这意味着相比于其他车厂和人工智能公司,特斯拉拥有极大的竞争优势。因为特斯拉每天能从全球200万台电动车上,采集到数十亿帧视频。“在这点上,我们占有独一无二的优势。”自动辅助驾驶软件总监埃卢斯瓦米在会议上说。
不论是开发哪种人工智能,从自动驾驶汽车到optimus人形机器人,再到类似chatgpt的聊天机器人,都必须具备搜集与分析大量即时信息的能力。现在,马斯克已拥有两个强大的即时信息库:自动驾驶车辆的海量视频,以及推特平台上每周高达数十亿条推文。会上马斯克告诉自动辅助驾驶团队,他刚完成一笔重要采购案,是为推特购买了上万块gpu芯片。他同时宣布未来将增加开会次数,讨论特斯拉正在设计的dojo芯片,dojo芯片有望展现更强大的能力。他还懊悔地承认,自己不该在圣诞节期间,冲动下令关闭推特位于萨克拉门托的数据中心。
在那天会议中参加旁听的,还有一位人工智能领域的超级明星工程师。那一周马斯克刚把他挖来,准备投身于即将推出的秘密项目。未完待续