首页 > 案例展示

对话轻舟智航于骞:海量数据闭环是端到端落地的核心

2024-08-10 作者: 案例展示

  [汽车之家行业] 自特斯拉针对无人驾驶提出“端到端”技术路径,并于2023年8月进行路测直播后,国内无人驾驶行业对此重视,并把“端到端”上车提上日程,为何业内将“端到端”视为无人驾驶发展趋势?端到端技术落地需要面临哪些挑战?

  在2024中国汽车论坛同期,中国汽车工业协会联合战略合作伙伴汽车之家,特别策划【车界先锋】,邀请行业领军人物,一同探讨中国汽车产业的发展之道,本期嘉宾为轻舟智航联合创始人、CEO于骞。

  于骞指出,端到端技术的发展并非一蹴而就,特斯拉在量产领域的成功,让这一技术路线变得异常火爆。端到端技术的核心在于数据驱动,它通过机器学习的方式,将无人驾驶的各个模块整合成一个统一的模型,实现了从感知到决策的全链条自动化。这种技术趋势的演进,标志着无人驾驶技术栈的一次重大变革。

  在谈及纯视觉技术对激光雷达行业的潜在影响时,于骞认为,无论是纯视觉还是结合激光雷达,端到端的方法都能适用。不过。虽然激光雷达在当前技术限制下提供了必要的安全冗余,但从长远来看,视觉技术完全有能力实现高等级的无人驾驶。人眼作为一个高度复杂的传感器,远超现有摄像头的能力,随技术的进步,纯视觉系统有望达到甚至超越人类驾驶员的水平。

  轻舟智航在端到端研发过程中展现出明显的竞争优势。于骞解释说,“端到端技术的发展依赖于数据的规模和质量。随着算力的提升和数据规模的扩大,端到端成为了可能。轻舟智航在机器学习领域的深厚积累,加上对大规模量产数据的接触,为公司在端到端模型的开发上提供了强大的优势。”

  于骞还提到,无人驾驶技术栈的发展已经从以模型为中心转变为以数据为中心的研发范式。轻舟智航坚持以数据驱动的方式推动无人驾驶技术的发展,并在数据闭环能力上积累了强大的护城河。这种能力不依赖于传感器或车载计算单元,而是依赖于强大的数据筛选、标注、训练和测试能力。

  面对端到端技术带来的挑战,如模型更新的快速性、大规模数据训练、数据筛选和自动化标注等,轻舟智航已经有了充分的准备。于骞认为,这些挑战的克服是实现端到端模型快速开发、迭代和部署的关键。

  在谈到特斯拉FSD可能进入中国市场的影响时,于骞表示,这将为广大购买的人提供更多选择,并对市场产生积极的教育和引领作用。特斯拉作为行业的引领者,将推动更多的消费者和车企认可和接受无人驾驶产品。

  汽车之家:最近特斯拉提出了端到端无人驾驶技术路线后,我们得知国内的自动驾驶行业对此很关注,也将之视为无人驾驶的发展趋势,您觉得为何端到端会成为行业的一个共同的方向?

  于骞:其实端到端的技术演进不光是在特斯拉,更早的英伟达、Waymo都有这方面的工作,特斯拉对于整个行业的引领性很强,大家很关注它,把端到端这件事变得非常的火爆,而且它确实也把这件事做到量产状态,量产和不量产依旧很不一样,虽然更早都是在学术界论文上讲得比较多,真正大规模量产还是在特斯拉首先做到的,这个确实是非常不容易的。

  我们在无人驾驶的技术栈里面如果形成一个大的集合来讲,你不难发现技术趋势是逐渐把非机器学习的部分挤的越来越小,在系统模型架构这部分以前是把每一个模块拼接起来,现在整个都是一个模型,实现完全的基于机器学习的方式,完全通过数据驱动来实现这样的智能驾驶能力,这一点来讲我认为是一个必然趋势。

  为什么端到端是大家都认可的一件事,因为趋势是这样走的,可以讲它实现了数据驱动里面的关键一环。

  汽车之家:有观点说纯视觉技术可能更适合端到端,我们正真看到特斯拉马上要发布Robotaxi,如果真的能靠摄像头就能实现无人驾驶,这个对于激光雷达行业来说会不会是一个整体的打击,您怎么样看待激光雷达的前景?

  于骞:其实端到端和传感器是两个不同维度的事情,端到端不管是使用激光雷达还是不使用激光雷达,纯视觉或者激光雷达跟端到端并没有直接的关系。视觉的传感器能用端到端的办法来进行训练,加了激光雷达一样可以用端到端的方法训练,其实本质上对端到端并没有很大的影响,两个不同的维度,一个是传感器的维度,一个是算法方法的维度。

  我认为要真正的完成大规模的无人驾驶甚至是无人驾驶,其实激光雷达并不是必须的,只是因我们现存技术的限制、方法的限制,使得我们比较依赖激光雷达。其实我们在人的驾驶行为来讲,人不会关注前面这辆车离我是185米还是187米,我们照常可以开车。我们也不需要测速,我们也不需要测那个车对我是80公里还是82公里,相对速度我们也并不关心。是因我们技术的限制、技术的方法、技术的范式使我们一定要知道其它车对我们的距离、速度,需要这样的测量。

  真正来讲,如果真正的完成完全数据驱动的方式,其实我认为是不需要额外的传感器,这个是从技术层面来讲,长期来讲我认为视觉是可完全实现非常高等级的自动驾驶。

  回到现阶段现实的产品角度来讲,对用户提供接近L4或者已经是L4的无人驾驶的话,我认为激光雷达在某一些场景下还是必须的,因为它提供了更多安全的冗余,提供了另外的一个视角,使得L4的应用可以有很多冗余的备份。从传感器的角度、从计算的角度,从算法和设计的角度有很多冗余的设计,你可以理解为激光雷达是视觉传感器的一个备份。如果我们的视觉传感器坏了,它可以作为一个有益的补充,或者视觉传感器某种情况下视觉失效情况下激光雷达作为一个补充。

  从长期来讲,如果我们不讲产品不讲投入的话,我觉得视觉完全能轻松实现无人驾驶,但是这个涉及到非常复杂的讨论。因我们讲的摄像头和人眼还是有很大的差异,人眼是一个高度复杂的传感器,远超现在摄像头的传感器,我们人眼是一个高度复杂的带各种各样的高级功能的摄像头,这只是一个比喻。长期来讲我是非常坚信视觉是可以做非常高等级的自动驾驶。

  于骞:其实我觉得端到端是一种新的研发范式,这种研发范式的到来其实非常大程度上是依赖于数据的规模。现在我们大家可以看到整个发展过程中不是单一的,为什么端到端不是十年前发生或者五年前发生,为什么这个时间点发生,很大程度上跟我们的算力和数据规模是相关的。

  如果你在更早的时间出现了端到端,即便有这样的技术,它可能更多停留在论文和实验室阶段。正是由于我们在算力水平提升了,我们的数据规模变大了,相应的方法就会出现,可以讲这是一个事物发展必然的一个阶段。

  对于轻舟来讲我们首先在技术方面积累了大量的基础,在基于机器学习,不管是感知模型、预测模型、规划模型,我们本身每一个模块几乎都是基于机器学习的方法。端到端是自然而然会发生的,相应来讲把模型整合在一起实现端到端的训练,这本身是一个必然的趋势。

  从人才角度来讲我们轻舟也有很多的牛人和非常高的人才密度,在这方面我们不管是算法和算力都有很多的基础。更重要的一点我们有机会接触到大规模量产的数据,使得这些数据能够帮我们在端到端方面获得非常强的优势。所以我觉得最终在端到端的模型里,它一定是把数据的优势发挥到极致,临界点可能在百万台车在路上跑,才会使端到端真的实现特别好的体验。

  其实在我们日常很多模型的开发中我们发现,当你的数据规模达到一定的临界点的时候,模型可能并没有什么大的变化,但是整个模型的能力泛化性变得非常好,这一点也是非常重要的。这一点我讲的数据并不仅是规模大、数据量大而已,一方面是数据的规模,还有数据的质量、数据的覆盖都很重要。如果你的量很大,但是你的质量很差,非常差的一些数据的话其实很难去训练,另外来讲如果你的数据分布不合理也会造成的很多的问题。

  数据规模某种程度上不是说单纯的规模越大越好,相对你要保证数据整体的质量、分布,规模当然也很重要。我觉得整个的自动驾驶研发范式已经逐渐从以模型为中心,转变成以数据为中心的研发范式,这个是非常大的变化。

  这一点也是轻舟一直以来坚持的一个研发范式,坚持以数据为中心,数据驱动的方式推动整个自动驾驶的发展。

  所以我经常会讲自动驾驶技术栈是一种冰山理论,我们经常看到车载的计算单元、车的传感器,甚至是传感器安装的位置,几个摄像头、几个毫米波几个激光雷达,这些东西更多是冰山能看到的一角,其实在冰山下面需要非常强大的数据闭环能力,包括怎么样进行大规模的数据筛选,怎么进行大规模的数据标注,怎么能实现海量数据的训练,高效的训练实现大规模仿真的闭环,以及怎么进行高效测试,这种能力其实是不依赖于你的传感器、车载计算单元,甚至不依赖于你的安装位置,这才是自动驾驶的核心,轻舟在这方面积累了非常强的护城河。

  汽车之家:马斯克也在前段时间说过,没有像特斯拉一样那么多的车队通过影子模式对系统进行闭环测试的话就无法参加端到端的游戏,单单用大模型的数据是否能跟得上?

  于骞:我觉得大模型和端到端也是两个概念,我非常认同数据规模是非常重要的,一定是要有很大的车队的规模,有很多数据的闭环的机会。如果只是在相对来讲很小的数据规模上,很多的简单的测试车队很小规模,其实你的数据覆盖、数据的质量和数据的分布是很难达到,都没有办法训练出一个真正端到端的体验,这一点来讲他说的是蛮对的。

  整个技术的发展其实是一个比较有意思的过程,比如说早期大家在做机器学习训练的时候很多情况下大家是使用CPU的训练,需要的CPU是一个很大的集群,比如说在谷歌需要巨量的CPU集群去做训练,那个是早期的时候。

  当GPU出现的时候就把巨量CPU的训练集群变成了一块GPU的板卡就搞定了,整个技术的发展是在不断进化的,包括早期GPT的一次训练,GPT2.0训练要花很多的钱,现在可能随便一台台式机就可以搞定,技术演进是在变化的。

  我认为端到端的技术发展最终都会进入到端到端的技术范式里面,甚至说这一点来讲,大家都在进入这么一个技术范式,就在于谁能够把海量的数据用好,能够实现这样数据快速的闭环,这才是核心能力。

  于骞:其实我觉得端到端这件事之前大家很多会讲不可解释性、黑盒,这些早就已经不是问题了,其实我觉得很大程度上怎么能够更快实现模型的更新。我们在一些应用场景里面想快速修复一些问题的时候,比如说如果原来基于规则、基于模块的设计,这一块的问题更新了把这个地方修改了,马上就立竿见影。但是在端到端的模型里面会发现很难针对某一个case专门修复它,怎么能够实现这样的模型快速的更新迭代,这是一个比较有挑战的问题,当然这里面还有很多你怎么大规模训练这些数据,怎么进行数据的筛选,怎么能够进行快速的数据的自动化标注,怎么能够在仿真的情况下进行高效的测试,这些都是在端到端的使用和部署中都在讲的实际中的困难,这些我们轻舟都有很多的储备,可以使得我们在这方面快速实现端到端模型快速的开发、迭代和部署。

  汽车之家:大家都在猜测FSD很快要进入到中国,您觉得会对中国车企也好、智能驾驶企业也好带来哪些影响呢?

  于骞:我觉得是特别好的一件事,对于特斯拉如果能进入中国的话,首先消费者大家有一个更好的选择,同时我觉得对这个市场也会有更好的教育和更好的引领。我们始终是把特斯拉看成是一个行业的引领者,它使得更多的消费者、更多的用户、更多车企能够看到产品可以做成这样子,教育市场的作用,让更多的消费者来认可这样的产品,所以我觉得这件事对行业来进是一个大好事。

  汽车之家:价格战持续了一年,这个压力会不会传导到智能化的一些供应链上面?在这个背景下,我们是如何兼顾性能的同时又发挥更高的一个效益和成本优势?

  于骞:首先我觉得在整个中国新能源市场上大家确实是卷得不得了,这个和整个行业是相关的。很多车企都不盈利或者盈利情况堪忧,竞争环境是非常恶劣的或者非常激烈的竞争态势。我觉得在这个时间点我们很大程度上还是要坚持我们的用户价值,如果我们进入到一个不讲用户价值、纯杀价这么一个过程,这个市场我们就彻底毁掉了。

  其实能够正常的看到在这个行业里面为什么所谓的智能驾驶大家觉得没有那么好用,还是回到你没有给到消费者带来“iPhone”时刻,他没有觉得这个事儿我用了以后太好了再也回不去了,我们还是有各种各样的问题。所以我觉得智能驾驶这个行业正好处在一个行业发展的关键期,正在不断产生新的用户价值,用户在越来越接受这件事。但是我们还差一步,只要我们跨过用户价值这一步。举个例子,我们现在谁会想到智能手机里没有一个拍照的功能,这是必须有的功能,什么时候我们的智能驾驶变成汽车的一个必须功能,没有这个功能车就不叫车,可能这件事的用户价值就真的凸显出来,我觉得很快会进入到这个阶段。

  我们现在所区分的产品形态还是中间形态,包括高速NOA、城市NOA,甚至是记忆行车,我认为这个是产品的中间形态。真正再往前发展我们就应该进入到让用户的学习门槛非常低,上车按一个键马上就可以开,基本上可以从脱手到脱眼这么一个状态,虽然可能还是在高阶辅助驾驶这么一个阶段,产品的体验学习的曲线会非常短,让用户真的认为这个事儿是一个必需品。

  当然这个一定是在前提安全的基础上,我相信很快会有这样的体验出来,现在都是手扶着,甚至手不用扶着也可以开得非常好,达到了一定安全的水平之后,我觉得很快会有这样的产品出现。

  汽车之家:现在很多的企业也把出海作为一个业务增长点,相比整车出口,智驾出海还是一件新鲜的事儿,您能不能跟我们透露一下轻舟智航有没有一些出海的计划?

  于骞:我们是非常看重海外市场,我觉得在整个智能驾驶和新能源汽车还是一个相对来讲不是一个单一市场,我们其实在车来讲,不管在全球任何地方开车,好的驾驶体验是相通的,这一点上目前来讲我们是基于在中国的市场环境下,我们仍旧是要看整个全世界的机会。

  尤其是我们正真看到中国的智能驾驶、中国的新能源车在整个世界范围内已确定进入到引领者的阶段,走到了全世界的前面,甚至成为舞台的中央。

  尤其是在智能驾驶领域,我们中国的智能驾驶的体验其实比海外来讲,在客户体验上来讲,用户价值上来讲已经领先了。在中国很多会先体验一些新的产品、新发布了一些新的产品,新的使用者真实的体验的出现,海外可能会在2-3年之后才会出现,这正是我们的机会,我们也在积极布局海外的客户拓展的机会。