钛媒体 昨天
小鹏预研众包建图,或为全场景智驾的 Plan B
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文 |   汽车像素,作者   |   邢芮芳,编辑 |   冒诗阳

与理想、极氪一样,小鹏计划在今年将智能驾驶推向 L3 级别,但不同的是,小鹏准备了两套方案。

小鹏未来智驾的既定路线,同样是基于大模型的无图方案。但在下一代大模型还没有完全成熟时,作为过渡,特定场景的建图方案,重新变成可选项。

" 众包建图 " 这项曾被弃用的技术路径,很可能要以另一种方式回来了。

01  两套方案

我们独家了解到,小鹏已在内部启动了众源建图技术的开发,目前已经推进了数月。该技术目前是预研状态,未来或作为小鹏 L3 级别方案的补充。

众源建图是一项用于优化智能驾驶方案的技术,它通过车辆采集道路数据,实时构建一个导航地图。众源建图有两个特点,一是需要多车协同,多源采集数据,二是实时生成地图,动态更新。众源建图可以为智能驾驶提供全局路径的参考,让智驾系统所能获得的信息,可以延伸至传感器覆盖的范围之外。

理想、极氪、元戎启行、地平线等相继走入 VLA 路线后,小鹏会用哪种技术路线来解决现在大模型的问题,实现 L3 等高阶智能驾驶,一直受外界关注。

4 月 14 日,小鹏在香港举办了一场 AI 技术分享会,首次披露了 " 小鹏世界基座模型 "。该模型可类比为端到端大模型的下一代,区别是换成以大语言模型为骨干网络,这一点与理想、元戎等正在开发的 VLA 大模型类似,不过参数量更大。这意味着,小鹏未来智驾的既定方向,仍然是基于无图路线的大模型方案。

对于预研众源建图,小鹏官方回应称 " 小鹏汽车智驾将坚持无图 + 大模型的路线 ", " 使用众源建图技术 " 不实。

一位熟悉小鹏技术路径的智驾行业从业者告诉我们,小鹏预研众源建图技术,很可能是对现有 XNGP 方案的补充。

目前小鹏的下一代大模型刚刚完成路径验证,距离成熟可用还有相当一段距离。在这个过渡阶段,众源建图有能力弥补 AI 在园区、停车场等内部道路时决策能力的不足,有望让基于 XNGP 的 L3 级高阶智驾方案更快实现可用。

今年 3 月 23 日,小鹏董事长何小鹏在社交媒体上透露,小鹏 " 预计(今年)下半年会实现 L3 级别全场景自动驾驶 "。同样做此推断的还有理想、极氪,他们对做到 L3 的时间预估都是今年内,一场智驾头部玩家新的技术竞逐开始了。

小鹏车端 XNGP 现在使用的端到端大模型包括感知模块 XNet、规划模块 XPlanner 和大语言模型 XBrain 三个部分,虽然也融入了大语言模型,但并不是骨干。

小鹏这套 XNGP 的方案,已经可以在外部道路上实现绝大多数场景的辅助驾驶,但在一些特殊场景,比如内部道路上可能会遇到麻烦。相比于外部道路,内部道路的建设更不规律,道路标识更不规范,这也是特斯拉 FSD 曾经遇到的问题。

对于小鹏来说,如果众源建图能够补足内部道路等特定场景,小鹏可以基于现在的 XNGP 方案,拓宽其实现 " 全场景自动驾驶 " 的范围,更早在很多场景内做到 L3。

小鹏的第一步是先在部分车型上预埋众源建图数据的搜集、回传等能力,这通过 OTA 就能够做到。众源建图需要一定量的数据作为基础,用来调试和优化功能。这个阶段的众源建图,还无法在智驾方案中发挥实际作用。

目前小鹏智驾的正式版本是去年 10 月底推送的天玑 5.4.0。今年 1 月 9 日,小鹏官宣开启了天玑 XOS 5.5.0 版本的尝鲜升级,该版本新增了车位到车位功能。小鹏相对完整的众源建图技术,预计会在两到三个版本后推送。

02  智驾终局前的赛跑

很多车企想做到 L3,是因为他们判断 L3 是 L4 时代的开端,而非 L2 级智驾的延续,因为技术路径会变得明确,智能驾驶的竞赛会接近终局。

按照行业对智能驾驶的一般分级,L2 级智驾的驾驶责任始终在人,而到了 L3 阶段,智驾系统可以在特定条件下完全接管车辆的驾驶,即全场景覆盖,并有能力承担一定的责任。到了 L4,大部分路况都可以交给智驾系统,甚至一些特定用途的车可以去掉方向盘。

需要特别指出,上述描述仅限于技术能力的层面,实际的责任划分是法规问题而非技术问题。

小鹏曾是高精地图 + 规控智能驾驶技术路径上的领先者,但这套方案后来被认为是误区,到 2023 年初,主流玩家都转向了端到端大模型的训练,用人工智能来做智驾。

众源建图并不是智能驾驶领域的新鲜事物。当年高精地图被放弃的原因是采集困难,无法做到实时更新,那时一些业界人士提出引入众源建图,让路上跑的用户车辆,辅助更新导航地图,来低成本解决地图新鲜度的问题。

但这并没有成为主流。过去两年中,主流玩家专心训练大模型,脱离高精地图的 " 无图 " 方案,被作为智驾技术领先度的标志。

随着纯视觉方案的完善,业界曾经认为,众源建图技术发挥的空间会逐渐变小。但当端到端方案需要向更高阶进步时,问题重新出现了。

如今,无论是华为、理想、小鹏还是特斯拉,他们训练的端到端大模型可以解决驾驶决策中的绝大多数问题,但仍有少量难以预知的问题,是现在的大模型所不能企及的。无论智能驾驶方案从 L2 被描述为 L2+、L2++,始终不能跨越到 L3,长尾问题所带来的隐患伴随其间。

理想、极氪转向了下一代大模型 VLA 的训练,将多模态模型内化为端到端智驾大模型的一种能力,尝试让智驾 AI 拥有复杂思考、深度推理的能力,从而有能力实现更复杂的驾驶决策。我们此前曾独家透露,理想已在今年初启动了 VLA 大模型的封闭式开发,项目预计在今年下半年落地。

比如在前面提到的内部道路上,VLA 大模型可以通过推理来读懂道路和特殊标识,这是现在大模型难以做到的,也是众源建图可以辅助解决的场景之一。

如今从小鹏披露的 " 世界基座模型 " 来看,小鹏也转向了 VLA 下一代大模型的研发,众源建图只会是过渡方案。

智能驾驶是过去几年头部新能源车企的竞争焦点,从 NOA 开城到端到端,再到今年的 L3 ,每年都会有一个阶段性的新节点,小鹏始终没有掉出第一梯队。如今看来,这场竞争很可能会在未来一到两年中临近终局。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

小鹏汽车 自动驾驶 小鹏 智能驾驶 何小鹏
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论