选择城市
综合
  • 综合
  • 找论坛
登录
发布作品
Global
下载App
扫码下载汽车之家App
小程序
扫码打开汽车之家小程序
>
点赞
评论
收藏
分享
当前位置:
秋凤空间 | 小鹏第二代VLA,跃升智驾T0档
秋凤空间
车家号·0浏览·2026-03-10 18:29 · 北京

3月2日,“THE FUTURE”为主题的小鹏汽车第二代VLA媒体体验日上,董事长CEO何小鹏宣布,第二代VLA将在本月开始全量推送。与其说是“第二代”,更像是另起炉灶。与第一代VLA的L2思路不同,这一次的VLA路径,直通L4。

简单说,第二代VLA抛弃了语言转译,V-L-A链变成更直接的V-A链。

解决L2痛点,才能安心

传统VLA模型遵循“视觉输入—语言转译—动作输出”的三段式逻辑。先将图像等多种传感器信息,都翻译成文本,然后用语言模型去理解,生成指令,交给系统去执行。一来一回,经历两次语言转译,不但信息不可避免地耗散,而且会有比较大的延迟,通常在几百毫秒的级别。如果处于时敏型场景,比如达到80公里时速,500毫秒就是10多米的距离,实施处置很可能来不及。

第二代VLA,解雇了“语言翻译官”,从视觉及其他信息融合,到动作指令直接输出。系统依靠“下意识”决策,这和人类面对时敏型场景下意识动作,如出一辙。其背后是专家模型,即建立在多年驾驶经验之下的“优解”。这么一来,肯定是快了。

至于小鹏的“下意识动作”准不准,这就要回到当前L2的痛点。

现在的L2级别的辅助驾驶,高速一套逻辑、城区一套逻辑、小路停车场又一套逻辑,实际上是个缝合怪,每次场景切换都可能顿挫、犹豫或退出,用户体验不佳。

真正让人头疼的,是反人类操作:前方明明拥堵,车子却不减速,快到跟前一脚重刹;窄路会车,车子既不避让也不减速;与大车并行,不知道拉开距离,全程贴着走。

而小鹏的第二代VLA(准确地说应该是V-A),掌握了人类舒服的“分寸感”。在夜间没有照明的小路上,系统能提前识别坑洼和障碍,主动减速绕行,全程无接管。和白天有清晰标线的大路一样,不用人操心。

路边交警示意停车,系统能像人类那样理解意图,平稳妥帖停到路边。更令人印象深刻的是,一次测试中,后方传来救护车的鸣笛,第二代VLA果断打灯靠边减速让行。

这说明,声音也作为外界信息,成为融合输入的一部分,不仅限于视觉或者毫米波雷达数据。更重要的是,这些反应不仅及时,而且不是编程编出来的,这些能力是模型“涌现”出来的,即无须事先拟定规则,系统就能通过上亿个视频切片,领悟到这个世界的规则。

这在很大程度上解决了所有公司最为头痛的长尾问题。场景是无穷无尽的,极端情况是无法穷举的。系统如果能像人类那样,只须凭借底层规则认知和长期驾车的肌肉记忆,就能处理绝大多数此前未曾碰到的情况。

能力跃升为智驾T0档

这种“分寸感”,以前为人类司机所独有。L2系统极力拟人,但一到关键时刻就开始露馅,第二代VLA则解决了这一问题。这预示着第二代VLA建立了通往L4的框架。

这些能力的背后,是辨识能力的跃升。第二代VLA对夜间深色物体的识别率提升了72%——再也不怕黑夜里穿黑衣服的行人、无路灯路段的障碍物。路面障碍物识别能力提升124%,侧后车辆识别能力提升118%,前车轨迹预测精准性提升300%,夜间决策准确性提升96%。窄路平均接管里程直接提升13倍,新手也能轻松会车、走窄路。

小鹏智驾中心负责人刘先明,给出了一个更震撼的数据:第二代VLA的安全接管里程提升了50倍,平均接管里程提升25倍。这意味着,用户每开50倍的距离才需要接管一次——从“时刻准备接管”到“偶尔看一下就行”,体验天差地别。小鹏的第二代VLA,已经跳出业内“一线”的能力范畴,进入无人可比的智驾T0档 。

安全与效率兼得的背后

如果说“安心”解决了敢不敢用的问题,“能力”回答了能不能开的问题,那么“效率”则决定了用户愿不愿意用。而效率恰恰是传统智驾最难跨越的坎。

有的智驾给人的印象是“莽”,有的则过于保守。遇到加塞只会让行,调头慢吞吞、堵住后面一长串车。

第二代VLA风格拿捏得当。在广州晚高峰实测中,导航软件预估44分钟的路程,第二代VLA只用了43分钟,比人驾快1分钟;而传统L2智驾跑了48分钟,投入运营的Robotaxi用时更长(显示策略更保守)。

小鹏官方给出了一系列效率提升的数据,其中最关键的,莫过于综合行车效率提升23%。在拥堵的大中城市街道,这是所有驾驶者梦寐以求的能力。甚至比专车司机开的还好。

何小鹏说:“好的智驾应该像坐电梯一样,按下启动键,就能够从家里到达公司。”没人关心电梯怎么运行的,只管到没到,这才是“国民智驾”的本质。效率提升的背后,是决策逻辑的重构。

当前智驾行业正站在关键分水岭:一边是基于L2能力持续“小修小补”,在有限边界内迭代体验;另一边是推倒重来,以L4为目标从底层重构技术框架。小鹏选择了后者。

第二代VLA的核心突破,就是系统的思考过程,变成一种类似人类的下意识反应。

这套架构的投入是惊人的:3万卡算力、20多亿训练费用、50PB训练数据。从2025年科技日至今,已迭代468版模型,平均一天迭代4版。自研图灵AI芯片单颗可提供750TOPS有效算力,基座模型编译效率提升12倍。

在训练数据规模已经很大的前提下,意味着通过不断迭代,就可能达到L4,同时具备跨场景泛化能力,具身智能、飞行汽车都可以在同样的基座模型上发展V-A链。

刘先明因此有底气说,“小鹏第二代VLA,是小鹏与行业拉开代际差距的时刻,可能是目前中国最领先的智驾系统。”

玩法变了,影响波及整个市场

相比第一代VLA,第二代似乎铺好了通往L4的路径,这和特斯拉FSD从V13到V14的质变刚好对应。即便丝毫不考虑技术内容,只从体验出发,小鹏第二代VLA,很可能是唯一能在全球市场与特斯拉FSD竞争的中国智驾方案,小鹏因此回到智驾的T0梯队。全量推送后,市场层面恐怕普遍反应过来。原来,自动驾驶才是物理AI Agent第一个商业化落地方案。

以前老是说AI烧钱不赚钱,如果体验超出L2一大截,并毫不迟疑地直指L4,那么正向的商业循环也就建立起来。从这一点上看,小鹏的二代VLA,可能将引发市场竞争主线的变化。

以往辅助驾驶一直被当做汽车“价值增量”,前者依附于后者。就眼下而言,智能驾驶的核心仍是安全、省心、好用。智驾普及,不仅意味着在入门级车型上的普及,还意味着在全系产品上普及能力更强、体验更佳、适用性空前广泛的智驾系统。从而在用户心理上,形成普遍接受并尽快拥有的愿望。市场宽度就此不同了,真正的全民智驾时代才会到来。

再进一步,第二代VLA表明打通指向L4的道路,一切又不一样了。何小鹏相信“汽车领域很快迎来跨域融合”。此前,具身智能看起来和车完全不同,外观不同、运动方式不同,控制、动力、线束和汽车都不一样,但AI向物理Agent进发的过程中,与汽车的自动驾驶需求产生了技术路线交叠。而动力、控制、底盘包括AI基座模型都在融合。小鹏二代VLA,可能是一场席卷整个市场的风暴先兆。

如果跨域跨产业的“融合”预期落实,不仅导致技术和供应链复用、合并,而且极大加速了用户心智的教育和占领。客户从第二代VLA超预期体验当中,大概率意识到,一个强智能体时代已经来临,整个商业模式、商业价值体系,都会产生颠覆性变化。

而小鹏的第二代VLA则第一次在公众面前,替这种潜在变化揭开了面纱。

本内容来自汽车之家创作者,不代表汽车之家的观点和立场。
文章标签
点赞
评论
收藏
分享
举报/纠错
2026/3/11 02:08:45