秋凤空间 | 小鹏第二代VLA，跃升智驾T0档_车家号_发现车生活

当前位置：

秋凤空间 | 小鹏第二代VLA，跃升智驾T0档

秋凤空间

车家号·0浏览·2026-03-10 18:29 · 北京

3月2日，“THE FUTURE”为主题的小鹏汽车第二代VLA媒体体验日上，董事长CEO何小鹏宣布，第二代VLA将在本月开始全量推送。与其说是“第二代”，更像是另起炉灶。与第一代VLA的L2思路不同，这一次的VLA路径，直通L4。

简单说，第二代VLA抛弃了语言转译，V-L-A链变成更直接的V-A链。

解决L2痛点，才能安心

传统VLA模型遵循“视觉输入—语言转译—动作输出”的三段式逻辑。先将图像等多种传感器信息，都翻译成文本，然后用语言模型去理解，生成指令，交给系统去执行。一来一回，经历两次语言转译，不但信息不可避免地耗散，而且会有比较大的延迟，通常在几百毫秒的级别。如果处于时敏型场景，比如达到80公里时速，500毫秒就是10多米的距离，实施处置很可能来不及。

第二代VLA，解雇了“语言翻译官”，从视觉及其他信息融合，到动作指令直接输出。系统依靠“下意识”决策，这和人类面对时敏型场景下意识动作，如出一辙。其背后是专家模型，即建立在多年驾驶经验之下的“优解”。这么一来，肯定是快了。

至于小鹏的“下意识动作”准不准，这就要回到当前L2的痛点。

现在的L2级别的辅助驾驶，高速一套逻辑、城区一套逻辑、小路停车场又一套逻辑，实际上是个缝合怪，每次场景切换都可能顿挫、犹豫或退出，用户体验不佳。

真正让人头疼的，是反人类操作：前方明明拥堵，车子却不减速，快到跟前一脚重刹；窄路会车，车子既不避让也不减速；与大车并行，不知道拉开距离，全程贴着走。

而小鹏的第二代VLA（准确地说应该是V-A），掌握了人类舒服的“分寸感”。在夜间没有照明的小路上，系统能提前识别坑洼和障碍，主动减速绕行，全程无接管。和白天有清晰标线的大路一样，不用人操心。

路边交警示意停车，系统能像人类那样理解意图，平稳妥帖停到路边。更令人印象深刻的是，一次测试中，后方传来救护车的鸣笛，第二代VLA果断打灯靠边减速让行。

这说明，声音也作为外界信息，成为融合输入的一部分，不仅限于视觉或者毫米波雷达数据。更重要的是，这些反应不仅及时，而且不是编程编出来的，这些能力是模型“涌现”出来的，即无须事先拟定规则，系统就能通过上亿个视频切片，领悟到这个世界的规则。

这在很大程度上解决了所有公司最为头痛的长尾问题。场景是无穷无尽的，极端情况是无法穷举的。系统如果能像人类那样，只须凭借底层规则认知和长期驾车的肌肉记忆，就能处理绝大多数此前未曾碰到的情况。

能力跃升为智驾T0档

这种“分寸感”，以前为人类司机所独有。L2系统极力拟人，但一到关键时刻就开始露馅，第二代VLA则解决了这一问题。这预示着第二代VLA建立了通往L4的框架。

这些能力的背后，是辨识能力的跃升。第二代VLA对夜间深色物体的识别率提升了72%——再也不怕黑夜里穿黑衣服的行人、无路灯路段的障碍物。路面障碍物识别能力提升124%，侧后车辆识别能力提升118%，前车轨迹预测精准性提升300%，夜间决策准确性提升96%。窄路平均接管里程直接提升13倍，新手也能轻松会车、走窄路。

小鹏智驾中心负责人刘先明，给出了一个更震撼的数据：第二代VLA的安全接管里程提升了50倍，平均接管里程提升25倍。这意味着，用户每开50倍的距离才需要接管一次——从“时刻准备接管”到“偶尔看一下就行”，体验天差地别。小鹏的第二代VLA，已经跳出业内“一线”的能力范畴，进入无人可比的智驾T0档。

安全与效率兼得的背后

如果说“安心”解决了敢不敢用的问题，“能力”回答了能不能开的问题，那么“效率”则决定了用户愿不愿意用。而效率恰恰是传统智驾最难跨越的坎。

有的智驾给人的印象是“莽”，有的则过于保守。遇到加塞只会让行，调头慢吞吞、堵住后面一长串车。

第二代VLA风格拿捏得当。在广州晚高峰实测中，导航软件预估44分钟的路程，第二代VLA只用了43分钟，比人驾快1分钟；而传统L2智驾跑了48分钟，投入运营的Robotaxi用时更长（显示策略更保守）。

小鹏官方给出了一系列效率提升的数据，其中最关键的，莫过于综合行车效率提升23%。在拥堵的大中城市街道，这是所有驾驶者梦寐以求的能力。甚至比专车司机开的还好。

何小鹏说：“好的智驾应该像坐电梯一样，按下启动键，就能够从家里到达公司。”没人关心电梯怎么运行的，只管到没到，这才是“国民智驾”的本质。效率提升的背后，是决策逻辑的重构。

当前智驾行业正站在关键分水岭：一边是基于L2能力持续“小修小补”，在有限边界内迭代体验；另一边是推倒重来，以L4为目标从底层重构技术框架。小鹏选择了后者。

第二代VLA的核心突破，就是系统的思考过程，变成一种类似人类的下意识反应。

这套架构的投入是惊人的：3万卡算力、20多亿训练费用、50PB训练数据。从2025年科技日至今，已迭代468版模型，平均一天迭代4版。自研图灵AI芯片单颗可提供750TOPS有效算力，基座模型编译效率提升12倍。

在训练数据规模已经很大的前提下，意味着通过不断迭代，就可能达到L4，同时具备跨场景泛化能力，具身智能、飞行汽车都可以在同样的基座模型上发展V-A链。

刘先明因此有底气说，“小鹏第二代VLA，是小鹏与行业拉开代际差距的时刻，可能是目前中国最领先的智驾系统。”

玩法变了，影响波及整个市场

相比第一代VLA，第二代似乎铺好了通往L4的路径，这和特斯拉FSD从V13到V14的质变刚好对应。即便丝毫不考虑技术内容，只从体验出发，小鹏第二代VLA，很可能是唯一能在全球市场与特斯拉FSD竞争的中国智驾方案，小鹏因此回到智驾的T0梯队。全量推送后，市场层面恐怕普遍反应过来。原来，自动驾驶才是物理AI Agent第一个商业化落地方案。

以前老是说AI烧钱不赚钱，如果体验超出L2一大截，并毫不迟疑地直指L4，那么正向的商业循环也就建立起来。从这一点上看，小鹏的二代VLA，可能将引发市场竞争主线的变化。

以往辅助驾驶一直被当做汽车“价值增量”，前者依附于后者。就眼下而言，智能驾驶的核心仍是安全、省心、好用。智驾普及，不仅意味着在入门级车型上的普及，还意味着在全系产品上普及能力更强、体验更佳、适用性空前广泛的智驾系统。从而在用户心理上，形成普遍接受并尽快拥有的愿望。市场宽度就此不同了，真正的全民智驾时代才会到来。

再进一步，第二代VLA表明打通指向L4的道路，一切又不一样了。何小鹏相信“汽车领域很快迎来跨域融合”。此前，具身智能看起来和车完全不同，外观不同、运动方式不同，控制、动力、线束和汽车都不一样，但AI向物理Agent进发的过程中，与汽车的自动驾驶需求产生了技术路线交叠。而动力、控制、底盘包括AI基座模型都在融合。小鹏二代VLA，可能是一场席卷整个市场的风暴先兆。

如果跨域跨产业的“融合”预期落实，不仅导致技术和供应链复用、合并，而且极大加速了用户心智的教育和占领。客户从第二代VLA超预期体验当中，大概率意识到，一个强智能体时代已经来临，整个商业模式、商业价值体系，都会产生颠覆性变化。

而小鹏的第二代VLA则第一次在公众面前，替这种潜在变化揭开了面纱。

本内容来自汽车之家创作者，不代表汽车之家的观点和立场。

文章标签