作者|郭月
编辑|志豪
车东西4月13日消息,日前,元戎启行CEO周光在智能电动汽车发展高层论坛(2026)期间接受了包括车东西在内的多家媒体采访,他围绕Robotaxi的竞争格局、L3是否会被跳过、互联网大厂为何纷纷入局智驾以及元戎启行的商业化策略等热点问题给出了看法。
采访现场,车东西向其提问,近期Robotaxi企业频频出现车辆“趴窝”、乘客被困等问题,如何看待模型能力和运营能力的重要性?
周光回应说,运营体系决定响应速度,模型能力的提升也很重要,“不可能靠先验信息和规则来做自动驾驶”。
他认为,Waymo依托Gemini已经完成了范式转变,不是所有公司都能跨越这个阶段,那些仍停留在旧范式的公司则将面临严峻考验。
而对于近期关于L3会不会被跳过的争论,周光认为,大模型、端到端、多模态的进展,正在极大加速从L2到Robotaxi的进程。
随着今年年初多模态技术的突破,城市NOA有望快速演进到Robotaxi阶段,不再依赖高精地图和密集运营,而是依靠基础认知模型。
他也回应了对元戎启行业务从高端车型下沉至十万级市场的看法。
他认为,技术路线与商业规模并不冲突,真正的难点是让大模型变得更好,而不是把好模型蒸馏到低算力平台,关键在于有没有更大、更强的基座模型,而不是守着一个小模型打补丁。
以下是此次采访中的媒体问答实录,车东西在不改变原意的情况下进行编辑。
1、近期国内外Robotaxi企业都出现了车辆“趴窝”、乘客被困等现象,你怎么看运营能力和模型能力的重要性?
周光:Robotaxi最核心的能力是模型能力的提升,其次是运营技巧——哪些问题需要秒级响应、哪些可以分钟级响应,这是运营体系的事。
互联网大厂非常擅长运营,能够快速调度不同层级的人员、远程接管、现场处置,这个调度网络本身也有难度。模型能力的提升也很重要,不可能靠先验信息和规则来做自动驾驶。
GPT时代之后,所有人都相信应该由AI驱动。
Waymo依托Gemini完成了根本性的转变,包括人才体系、技术体系、范式的变更。不是所有公司都能跨越这个阶段,我认为这才是难点。
如果还停留在老方法上,不去享受大模型技术溢出带来的优势,我会比较担心。
2、当前业内关于L3是否会被跳过的看法不一,你怎么看?
周光:关于L2、L3、L4,这些定义是30年前研究人员基于当时的技术路线制定的。
今天,随着大模型、端到端、多模态的发展,AI进展非常快,尤其是基座模型的认知能力在提升。我认为大模型会极大加速从L2到Robotaxi的进程。
我说的Robotaxi不是过去依赖高精地图的L4,而是直接从城市NOA迈向Robotaxi。
我们看到关键指标每年快速增长,尤其在大模型介入之后,如果每年一个数量级的提升,很快就会突破。
L3的本质是在模型不完美的情况下,通过人工补丁和工程能力去实现。
而通用自动驾驶的路径是提高模型的认知能力,这是两种不同的思路。
今年年初多模态取得突破,我认为城市NOA会快速演进到Robotaxi阶段。研究范式已经发生变化,不再靠运营或高精地图,而是靠基础认知模型。
3、前DeepSeek多模态技术核心研究员阮翀为什么会加入元戎?
周光:阮翀等顶尖人才选择加入元戎,是因为他们希望经营一家真正的AI公司,而不是以Tier1的思维做事。
元戎启行的愿景就是物理AI。我们在GTC上谈物理AI,之前谈端到端,基本上一年后大家都开始讲这些话题,这体现了元戎启行的前瞻性。
物理AI的上半场会在车端得到验证——只有车能提供几十万甚至百万级带Action的数据。如果在车端都不能验证,凭什么在机器人领域验证?
小模型的瓶颈已经很明显:跷跷板效应非常突出。
唯一解决方案是大模型,依靠通用常识和完整的大模型体系。我们今天说的大模型是全方位的大模型,包括GPT-VLA架构、训练范式的提升,是整个技术栈的下一个台阶。
4、阮翀加入后主要负责哪块业务?会带来哪些具体变化?
周光:他主要负责多模态和基座模型,以通用形式解决物理AI问题,而不是用非通用的方式。
具体细节大家可以在北京车展上关注我们的公开亮相。
最近大厂也有动作,大家可以留意,最有钱的AI公司选择的第一落地场景都是车,目的不是挣钱,而是验证物理AI本身,这个验证比挣钱重要得多。
5、如何看待字节跳动等互联网大厂成立自动驾驶部门?
周光:这一现象背后的根本原因是文本突破之后,大模型的下一步是多模态突破。多模态离物理世界的Agent只有一步之遥。
要验证物理AI,还是那个逻辑,只有汽车场景能提供足够的数据,机器人的数据量远远不够——本体差异、触觉、数据采集等原因都导致数据不足。
所以大厂选择在汽车领域验证物理AI是顺理成章的。接下来会有更多多模态进展的公司进入这个领域,美国那边OpenAI等公司也会有类似动作。
6、你对舱驾一体有什么看法?
周光:关于舱驾一体,更多是带来体验上的提升。
用车过程中,用户希望车具备交互沟通能力,一个“哑巴”车是做不到的,最终要像人一样,用一个大脑做所有事情。
舱驾一体方面我不说太多。我只强调一点:你既需要驾驶能力,也需要交互能力。
今天的“舱”不应该是一堆按钮。我看到车上有一排按钮就很难受,有的车搞了20个按钮,不知道按哪个,这不是自然的交互体验,应该通过自然语言、表情、多种形式交流,而不是靠“点点点”。
7、元戎启行打法从高端车下沉到十万级市场,如何平衡规模与技术前沿?
周光:关于商业打法,其实技术路线和商业规模并不冲突。
真正的难点在于让大模型变得更好,而不是把好的模型“蒸馏”到低算力平台。蒸馏这件事已经很成熟,问题是参数量增加3倍,效果却没有明显变好——这才是今天的问题。
如果你只想拼小算力,那是一条路,可以做蒸馏、做量化,也能实现。但要真正提升体验,必须让大的模型变好,这是最难的。
只要大模型做得好,就一定能适配不同平台。关键是你有没有更大、更强的模型,而不是守着一个小模型打补丁。
京ICP备09113703号-1
信息网络传播视听节目许可证: 0110553
广播电视节目制作经营许可证
公司名称:北京车之家信息技术有限公司
中央网信办违法和不良信息举报中心
违法和不良信息举报电话:400-868-5856
举报邮箱:jubao@autohome.com.cn

