• 客服热线:
  • 上海市xx区xx
  • 周一至周日:24小时

追赶FSD V14,理想在补哪些课?|最前线 - 华体会

过去几年,自动驾驶行业的竞争焦点经历了显著演变。

起初,竞争围绕硬件展开,例如是否配备激光雷达、安装多少个摄像头以及算力达到多少 TOPS。随后进入大模型时代,竞争转向了端到端、VLA(视觉-语言-行为)和 World Model(世界模型)等技术路径。

如今,越来越多的企业意识到,拥有更大的模型已不足以构成代际优势,真正决定其上限的是模型、数据、算力和芯片之间能否形成一个持续迭代的闭环。

这正是为何越来越多的汽车制造商开始走向自主研发。

特斯拉几乎覆盖了从数据采集、训练基础设施、FSD模型到Dojo、自研芯片的全部环节。在国内,包括小鹏、蔚来以及理想在内的车企,都在不断向更底层技术延伸。

在今年发布的L8和L9车型上,理想汽车已采用了自研的马赫M100芯片。这款采用数据流架构的芯片被理想汽车视为AI领域的一个重要技术方向。基于马赫M100,理想汽车也运行了其自研的马赫VLA模型。

然而,对于整个行业而言,更值得关注的问题并非“是否进行自研”,而是这些投入究竟能解决哪些实际问题。

带着这个疑问,我们与理想汽车自动驾驶负责人詹锟以及芯片负责人谢炎进行了交流。他们就理想汽车对下一代自动驾驶技术路线的判断,以及自研芯片、数据体系和AI基础设施背后的设计逻辑进行了阐述。以下为部分访谈内容,经编辑整理:

问:在第四季度达到特斯拉FSD V14的水平,理想汽车还需要在哪些方面进行努力?

**詹锟:**我认为追赶FSD有两层含义。

第一是基础体验,具体体现在安全感、效率和舒适度是否能达到FSD的同等水平。FSD在安全感、效率和舒适度方面表现出色,这是其基本功。即便不处理极端路况,也能在这些基础方面达到同等水平。

第二是能力方面,这一点同样难以追赶。例如,特斯拉能够礼让特殊车辆,能在极窄的通行环境中实现精准感知,并且能识别交警指挥,这些能力非常强大。

在能力层面,存在架构升级的机会。为何只有特斯拉具备这些能力?这可能与过去的范式限制有关,也可能与架构或数据有关。我们在这些方面进行了大量尝试。

问:我理解马赫VLA是一个技术体系,而非单一模型。例如,Mind-Edge是服务于智能座舱的端侧模型。那么,目前的智能驾驶模型中是否还包含“L”(Language语言)的部分?

**詹锟:**当前自动驾驶的架构普遍趋势是将VLA(视觉-语言-行为模型)与World Model(世界模型)整合。

从长远来看,所有技术路线都会朝着这个方向发展。无论是VLA还是World Model,其提示(Prompt)都需要用到语言。因此,语言部分是必然存在的,关键在于如何应用语言。

在机器智能领域,我认为基于视觉(Vision Based)是更合理的方式,它更适合理解空间、感知三维空间以及服务于环境。语言无疑是有价值的,它在理解环境、交通、指令以及进行复杂的思考决策方面都能发挥作用。

从长远来看,基于视觉和语言的原生基础模型,可能是未来的发展趋势。

**谢炎:**如果目标是实现L3、L4级别自动驾驶,需要解决更泛化的问题,那么模型就必须具备类似人类的思考能力。届时,语言的重要性将愈发凸显,这也是未来需要巨大算力的原因。

如果模型仅具备视觉和行为(Vision and Action)能力,即使拥有大量数据,在遇到分布之外的情况时也会束手无策。就像动物即使学会了所有常见情况,面对从未见过的情形也可能不知所措,无法做出正确的选择。

我们认为,越往L3、L4级别发展,需要解决的问题越接近90%、95%、98%之外的场景——那些前所未见的问题,需要模型具备像人类一样的思考能力。而实现类似人类的推理和思考能力,其来源正是语言模型。例如,当交警做出手势时,你需要理解其意图,这并非单纯通过收集或生成数据就能解决的问题。

问:随着理想汽车车队规模的不断扩大,从内部来看,数据的边际效应是否出现了衰减?贵公司是如何定义价值数据的?

**詹锟:**首先,数据的量必须足够大,本质上是为了收集更多的Corner Case(长尾场景)。目前,业界有很多方法可以在车辆端部署优秀的神经网络触发器,以识别并回传关键数据,包括难点场景和简单场景。这也是特斯拉目前表现强劲的重要原因之一。

其次,数据的质量至关重要,主要体现在行为质量上。当前,业界逐渐趋向于端到端的范式,无论是VLA(视觉-语言-行为模型)、World Model(世界模型)还是Vision-Action(视觉-动作模型),核心都在于准确的行为输出。因此,行为的质量、干净程度和一致性显得尤为重要。

关于数据规模扩大后的边际效应是否衰减,首先,只要模型能力不断提升,并且我们朝着满分目标迈进,其增长曲线必然是对数曲线,呈现逐渐衰减的趋势,而非线性增长,这是所有AI公司都会面临的情况。尽管后期数据收敛的速度确实会放缓,但我们希望通过规模化来加速这一进程。

问:马赫M100芯片能够运行在不同的AI场景下。五年后,或者再往后两代产品,理想汽车车内的算力中心是否有可能全部采用自研的马赫芯片?

**谢炎:**尽管业界存在“舱驾一体”的说法,但我们认为舱驾一体的核心在于AI算力部分,其他部分是否一体化则不那么关键。因为座舱系统与AI智能驾驶系统可以完全独立,但AI算力可以集中处理,从而提高分配效率。

我们的路线图最终形态是实现车内一个集中的AI计算中心,所有AI任务都可以在这里进行计算。这类似于在笔记本上运行OpenClaw,AI计算并非在笔记本本地进行,而是在Token Provider Server(Token供应服务器)上完成。车内也类似,将设立一个Token Server(Token服务器)。

这个Token Server的优势在于:第一,效率极高。第二,能够实现不同任务的隔离,互不干扰。例如,智能驾驶任务的确定性——无论是内存还是带宽,都能得到保障,不被其他任务影响,这是软硬件协同设计才能实现的。

问:是否因为M100采用了数据流架构的AI推理芯片,所以相比其他厂商的自动驾驶芯片,对带宽的需求较低,但对片上存储的需求更高?

**谢炎:**我们对带宽的要求确实较低,但这并非设计SRAM容量(非显存)的直接原因。目前HBM(高带宽内存)非常流行,许多人认为带宽越高越好。然而,计算、带宽、SRAM等都需要晶体管资源来实现,最终的设计是基于成本、综合性能等多方面因素考量后的选择。

不同架构设计之间,仅凭一两个指标进行简单对比是不合理也不专业的。这就像拳击比赛,身高和体重各有优势,但最终胜负并非由单一指标决定,而是取决于比赛的整体表现。

问:为何当前大算力芯片方案,如英伟达、小鹏、理想自研的芯片,都没有实现芯片级的舱驾融合,而高通却在低算力芯片上实现了这一点?这其中的原因是什么?

**谢炎:**本质上,座舱和驾驶是两个独立的系统。特别是对于高端L3向L4级别的自动驾驶,智能驾驶需要一个更高确定性的系统,包括专属的内存和计算资源。在这种情况下,融合的意义大大减小,因为资源无法实时切换,实时切换会降低确定性。如果朝着越来越独占的方向发展,融合的价值就不大了——即便将两个芯片集成在一起,资源仍需分开,不会降低成本,甚至可能影响效率。

您可以看到,当前所谓的舱驾融合系统,其内部仍然是分开的。它无法做到在不同任务间瞬间切换。如果将两个芯片集成到一个芯片中,晶体管数量可能不变,仅能节省封装成本。对于中低端芯片而言,这笔费用可以节省,但幅度有限。

我的观点是,随着智能驾驶技术的不断高端化,舱驾融合的意义将逐渐减弱。如果能将这些芯片设计得更紧密,在一块板上实现高度集成的小型化方案,这是可行的,不一定非要集成到一块芯片中,也可以是多块芯片的集成。

问:自研芯片需要具备哪些条件,例如销量、营收和研发投入?鉴于目前自动驾驶迭代速度很快,芯片要实现持续迭代,需要什么样的条件?

**谢炎:**芯片的初期投入相当可观,可能每年需要数亿元。

第一个条件是达到一定的营收规模。对于车企而言,年营收达到1000亿元以上,研发投入至少占10%,即每年有数十亿至上百亿元的资金,才足以支撑芯片的研发投入。第二个条件是,研发的芯片必须能够提升产品的能力。

许多人认为芯片需要有巨大的出货量才能实现成本摊薄。实际上,芯片的成本与面积相关。一辆车上的智能驾驶芯片,例如理想L7/L8/L9的智驾系统使用了两颗马赫M100,总面积约为800平方毫米。而一款高端手机的芯片面积约为100平方毫米,因此一辆车的智驾芯片面积相当于8部高端手机的芯片面积。

按照这个比例计算,几十万辆车的销量所需晶圆面积非常庞大,足以摊薄成本。所以,成本不能仅以芯片数量来衡量。

问:动态数据流编译器究竟难在哪里?攻克它花费了多长时间?

**谢炎:**在芯片流片之前,甚至在设计阶段,我们就已经开始了编译器的工作,并在流片前完成了大量模型的运行验证。

数据流是一种完全不同的架构,它要解决的问题与超级计算机或大规模计算机集群面临的问题非常相似——当规模扩展到数十万台计算机、上百万个核心时,它们之间的通信和协作变得极其复杂,无法通过一个中央管理员来统一调度。传统的冯·诺依曼架构调度方式在这种规模下是不可行的,这是一个超大规模并行调度的问题。

1 条评论

  • 2026年5月22日

    资深球迷

    华体会平台致力于为用户提供最权威的赛事一手资讯,覆盖全球热门体育项目。无论是足球、篮球、电竞还是其他热门运动,您都能在这里找到最全面、最及时的报道。

    • 2026年5月22日 李明 华体会平台上的数据更新速度真的很快,比分推送也很及时,非常适合我这种喜欢实时关注比赛的球迷。 点赞 回复
  • 2026年5月21日 张伟 平台的专家解读非常有见地,帮助我更深入地理解了比赛的战术和策略,观赛体验更上一层楼。 点赞 回复
  • 2026年5月20日 王芳 高清直播效果太棒了!在家就能看比赛,感觉就像在现场一样,非常过瘾。 点赞 回复

发表评论