新浪新闻

百亿英里数据门槛下,自动驾驶行业如何跨越长尾问题这座珠穆朗玛峰?

BigNews 01.14 17:10

当前自动驾驶行业正聚焦“百亿英里数据门槛”这一现实挑战,通过多路径协同攻关长尾问题,从真实数据规模扩张到仿真技术革新,再到因果推理与车路协同等创新方案并行突破。

一、数据规模:真实与仿真的双轨并进

海量真实数据积累

特斯拉领先实践:通过全球百万辆量产车持续收集道路数据,累计里程已突破70亿英里(城市场景超25亿英里),日均新增1400万英里,预计半年内突破百亿英里门槛。量产车规模形成数据采集的天然优势,但极端场景(如暴雨中横穿行人)仍需长期积累。

数据驱动闭环:车企通过用户车辆反馈的“影子模式”自动标注长尾场景,形成“问题发现-模型训练-OTA升级”的迭代闭环,逐步覆盖罕见案例。

合成数据与仿真突破

高保真仿真生成:英伟达开源Alpamayo仿真框架和1727小时全球多场景数据集,结合生成式模型(如Cosmos)合成极端天气、异形障碍物等低概率事件,弥补真实数据缺口。

测试效率革命:清华大学团队开发的D2RL智能测试系统,通过模拟“危险陪练车”主动暴露系统缺陷,使1公里仿真测试等效于实际道路1000-10000公里,加速验证效率超千倍。 马斯克:要实现安全的无监督自动驾驶,要 100 亿英里的训练数据

二、技术范式:从感知预测到因果推理跃迁

端到端模型融合因果链

决策可解释性突破:英伟达Alpamayo-R1模型通过“因果链推理(Chain of Causation)”技术,将驾驶决策与物理规律关联。例如识别“暴雨导致刹车距离延长”并自动调整跟车距离,在仿真测试中碰撞率降低25%。

多模态压缩优化:创新性压缩多摄像头token数量(单摄像头41.1个token),解决视觉语言模型(VLA)在车端算力瓶颈,实现99ms低延迟响应。

车路协同拓展感知边界

路侧智能赋能:通过ETC门架、激光雷达与5G-V2X技术构建路网级超视距感知(如提前1公里预警隧道事故),降低单车应对突发路况的复杂度,华为、华体科技已在多地试点。

三、算力与系统:支撑模型进化的底层基石

车端算力千TOPS时代

小鹏G7搭载2000TOPS算力平台,华为ADS 4.0要求车端算力达1000-2000TOPS,以运行本地化部署的VLA模型,确保极端环境无网络时实时决策。

自研芯片崛起:蔚来神玑NX9031、小鹏图灵芯片实现算力定制化,降低对英伟达的依赖。

云端训练与安全冗余

华为提出云端需100EFLOPS算力(百亿亿次级)训练扩散模型,以生成未来帧预测数据;同时构建“功能冗余”机制(如制动失效时转向差动补偿),替代传统硬件冗余。

四、商业化落地:L3破局与成本下探

政策开放与场景限定

中国批准长安、北汽L3车型在京渝高速路段试点,最高时速80km/h,要求驾驶员在ODD(设计运行域)外接管,明确事故责任划分。

车企聚焦“高频刚需场景”:特斯拉FSD主攻城市导航,百度萝卜快跑在22城提供Robotaxi服务,全无人订单周超25万单。

成本平民化加速

地平线推出征程6P芯片,推动10万元级车型普及城区NOA;Momenta与多家车企合作,通过数据共享降低算法研发成本。

五、行业共识与挑战

长尾问题本质:解决最后1%的极端场景需付出90%的研发努力,且依赖规模效应(如特斯拉百万级车队)和跨领域协同。

风险提示:因果推理模型、仿真数据的真实性仍需验证,且各国法规滞后于技术发展,L4全面落地或需至2030年。

当前路径已明确:真实数据规模化+仿真合成突破+因果推理赋能+车路协同互补,四维合力正系统性破解长尾难题。 (以上内容均由AI生成)

加载中...