近日,小鹏汽车官方表示,小鹏P7+的车位到车位功能已于2024年12月31日开启先锋智驾团推送,后续会进一步扩大推送范围,全量上线时间预计2025年1月底于XOS 5.5.0正式版推送。
图源:新浪微博(@小鹏汽车)
实际上随着新年的步入,车企在智驾方面的比拼,也从之前的“全国都能开”转向“车位到车位、门到门”等追求实现全场景的智能驾驶体验,而能否尽快全量推送则已成为当前智驾最新的评价标准。目前,包括华为、理想、小米、极氪等多个企业,都已进入“车位到车位”的竞争场。
在极氪智能科技CMO关海涛看来,2024年智能驾驶技术的核心竞争点在于城市无图NOA,2025年,E2E(端到端)、D2D(车位到车位)及L3级别自动驾驶将成为竞争焦点。
不只车企如此,对于自动驾驶公司而言,“车位到车位”功能也是他们下一个需要重点展示的关键能力。近日,元戎启行方面对《每日经济新闻》记者表示,公司计划在2025年一季度向部分种子用户推送“车位到车位”的功能。
“车位到车位”成智驾新赛点
2024年,端到端技术路线在智能驾驶行业中逐渐成为主流趋势。从技术层面来看,端到端大模型的引入让智驾系统具备了更强的适应能力,能够更加精准地应对各种多变和复杂的驾驶场景。而从市场角度来看,车企的竞争焦点也发生了转变,不再单纯地比拼城区NOA功能的开城数量,而是更加注重为用户提供优质的驾驶体验。借助“车位到车位”功能,车企能够向用户展示智驾系统在全场景下的连贯性与完整性,以及其实际应用的价值。
据记者观察,2024年4月,华为车BU发布采用端到端架构的ADS 3.0,并提出“车位到车位”概念,该功能于同年8月随问界S9正式推出。此后,国内车企纷纷跟进。例如,小米汽车在2024年11月的广州车展上展示了其“车位到车位”的智驾能力,并于11月16日开启定向内测邀请,12月底开始先锋版推送;极氪发布了其D2D车位到车位领航辅助功能,预计2025年1月左右分批推送;特斯拉FSD也于近期更新了“车位到车位”功能。
从字面理解,“车位到车位”功能是从任意一个车位出发,经过各种复杂场景,最终到达另一个车位的全程自动驾驶能力。这一功能的出现,标志着智能驾驶技术从“全国都能开”的广泛覆盖,向“从A点开到B点”的精准使用价值转变。
不过,尽管各家车企都在积极推出“车位到车位”功能,但对这一功能的理解和实现方式存在差异。比如,理想汽车强调其端到端大模型应用下,系统可以自主通行ETC,且不限范围、无需学习,全国超1万个收费站均可识别通行;小鹏汽车则更注重智驾应对复杂路况的连贯性与完整性,其车辆能够在整个“车位到车位”过程中,应对复杂路口、汇流变道、识别并避让特种车辆,实现U型掉头等特殊操作,做到全程无接管。
结合目前已经发布的车企功能,“车位到车位”至少包括全场景覆盖、应对复杂路况和连接泊车功能等核心能力。全场景覆盖指的是打通停车场到公开道路、公开道路到园区、园区地面到地下车库等多种场景,其中过闸机能力成为关键词,如自主通行ETC;应对复杂路况则强调智驾在复杂路况下的连贯性与完整性,能够应对复杂路口、汇流变道等场景,实现全程无接管;连接泊车功能意味着驾驶员坐进车内即可启动智驾,系统在自动驾驶与泊车无缝协作下,到达下一个停车位。
至于如何实现上述功能,目前行业分化为几种路线:一种是以理想汽车为代表,遵循“VPA(记忆泊车/代客泊车)+NOA(智驾领航)+VPA(记忆泊车/代客泊车)”的技术路径,即在停车场路段,驱动系统行驶的是记忆泊车/代客泊车模式,而驶入公开道路后,则立刻转变为智驾领航模式;另一种则是以特斯拉、小鹏为代表,用一套模式打通全场景,即无论是在园区封闭路段、地下停车场区域还是在公开路段,显示界面一直保持智驾NOA画面,不会随场景变化切换软件系统。
端到端进入2.0阶段
业界普遍认为,2024年标志着端到端技术的1.0阶段,这一阶段主要是将传统的基于手写规则的感知和规控系统转变为基于神经网络的智能化系统。进入2025年,端到端技术将正式迈入2.0阶段,专注于实现多模态融合感知,从而使系统能够更精准地识别和理解复杂路况。
在端到端2.0阶段,“车位到车位”功能逐渐成为衡量端到端性能的关键指标之一。某种程度上,车位到车位功能已经成为评估车企智能驾驶能力的重要试金石。与此同时,众多投身于端到端技术浪潮的头部企业,正面临着从技术路径的收敛走向路径分化的关键节点。
值得注意的是,就端到端智驾而言,目前行业主要分为一段式和两段式两个流派。其中,华为、百度Apollo、小鹏汽车等企业采用的是两段式方法,即将感知模块视为一段,而将预测到决策模块视为另一段;商汤科技、Momenta等则是“一段式端到端”的支持者,主张将感知与规控端到端模块全部打通,实现更紧密的集成和协同工作。
另一边从技术路线思考,端到端技术路径也开始进行转变。此前备受追捧的“端到端+VLM(视觉语言模型)”开始向“VAL(Vision-Language-Action,视觉-语言-动作)模型”迭代。其中,端到端+VLM的方案由理想汽车在2024年中提出,两个模型分工协作,端到端模型负责处理常规的驾驶行为,VLM模型则负责应对高难度的极端场景。
VAL模型最早由Google DeepMind提出,是一个融合了视觉、语言和动作的多模态模型,旨在提高模型的泛化能力和判断推理能力,可以简单看作是端到端+VLM系统的一个全面融合体。在国内,元戎启行等主要自动驾驶公司已经开始采用这一模型。
元戎启行CEO周光在接受记者采访时表示:“VAL模型是端到端技术的2.0版本。”他进一步解释称,在面对复杂的交通规则、潮汐车道、长时序推理等特殊场景时,VAL模型能够比以往的系统更好地理解和应对。例如,在推理时长方面,传统的基于规则(rule-based)方案只能推理1秒钟的路况信息并做出决策控制;端到端1.0阶段的系统能够推理未来7秒的路况,而VAL模型则能够对几十秒的路况进行推理,显著提升了自动驾驶系统的决策能力和适应性。
事实上,无论是采用一段式端到端还是VLA模型,背后都意味着对资源的进一步消耗。模型参数越大,对硬件算力和数据闭环的迭代能力要求就越高。有观点认为,部署VLA模型对芯片算力的要求提升到英伟达DRIVE Thor级别,算力达750 TOPS。相比之下,当前高阶智驾的算力硬件通常配备的是2颗英伟达OrinX芯片,总算力为508 TOPS。
“当前自动驾驶技术正处于迈向L3级的转折点,大规模商业化应用仍聚焦于L2及L2+级别,同时在传感器、芯片与决策算法等核心技术上获得了一定突破,因此市场将逐步将这部分技术突破推向C端市场。”艾睿铂大中华区汽车咨询业务合伙人章一超在接受记者采访时表示,而车企对于不同技术的表达,主要还是因为智驾已成为衡量当前车企能力的重要指标。智驾技术的发展不仅关系到车辆的安全性和驾驶体验,还直接影响到车企在市场中的竞争力。
(文章来源:每日经济新闻)