访谈人:Dr. Juergen Dickmann,DVN 高级顾问
DVN 始终致力于为 ADAS/AV 领域从业者及时传递传感器技术、系统架构及应用相关前沿资讯。本刊第二届 ADAS/AV 专题大会将于 11 月 16-18 日在斯图加特举办,本届大会将首次开设两用技术专题环节,以及《型式认证之路:攻克端到端人工智能系统》专题环节。为筹备本次大会,我们将通过本刊通讯推出独家系列访谈,聚焦该领域核心企业,分享其技术成果与行业观点。
本系列访谈的首篇内容,为 Wayve 最新车型试驾前瞻报道(链接:https://www.drivingvisionnews.com/news/2026/01/14/report-wayve-test-drive/)。自即日起至大会召开,我们将每 14 天推出一期后续访谈内容。
本期访谈,我们将为大家介绍该领域的头部企业之一 —— 英伟达。
以下为 DVN 对英伟达德国区汽车软件高级总监 Prof. Dr. Ralf Guido Herrtwich 的专访,内容围绕英伟达在 ADAS/AV 领域的发展规划与战略布局展开。
DVN‑Dickmann:如果用一句话概括英伟达在汽车领域的业务,你们具体向整车厂商与出行服务商提供什么?
Prof. Herrtwich:我们为汽车行业提供从车辆端到云端的人工智能解决方案,尤其面向自动驾驶领域。这包括开发工具、用于训练的高性能系统、仿真与测试平台,当然还有车载计算平台。
DVN‑Dickmann:在产品组合或市场覆盖方面,你们是否同时面向车队车辆和乘用车,也就是私人市场?
Prof. Herrtwich:L2、L2+、L2++ 这类技术正变得越来越普及和实用。将这些车辆升级到 L4,使其也能适用于车队场景,是顺理成章的下一步。从 L2++ 过渡到 L4,核心是要把安全理念和系统冗余提升到完全故障可运行的等级。感知与推理人工智能本身没有本质区别,关键差异在于底层的安全架构和冗余设计。车队应用通常还需要额外具备远程操控能力。
DVN‑Dickmann:也就是说,对你们而言这基本是一套 “通用型” 方案,只需小幅适配即可?我理解得对吗?
Prof. Herrtwich:更准确的说法是分层架构。人工智能核心保持一致,再根据不同应用场景增加相应的安全架构。我们把这些安全层称为 “NVIDIA Halos”,它们是人工智能底层的安全保障。
DVN‑Dickmann:大家经常问到的一个问题是:你们的方案在多大程度上不依赖特定硬件与传感器?你们一直有Hyperion平台,未来也可能有其他命名。但你们应该也可以为采用完全不同传感器配置的其他整车厂商提供服务吧?
Prof. Herrtwich:在片上系统(SoC)方面,我们采用的是英伟达自家硬件,这一点还请理解。该硬件历经多代迭代,且始终保持兼容。在传感器方面,我们则更为灵活。不过,引入一款新传感器需要重新采集数据并进行再训练,这会显著增加成本。因此,我们的 Hyperion 方案会针对特定应用与设计运行域(ODD),明确所需传感器的类型、数量和布置位置,并推荐我们与整车厂商合作伙伴已经过验证的传感器配置。除非有强烈的变更理由,否则复用已验证传感器的成本优势十分可观。
DVN‑Dickmann:你们目前的传感器套件是 Hyperion 10,依靠它可以覆盖当前所有 L2 到 L4 的运行设计域。如果未来传感器技术出现升级,例如从 16×16 成像雷达升级到真正的 32×32 成像雷达,你们是否会重新考虑传感器配置?英伟达是否会抓住这种优化机会,自行承担增量学习的成本?还是会继续沿用 Hyperion 0,直到遇到难以应对的场景或安全极限再重新规划?
Prof. Herrtwich:我们总体上是拥抱创新的。如果某项技术升级确实能提升性能或降低成本,我们就会采用。但只关注传感器单价可能产生误导。硬件上节省的少量成本,可能会带来数据采集与验证方面的巨额支出。相关决策必须从系统整体层面进行评估。
DVN‑Dickmann:这或许可以衔接下一个问题:一旦英伟达实现 L4 并掌握所需的设计运行域,L4 的发展就到此为止了吗,还是设计运行域会持续演进?几年后你们有望达到 Waymo 等深耕该领域数十年企业的水平,你们如何看待自身定位?届时是否需要依靠新传感器来形成差异化?还是说差异化只能通过人工智能实现?
Prof. Herrtwich:近年来人工智能的进步,特别是大语言模型与视觉‑语言‑动作模型,显著提升了系统能力。除了对车道、树木、行人等目标进行标注识别外,我们现在拥有基于因果关系训练的推理模型,例如能够判断球滚上路后可能有儿童跟随。这类场景的标注与训练过去难度极高,现在我们有了更便捷的工具。总体来看,过去几年推理能力的提升比传感器的渐进式升级带来的影响更大。
DVN‑Dickmann:请允许我再追问一下。在传感器技术方面,目前水平已经足以让你们在 L4 市场具备竞争力,驾驶功能的提升更多来自软件。这就引出一个问题:那企业为什么还要继续研发改进或新型传感器?你想表达的是这个意思吗?
Prof. Herrtwich:传感器在车辆上的集成仍然是一大挑战。行业不应只追求更高分辨率或更远探测距离,还可以更注重更好的集成布局、高性价比的整合方案、协同视场优化,并有可能在保持性能的前提下减少传感器总数量。
DVN‑Dickmann:从冗余角度,你如何看待传感器发展与传感器配置?关键词:纯视觉方案?
Prof. Herrtwich:冗余设计依然必不可少,包括不同传感器模态之间的冗余。尽管某些阶段对摄像头的依赖有所增强,但 L4 场景下采用纯视觉方案的可能性不大。
DVN‑Dickmann:在冗余和传感器数据合理性校验方面,中央架构是否有帮助?
如果我们把原始数据而非点云传输到中央处理器,所有传感器输入就可以任意融合,并采用不同算法处理,即可视为统计独立的输入。这是否也能实现传感器配置优化?也就是说,仅靠摄像头和雷达就能满足需求,从而节省激光雷达带来的高昂成本。你如何看待这一观点?
Prof. Herrtwich:我们强烈倾向于对传感器原始数据进行处理,因为滤波处理总会损失信息。计算性能的进步如今让集中式原始数据处理成为可能,这也可以让传感器本身保持更简洁的设计。能否完全舍弃激光雷达取决于具体应用场景;很多车辆在不使用激光雷达的情况下也能高效运行,但我们并不认为激光雷达已经过时。
DVN-Dickmann:从冗余角度来看,出于安全考虑,是否完全可以跳出以往的逻辑——即必须从三类传感器技术中至少选用两种来进行可靠性验证?
Prof. Herrtwich:传感器级冗余对L4而言很重要,但并不足够。我们的架构将一套可生成类人行驶轨迹的推理栈,与一套保障安全的传统规划栈相结合。如果愿意,你可以把推理栈看作系统中的创造性部分。
众所周知,AI系统的这种创造性有时会有些过度,进而导致可能不安全的行驶状况。我们必须思考如何应对这类情况。最终我们想到了一个非常简单的方案:借助此前研发中已有的、采用传统架构实现的自动驾驶软件栈(例如其规划模块),它可以输出安全的行驶轨迹。这套传统栈的问题在于,它行驶永远合规,但有时体验不够舒适。
我们现在的做法是,将推理模型生成的行驶轨迹,再用传统软件栈的输出结果进行一次校验过滤。这意味着传统栈会接收到它自身永远不会生成的轨迹,但它在任何情况下都能判断这些轨迹是否安全可行驶。
DVN-Dickmann:这是否意味着最终的决策单元最终会回归到传统软件?
Prof. Herrtwich:它起到的是安全过滤器的作用。目前它在相当一部分场景中都会介入,但随着推理模型不断完善,介入比例会逐步降低。尽管如此,从架构上看,这一安全层依然是基础,就像高空杂技演员下方的安全网。
DVN-Dickmann:但这正是关键所在。其他大力支持端到端架构的企业认为:我不再需要传统信号处理。如果我理解得没错,你们是将传统算法方案作为最终决策单元。这是否意味着创新瓶颈在于错误率为40%的AI方案,与大语言模型类似?
Prof. Herrtwich:如果我们的错误率真的是40%,情况才会是这样。但实际并非如此。我们的准确率按98%来算,需要过滤的情况大约只有2%。在系统经过几次迭代后,未来我们需要过滤的比例只会达到0.2%。
DVN-Dickmann:2026年CES发布相关信息后,市场对L4系统快速落地的障碍存在疑问,主要集中在注册与型式认证方面。其中一个焦点是,端到端软件被视为人工智能黑盒,而负责校验与场景生成的单元部分也属于人工智能黑盒。面对德国联邦机动车管理局(KBA)等监管机构对这种“黑盒互验”的担忧,该如何进行解释?
Prof. Herrtwich:它并非真正意义上的黑盒。训练数据经过严格筛选,且全程可追溯。在CES上,我们不仅开源了软件,还开源了数据与仿真工具。透明度能够提升开发社区与监管机构的信任和理解。
另外一点:你所说的“黑盒”,意味着无法知晓内部运行逻辑,但实际并非如此。训练数据经过大量精挑细选,且数据生成的难度已大幅降低。我记得梅赛德斯曾发起过一项大规模数据采集活动,专门收集鹿群横穿道路的场景。由于在真实环境中难以采集到足够样本,他们最终只能用大型毛绒鹿玩具来模拟这类场景。如今,在机器中生成这类数据要容易得多。
DVN-Dickmann:明白了。那这是否也意味着,在竞争差异化方面,尽管人工智能能力很强,但它只能基于训练数据进行生成,无法处理全新事物、或是“认知未知”——也就是完全未预见的情况。因此,实现差异化的关键,在于英伟达开发团队自身的经验?
Prof. Herrtwich:经验依然具有决定性。自动驾驶系统无法仅通过提示词指令人工智能来打造。开发者必须理解问题领域,并使用合适的工具。英伟达不仅提供训练、仿真和车载计算平台,还提供完整的生态系统,让开发者能够将人工智能训练导向关键的边缘场景。如今的输入数据来源包括真实数据、合成数据以及经过筛选的互联网数据,尤其适用于因果推理类场景。
DVN-Dickmann:最后一个问题:2030年之后,您个人以及英伟达认为最大的市场会是哪里?L2+、L4车队,还是L4私人乘用车市场?
Prof. Herrtwich:我一直认为,选择拥有私家车和不拥有私家车都各有其理由。对于私人车辆而言,随着规模扩大带来成本下降,自动驾驶功能将会越来越成为标配。虽然并非每辆车都会搭载L4功能,但大范围普及是现实可行的。整车厂商如何将这些功能进行产品化包装——作为标配还是选配——仍将是他们的战略选择。
DVN-Dickmann:那在车队领域呢?您认为这一领域会大幅增长吗?
Prof. Herrtwich:车队领域将会实现增长,因为其准入门槛会不断降低。随着越来越多的车辆具备这些功能,对于想要运营车队的人来说,只需采购一批自动驾驶车辆即可组建车队,难度大幅降低。无需再投入资金研发全套自动驾驶技术。同时可以自主选择是独立运营车队,还是接入优步等更大的体系中。在你提到的未来十年内,这方面的技术壁垒将会消失。
DVN-Dickmann:非常感谢,这次访谈让我收获良多。
Ralf,谢谢你深入分享英伟达的理念与对未来的展望。希望我们能在DVN大会上迎来英伟达的代表。