APP下载

关于ZAKER

合作

AutoLab 16分钟前

又一家抢滩发布 VLA，智能驾驶的 iPhone4 时刻真要来了吗？

2024 年 6 月，元戎启行总部门口突然立了一块 " 车辆左转不受灯控 " 的交通指示牌。

当时元戎启行的测试车遇到红灯就停了，后车因为看到标识而鸣笛催促。

这类场景无法通过传统端到端学习解决，必须依靠对文字的理解。

即便通过地图打 tag 也需要至少一周，而大模型则可以实时处理。

在这时候，元戎启行决定着手研发 VLA 模型。

其实在更早的 2023 年底 GPT-4 发布时，周光团队就意识到 GPT 是真正的跨时代突破：

它打破了我们对 AI 发展进程的认知，原来从弱 AI 到强 AI 可能只需要几年，而非过去认为的 50 年。GPT-4 不仅能理解图像，还能做出逻辑判断，例如告诉我们 " 这里可以左转 "。

周光甚至称：" 如果我们不转型为大模型驱动的公司，未来很可能面临降维打击。"

从去年 6 月着手研发到今天正式发布，元戎基于 VLA 模型的最新辅助驾驶系统已经正式落地，并且在今年已经收到了 5 款车型的 VLA 定点合作。

那么，理想、小鹏和元戎都在频繁提及的 VLA 是什么？它能给辅助驾驶带来哪些帮助？

什么是 VLA？

VLA 模型三个字母代表的分别是 Vision、Language、Action，即视觉 - 语 - 动作模型。

通过 VLA，汽车可以连接物理世界，通过对环境的了解，更好地帮人类开车。

这里很重要的一点是 L 的加入，正如开头的那个小故事，通过传统的模型，系统很难读懂 " 车辆左转不受灯控 " 的真正含义，也就无法解决这类场景。

但是语言模型的加入，就可以轻松化解。

举一反三，传统模型无法解决的潮汐车道、限时限行，VLA 都可以化解。

同时，基于 VLA 模型的端到端具有思维链的能，拥有更时序的推理能，对于实时复杂路况的处理能也会越强。

并且 VLA 模型摆脱了 " 盒效应 "，可解释性更强。

大家应该看过理想 VLA 展示的语音控车功能，元戎启行的 VLA 也有这类功能。

除了识别车外文字类标识，加入了语言模型的 VLA 也可以实现语音控车，" 司机感 " 更强。

但是周光称："VLA 最难的是思维链和长时序推理，这才是 VLA 真正的核心能力 "。

而今天元戎抢先发布的 DeepRoute IO 2.0 作为一个全品的平台，不仅搭载自研的 VLA 模型，也能够支持激光雷达、纯视觉方案，并且适配多芯片平台，适配多价格区间车型。

周光称，这套平台最低可以适配到 15 万级车型，甚至 10 万级车型也有希望搭载。

VLA 能给辅助驾驶带来哪些好处？

那么大家都在宣传的 VLA 模型，除了增加了能够读懂车外文字、听懂车内语音指令的能力，还能给辅助驾驶带来哪些提升？

我们上文提到，语音控车这类功能其实并非 VLA 核心能力，过去利用规则也可以做。

VLA 更有价值的是基于长时序推理和思维链，带来的复杂场景解决能力。

传统的端到端时序不够长，可以推理几秒内的路况，但是对复杂路况缺乏 " 弹性 "，而 VLA 支持高级语义理解和长时序因果推理，在面对复杂场景会有更好的表现。

另外对 VLA 也有更强的空间语义理解能力，举个例子：

基于 BEV 架构的端到端存在的天生劣势是，它在无法看到盲区后的环境情况下，系统就会认为 " 不存在 "。

而人类则会利用经验来判断这种遮挡关系，进而采取谨慎保守的策略通行。

采用 VLA 的系统，在这类场景上的处理能够更加拟人，核心原因就是感知潜在风险，主动对盲区进行 " 预防性预判 "，这就是我们常说的 " 防御性驾驶 "。

举一反三，在面对桥洞、复杂路口，甚至是公交车遮挡这类常见 case 时，VLA 所展现出的安全感、平顺性都要更好。

除了空间语义理解能力，VLA 也能让系统更快、更好地应对异形障碍物与非结构化障碍，响应的速度更快。

端到端与 VLA 并非对立的技术路径，在周光看来，真正的智能驾驶必须依赖大模型，未来必将全面转向基于 GPT 架构的端到端系统。

5 辆定点，VLA 即将迎来量产

元戎的辅助驾驶是在 2024 年 8 月量产的，在即将到来的 2025 年 9 月，元戎即将迎来 10 万台量产交付的里程碑时刻。

仅仅一年多时间，就有超 10 万台搭载元戎辅助驾驶的车型驰骋于大江南北。

周光谈到这一成绩的时候，除了自豪，还带有焦虑：随着交付量扩大，尤其是接近 10 万台的规模，我们面临更严格的市场监督。

早期千台、万台的阶段问题发生概率较低，但规模扩大后，任何问题都会被放大。"

与此同时，第一代端到端系统正逐渐触及性能瓶颈。于是，全新的 DeepRoute IO 2.0 应运而生。

VLA 无疑是今年智能驾驶圈最热门、被提及次数最多的词。也是各大车企、供应商抢占的高地，元戎率先量产意义重大，但是真正能够做成什么水平，给辅助驾驶带来多大提升，我们量产见分晓。

END

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

ZAKER旗下免费视频剪辑工具

预售16.98万起尚界H5预售18小时小订突破50000台

太平洋汽车网 4小时前

售35.98万起问界M8纯电版上市24小时大定突破10000台

太平洋汽车网 3小时前

腾势D9新版本将于成都车展上市豪华配置再升级

太平洋汽车网 6小时前

一代战神落幕！日产R35 GT-R最后一台车在日本下线

快科技 5小时前

成品油限价今晚下调，私家车加满一箱油将少花7元

21世纪经济报道 6小时前

华为小米比亚迪等谁能笑到最后！何小鹏：5年内行业淘汰赛最后会剩5家左右中国车企

快科技 7小时前

比亚迪泰国工厂首次出口电动车至欧洲近千辆海豚列阵太壮观

快科技 7小时前

1800cc水平对置6缸机！本田金翼50周年纪念版上市：至高40.88万

快科技 7小时前

全新GL8陆尊33.99万起售，综合续航最长达1450km

网通社汽车频道 50分钟前

全新智界双子星R7/S7，破局者驾临

autocarweekly 1小时前

东风本田新款艾力绅上市焕新价24.98-30.38万元

网通社汽车频道 5小时前

产销两旺新能源汽车半年新增17.9万家

中国网财经 6小时前

纯电SUV市场，问界M8要重新划线

21世纪经济报道 11小时前

探访岚图：六年下线20万辆，剑指欧洲核心市场

21世纪经济报道 14小时前

AutoLab

觉得文章不错，微信扫描分享好友

宙世代元宇宙

元宇宙党建解决方案

元宇宙文旅解决方案

元宇宙展厅解决方案

元宇宙行业峰会解决方案

元宇宙营销解决方案

元宇宙会展解决方案

元宇宙演艺节目解决方案

元宇宙博物馆解决方案

元宇宙图书馆解决方案

元宇宙校园解决方案

元宇宙企业展厅解决方案

元宇宙艺术展解决方案

元宇宙电商解决方案

融媒体解决方案

ZAKER智慧云

媒体解决方案

党建解决方案

公检法解决方案

智慧交通解决方案

高校解决方案

AI视频剪辑

AI视频剪辑

AI智能客服

AI工具箱

AI写稿助手

AI口语陪练

我的订阅

又一家抢滩发布 VLA，智能驾驶的 iPhone4 时刻真要来了吗？

宙世代

一起剪

相关阅读

预售16.98万起 尚界H5预售18小时小订突破50000台

售35.98万起 问界M8纯电版上市24小时大定突破10000台

腾势D9新版本将于成都车展上市 豪华配置再升级

一代战神落幕！日产R35 GT-R最后一台车在日本下线

成品油限价今晚下调，私家车加满一箱油将少花7元

华为小米比亚迪等谁能笑到最后！何小鹏：5年内行业淘汰赛 最后会剩5家左右中国车企

比亚迪泰国工厂首次出口电动车至欧洲 近千辆海豚列阵太壮观

1800cc水平对置6缸机！本田金翼50周年纪念版上市：至高40.88万

全新GL8陆尊33.99万起售，综合续航最长达1450km

全新智界双子星R7/S7，破局者驾临

最新销量榜！雷克萨斯ES稳居第一

东风本田新款艾力绅上市 焕新价24.98-30.38万元

产销两旺 新能源汽车半年新增17.9万家

纯电SUV市场，问界M8要重新划线

探访岚图：六年下线20万辆，剑指欧洲核心市场

最新评论

AutoLab

热门订阅 换一批

硅基星芒

预售16.98万起尚界H5预售18小时小订突破50000台

售35.98万起问界M8纯电版上市24小时大定突破10000台

腾势D9新版本将于成都车展上市豪华配置再升级

华为小米比亚迪等谁能笑到最后！何小鹏：5年内行业淘汰赛最后会剩5家左右中国车企

比亚迪泰国工厂首次出口电动车至欧洲近千辆海豚列阵太壮观

东风本田新款艾力绅上市焕新价24.98-30.38万元

产销两旺新能源汽车半年新增17.9万家

热门订阅换一批