毫末智行是如何用重感知路线解自动驾驶这道题的?

42号车库 2023-03-01 18:23:52

2020年,蔚来率先向用户交付了NOP功能,即导航辅助驾驶。几乎同时,以华为、毫末智行为首的供应商也应势入局,随后,小鹏、理想纷纷跟进,“辅助驾驶”行业变得热闹非凡。

但是,发展了两三年,各家车企也都是在不断地完善优化功能体验,其适用范围并没有得到真正的扩大。导航辅助驾驶真正的价值场景仍然是在封闭的高速上。“进城”,困难似乎比想象中更大。

问题出在了什么地方?

想要解答这个问题的答案,我们需要从功能本身出发。现如今国内的导航辅助驾驶功能想要正常运作需要一个前提条件,即该路段需要具备高精度地图数据。

但是高精度地图的采集过程相对来说比较繁杂,首先,只有具备相关资质的图商才能够进行高精度地图的测绘。同时,采集车需要进行改装,车上布满了激光雷达、摄像头、GNSS等传感器和设备,其次,采集到的数据还要进行加工、标注,最终上传,流程复杂,成本昂贵。

况且,各家测绘机构的测绘车等物资都比较有限,想要实现全国大大小小路段的高精度数据全覆盖,是一件非常困难的事情。更何况,后期还有巨大的维护成本。

高精度地图确实能够为自动驾驶提供感知补充、地图围栏、辅助控制、超视距的路径规划等信息。但是弊端则在于它的更新频次太慢,车企一旦依赖上这根“拐杖”,想要快速“跑起来”就会比较困难。

于是在最近一段时间内,各家车企纷纷对外表达了“去高精度地图化”的想法。

2022年 5 月,余承东曾在接受媒体采访时明确表示,自动驾驶未来不过分依赖高精地图、车路协同。在2023年2月接受采访时,他再次重申这一理念,余承东表示,今年一定会上不依赖高精地图的智能驾驶。车企想要获得好的智驾用户体验,就需要华为供应不依赖高精地图的智能驾驶。

何小鹏也在2023年1月份的小鹏汽车全员信上提出,2023年的X-NGP辅助驾驶要抛掉高精地图。

而更早提出这一概念的是毫末智行。

2022年4月,毫末智行提出要做重感知的城市智能驾驶,降低智能驾驶中高精地图的权重,乃至做到无需高精地图。

以“重感知”为基底的技术路线突然得到了认可,而最早提出这一技术路线的毫末能力如何?

重感知,自动驾驶的技术基底

高精地图更新频次太低,无法满足智能驾驶的需求。另外,毫末智行CEO顾维灏也曾提出过一个非常有意思的观点:高精度地图提供的是道路先验信息,但是它并不稳定,总是施工。如果你把它当做是激光雷达,且这个激光雷达总是施工不可用,那它的置信度当然就会被降低。

所以车端的感知能力就变得至关重要。

在感知模型方面,毫末智行是国内最早使用基于Transformer大模型的自动驾驶公司之一。Transformer最早是由谷歌团队提出,并用于NLP(自然语言处理)领域,被用来处理序列文本数据。特斯拉最早将这一网络模型应用于视觉处理任务。这一模型对于图像的处理能力显著高于过去常用的RNN网络,数据量越大,Transformer处理效果越好,非常匹配自动驾驶的图像处理需求。

与特斯拉一样,毫末也基于时序Transformer模型在BEV环视空间上做了虚拟实时建图,通过这种方式让车道线的感知输出更加稳定和准确。

技术需要通过产品落地。

在乘用车领域,毫末已经推出了三代乘用车辅助驾驶解决方案HPilot。这里我们可以着重了解第三代智能驾驶HPilot3.0。

在功能性上,HPilot3.0可根据导航提供的行驶路线,在城市环境下实现自动变道超车、红绿灯识别与控车、复杂路口通行、无保护左右转等功能。

在场景上,HPilot3.0可以应对车辆近距离切入、车辆阻塞占道、交叉路口、环岛、隧道、立交桥等复杂的城市交通场景。

这些场景看似常规,但想要实现与人类一样的驾驶策略和能力,想要在感知上下很多功夫。我们可以拿日常最常见的红绿灯举例,红绿灯识别难点主要在于检测目标小、状态会变化(闪烁等);同时不同地区的红绿灯形状也不同,当然最能难的还是“绑路”的问题,通俗地说,红绿灯对应哪条路,这里面包含了语义理解,人有时都会判断错误,更何况机器。

针对这一场景,毫末采用的是用大量的数据去训练,通过图像合成和迁移学习,来加快技术的更新。毫末为此设计了独创“双流”感知模型,将红绿灯检测和绑路问题分解成两个通道。通俗地讲,这个模型有两路通道,一路是检测物体(是什么,即 what),一路理解空间、位置关系(即 where)。

HPilot3.0 的功能以及涵盖的场景能力基本覆盖了日常用车的所有场景。对于加塞、无保护左转以及环岛等路况、场景都具备应对的能力。可以说HPilot 3.0就是为了实现城市场景的点到点高阶辅助驾驶而生。

同时,毫末也提出了一个概念,那就是“量产城市辅助驾驶”。汽车的基础功能是自由移动,所以辅助驾驶的实现场景必须具备高度的拓展性,也就是“量产能力”。在进展方面,毫末计划将有序地在 100 个城市完成城市 NOH 落地。快速布局的背后,是毫末重感知路线的技术基底“可普及”的功劳。

智驾时代,数据闭环为王

重感知的背后除了算法之外,还需要大量的数据积累和闭环处理能力。

但是大家都知道,感知虽重要,但是自动驾驶想要不断进化,就需要大量的数据进行“喂养”。特斯拉与毫末存在一个相同认知:人通过观察、学习和实践来提高驾驶能力,而非通过高精度数据辅助信息。所以,想要做好自动驾驶,就需要从第一性原理出发,让AI进行大量的数据训练,以此提高“开车的技术”。为此,毫末构建了MANA数据智能体系,数据量上,毫末的 MANA数据智能体系已基本完成数据闭环,超过47万小时,其虚拟驾龄相当于人类司机5.6万年。

数据管理能力方面,毫末历经两年研发,建立了全套面向大规模训练的Data Engine,让GPU持续饱和运行,实现了百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500微秒。

另外关于数据还有一点不得不提,那就是量产真实路测。截止今年1月,毫末三代HPilot产品搭载至魏牌、坦克、欧拉、长城炮等近20款车型,同时,辅助驾驶用户行驶里程突破3332万公里。

当数据积累到一定量时,就需要构建自己的智算中心,来训练数据和大模型。特斯拉之所以能够不断进化,很大一部分原因在于其数据量和超算中心的不断积累和训练。

在2023年1月的第七届HAOMO AI DAY上,毫末智行宣布智算中心“雪湖·绿洲”(MANA OASIS)正式成立。MANA OASIS是中国自动驾驶行业最大智算中心,由毫末智行与火山引擎联合打造,每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。

在这样能力的加持下,MANA OASIS让毫末拥有了超强的计算能力,同时,数据和算力的充沛,才能打磨出更强的产品——MANA OASIS让毫末拥有了超强的计算能力,同时,数据和算力的充沛,才能打磨出更强的产品。在MANA OASIS的加持下,视觉自监督大模型、3D 重建大模型、多模态互监督大模型、动态环境大模型和人驾自监督认知大模型等毫末MANA五大模型全新亮相升级,助力毫末自动驾驶高速发展。2023年2月17日,毫末更是宣布自动驾驶认知大模型(人驾自监督认知大模型)正式升级为“DriveGPT”,这也是全球首个自动驾驶认知大模型。

可以说,毫末是为数不多的能将数据玩明白的自动驾驶公司。

高算力,需要更强大的朋友圈

在量产智能驾驶行业,只有特斯拉实现了软硬件的全栈自研。在过往的一段时间内,特斯拉采用的视觉路线,在智能硬件上的要求相对不高,且核心的芯片也是掌握在自己手里。

但是现阶段国内行业的情况是,单打独斗很难实现成功。只有结合上下游,整合行业优秀的资源,才有可能打造好的功能产品。

毫末在过去一段时间内,广交好友。智能硬件上,毫末与多家供应商达成合作。在芯片方面,毫末智行联合高通推出的可量产自动驾驶计算平台。其使用了高通Snapdragon Ride平台下首发5nm高通骁龙8540+7nm高通骁龙9000方案,平台单板算力达360 TOPS,可持续升级到1440 TOPS。

毫末还在去年宣布了“6P开放合作模式”,毫末智行坚定与车企共创模式,而非供应模式。毫末将提供从全栈解决方案、云端服务、硬件、软件、模块、原型代码6个产品层面的合作方式。

通过“6P开放合作模式”,合作方可以选择采用毫末的全栈解决方案;可以选择在数据智能云端服务层面与毫末合作;也可以选择软件或硬件层面,或者模块级别的合作;甚至可以选择和毫末进行原型代码级别的定制。“6P开放合作模式”就是在全栈解决方案到原型代码定制之间的6个产品层面,都可以用更开放的方式,灵活性非常高。

写在最后

在自动驾驶业务上,率先提出重感知、率先布局智能数据体系、智算中心的构建,都展现了毫末领先于行业的嗅觉和技术脚步。

虽然智能驾驶行业已经“卷”了很多年,但是当小鹏、理想这样的车企,以及毫末智行、华为这样的供应商都在积极布局新技术路线时,行业的竞争势必会再度升级。

而未来智能汽车竞争的核心就在于智驾与智舱的能力,对于可普及、可快速布局的NOH方案来说,将会有很大竞争力。所以,我们有理由期待,毫末在走上低成本、适应能力更强的重感知路线后的强势表现。

0 阅读:26

42号车库

简介:Hey, it‘s 42HOW. 用最简单的方式读懂未来汽车。