毫末智行是如何用重感知路线解自动驾驶这道题的？

2020年，蔚来率先向用户交付了NOP功能，即导航辅助驾驶。几乎同时，以华为、毫末智行为首的供应商也应势入局，随后，小鹏、理想纷纷跟进，“辅助驾驶”行业变得热闹非凡。

但是，发展了两三年，各家车企也都是在不断地完善优化功能体验，其适用范围并没有得到真正的扩大。导航辅助驾驶真正的价值场景仍然是在封闭的高速上。“进城”，困难似乎比想象中更大。

问题出在了什么地方？

想要解答这个问题的答案，我们需要从功能本身出发。现如今国内的导航辅助驾驶功能想要正常运作需要一个前提条件，即该路段需要具备高精度地图数据。

但是高精度地图的采集过程相对来说比较繁杂，首先，只有具备相关资质的图商才能够进行高精度地图的测绘。同时，采集车需要进行改装，车上布满了激光雷达、摄像头、GNSS等传感器和设备，其次，采集到的数据还要进行加工、标注，最终上传，流程复杂，成本昂贵。

况且，各家测绘机构的测绘车等物资都比较有限，想要实现全国大大小小路段的高精度数据全覆盖，是一件非常困难的事情。更何况，后期还有巨大的维护成本。

高精度地图确实能够为自动驾驶提供感知补充、地图围栏、辅助控制、超视距的路径规划等信息。但是弊端则在于它的更新频次太慢，车企一旦依赖上这根“拐杖”，想要快速“跑起来”就会比较困难。

于是在最近一段时间内，各家车企纷纷对外表达了“去高精度地图化”的想法。

2022年 5 月，余承东曾在接受媒体采访时明确表示，自动驾驶未来不过分依赖高精地图、车路协同。在2023年2月接受采访时，他再次重申这一理念，余承东表示，今年一定会上不依赖高精地图的智能驾驶。车企想要获得好的智驾用户体验，就需要华为供应不依赖高精地图的智能驾驶。

何小鹏也在2023年1月份的小鹏汽车全员信上提出，2023年的X-NGP辅助驾驶要抛掉高精地图。

而更早提出这一概念的是毫末智行。

2022年4月，毫末智行提出要做重感知的城市智能驾驶，降低智能驾驶中高精地图的权重，乃至做到无需高精地图。

以“重感知”为基底的技术路线突然得到了认可，而最早提出这一技术路线的毫末能力如何？

重感知，自动驾驶的技术基底

高精地图更新频次太低，无法满足智能驾驶的需求。另外，毫末智行CEO顾维灏也曾提出过一个非常有意思的观点：高精度地图提供的是道路先验信息，但是它并不稳定，总是施工。如果你把它当做是激光雷达，且这个激光雷达总是施工不可用，那它的置信度当然就会被降低。

所以车端的感知能力就变得至关重要。

在感知模型方面，毫末智行是国内最早使用基于Transformer大模型的自动驾驶公司之一。Transformer最早是由谷歌团队提出，并用于NLP（自然语言处理）领域，被用来处理序列文本数据。特斯拉最早将这一网络模型应用于视觉处理任务。这一模型对于图像的处理能力显著高于过去常用的RNN网络，数据量越大，Transformer处理效果越好，非常匹配自动驾驶的图像处理需求。

与特斯拉一样，毫末也基于时序Transformer模型在BEV环视空间上做了虚拟实时建图，通过这种方式让车道线的感知输出更加稳定和准确。

技术需要通过产品落地。

在乘用车领域，毫末已经推出了三代乘用车辅助驾驶解决方案HPilot。这里我们可以着重了解第三代智能驾驶HPilot3.0。

在功能性上，HPilot3.0可根据导航提供的行驶路线，在城市环境下实现自动变道超车、红绿灯识别与控车、复杂路口通行、无保护左右转等功能。

在场景上，HPilot3.0可以应对车辆近距离切入、车辆阻塞占道、交叉路口、环岛、隧道、立交桥等复杂的城市交通场景。

这些场景看似常规，但想要实现与人类一样的驾驶策略和能力，想要在感知上下很多功夫。我们可以拿日常最常见的红绿灯举例，红绿灯识别难点主要在于检测目标小、状态会变化（闪烁等）；同时不同地区的红绿灯形状也不同，当然最能难的还是“绑路”的问题，通俗地说，红绿灯对应哪条路，这里面包含了语义理解，人有时都会判断错误，更何况机器。

针对这一场景，毫末采用的是用大量的数据去训练，通过图像合成和迁移学习，来加快技术的更新。毫末为此设计了独创“双流”感知模型，将红绿灯检测和绑路问题分解成两个通道。通俗地讲，这个模型有两路通道，一路是检测物体（是什么，即 what），一路理解空间、位置关系（即 where）。

HPilot3.0 的功能以及涵盖的场景能力基本覆盖了日常用车的所有场景。对于加塞、无保护左转以及环岛等路况、场景都具备应对的能力。可以说HPilot 3.0就是为了实现城市场景的点到点高阶辅助驾驶而生。

同时，毫末也提出了一个概念，那就是“量产城市辅助驾驶”。汽车的基础功能是自由移动，所以辅助驾驶的实现场景必须具备高度的拓展性，也就是“量产能力”。在进展方面，毫末计划将有序地在 100 个城市完成城市 NOH 落地。快速布局的背后，是毫末重感知路线的技术基底“可普及”的功劳。

智驾时代，数据闭环为王

重感知的背后除了算法之外，还需要大量的数据积累和闭环处理能力。

但是大家都知道，感知虽重要，但是自动驾驶想要不断进化，就需要大量的数据进行“喂养”。特斯拉与毫末存在一个相同认知：人通过观察、学习和实践来提高驾驶能力，而非通过高精度数据辅助信息。所以，想要做好自动驾驶，就需要从第一性原理出发，让AI进行大量的数据训练，以此提高“开车的技术”。为此，毫末构建了MANA数据智能体系，数据量上，毫末的 MANA数据智能体系已基本完成数据闭环，超过47万小时，其虚拟驾龄相当于人类司机5.6万年。

数据管理能力方面，毫末历经两年研发，建立了全套面向大规模训练的Data Engine，让GPU持续饱和运行，实现了百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500微秒。

另外关于数据还有一点不得不提，那就是量产真实路测。截止今年1月，毫末三代HPilot产品搭载至魏牌、坦克、欧拉、长城炮等近20款车型，同时，辅助驾驶用户行驶里程突破3332万公里。

当数据积累到一定量时，就需要构建自己的智算中心，来训练数据和大模型。特斯拉之所以能够不断进化，很大一部分原因在于其数据量和超算中心的不断积累和训练。

在2023年1月的第七届HAOMO AI DAY上，毫末智行宣布智算中心“雪湖·绿洲”（MANA OASIS）正式成立。MANA OASIS是中国自动驾驶行业最大智算中心，由毫末智行与火山引擎联合打造，每秒浮点运算达67亿亿次，存储带宽每秒2T，通信带宽每秒800G。

在这样能力的加持下，MANA OASIS让毫末拥有了超强的计算能力，同时，数据和算力的充沛，才能打磨出更强的产品——MANA OASIS让毫末拥有了超强的计算能力，同时，数据和算力的充沛，才能打磨出更强的产品。在MANA OASIS的加持下，视觉自监督大模型、3D 重建大模型、多模态互监督大模型、动态环境大模型和人驾自监督认知大模型等毫末MANA五大模型全新亮相升级，助力毫末自动驾驶高速发展。2023年2月17日，毫末更是宣布自动驾驶认知大模型（人驾自监督认知大模型）正式升级为“DriveGPT”，这也是全球首个自动驾驶认知大模型。

可以说，毫末是为数不多的能将数据玩明白的自动驾驶公司。

高算力，需要更强大的朋友圈

在量产智能驾驶行业，只有特斯拉实现了软硬件的全栈自研。在过往的一段时间内，特斯拉采用的视觉路线，在智能硬件上的要求相对不高，且核心的芯片也是掌握在自己手里。

但是现阶段国内行业的情况是，单打独斗很难实现成功。只有结合上下游，整合行业优秀的资源，才有可能打造好的功能产品。

毫末在过去一段时间内，广交好友。智能硬件上，毫末与多家供应商达成合作。在芯片方面，毫末智行联合高通推出的可量产自动驾驶计算平台。其使用了高通Snapdragon Ride平台下首发5nm高通骁龙8540+7nm高通骁龙9000方案，平台单板算力达360 TOPS，可持续升级到1440 TOPS。

毫末还在去年宣布了“6P开放合作模式”，毫末智行坚定与车企共创模式，而非供应模式。毫末将提供从全栈解决方案、云端服务、硬件、软件、模块、原型代码6个产品层面的合作方式。

通过“6P开放合作模式”，合作方可以选择采用毫末的全栈解决方案；可以选择在数据智能云端服务层面与毫末合作；也可以选择软件或硬件层面，或者模块级别的合作；甚至可以选择和毫末进行原型代码级别的定制。“6P开放合作模式”就是在全栈解决方案到原型代码定制之间的6个产品层面，都可以用更开放的方式，灵活性非常高。

写在最后

在自动驾驶业务上，率先提出重感知、率先布局智能数据体系、智算中心的构建，都展现了毫末领先于行业的嗅觉和技术脚步。

虽然智能驾驶行业已经“卷”了很多年，但是当小鹏、理想这样的车企，以及毫末智行、华为这样的供应商都在积极布局新技术路线时，行业的竞争势必会再度升级。

而未来智能汽车竞争的核心就在于智驾与智舱的能力，对于可普及、可快速布局的NOH方案来说，将会有很大竞争力。所以，我们有理由期待，毫末在走上低成本、适应能力更强的重感知路线后的强势表现。

幸福双城资讯网

毫末智行是如何用重感知路线解自动驾驶这道题的？

42号车库