小鹏智驾产品高级总监今天在微博上对小鹏的物理世界基座大模型,做了更进一步的解读,算是对近期一些行业观点的回应。
- 为什么要云端训练大模型,再蒸馏小模型?
她列举了三大原因,包括Scaling-Law,解决“模态不统一”,强化学习等。核心在于车端的算力限制,且车端的决策需要准确快速,让车端小模型尽可能承袭云端大模型的能力,相当于“吃过看过”,上限和下限都会更高。
- 为什么VLA必须放在车端,而不是云端?
超过 300ms 的控制延迟,就会导致风险,如果放在云端,会有极大的安全风险。她特别提到:“通过云端交互的VLA,可以演示,但是不建议拿来物理世界真实使用。” (似乎意有所指?)
- 为什么车端芯片很重要?
小鹏的自研芯片,算力大,适合跑大模型。而且小鹏认为,只有全栈自研才能联合设计硬件、软件、编译器和模型结构从而最大化全链路的效果。自研芯片的量产车(G7?),马上就要与大家见面了。
- 为什么小鹏会选择「轻雷达+重算力」?
这里小鹏依然用的是「轻雷达」,而不是「无雷达」。她总结三点原因:第一,去掉激光雷达节约了20%的感知算力;第二,小鹏云端基座模型参数量高达720亿;第三,小鹏的AI摄像头结合了Lofic技术,是车规级最高精的摄像头。
原文如下: