北京车展极越潘云鹏：智能体都要具备自我复盘或者自我迭代的能力

下载App

首页> 新闻列表> 正文

北京车展极越潘云鹏：智能体都要具备自我复盘或者自我迭代的能力

作者：丁祎

日期：2024-04-30 22:25

阅读：21846

2024年北京车展上极越汽车旗下的第二款车型——极越07首发亮相，并将于下半年正式上市。发布会后极越展台，极越智能软件副总裁潘云鹏先生分享了极越在产品上的一些思考。

潘云鹏表示，极越作为汽车机器人，AI定义汽车，如果之前讲的是基于逻辑的推理，之前软件定义汽车的年代是推理，我们现在更多的是AI定义汽车，需要的东西不一样，我们需要见多识广，需要背更多的英文题，这里需要高算力，包括高质量的数据和大量的参数模型。scaling Laws，主要讲的是在算力一定的情况下，更多的数据更高的参数，往往会带来更好的效果，还是遵循这个Scaling Laws往前发展，中文翻译是大力出奇迹，更多的数据，更多的算力往往有更好的性能。

极越在开发智能化的时候，就是以AI定义产品形态，定义汽车机器人的基础和能力，就像李彦宏提到的未来机器人的形态有可能是一辆车。我们当时定义汽车机器人所具备的三大基础能力，包括自然交流、自由移动、自我成长。自然交流，就像现在你一言我一语非常自然的沟通；自由移动是高阶智能驾驶的能力。自我成长是通过数据，统一用户的反馈，把这个产品做的越来越好，有更好的语感，这是自我成长的能力。整个极越01在打造产品的时候最基本的AI核心，简单的产品架构，我们分三个部分，红色紫色和蓝色的，红色的部分是自然交流的部分，我们最底层的AI核心能力是全端侧的语音，大家知道我们的8295在中国少量量产，后面越来越多的车也搭载了8295，我们这个8295使用了完整的两个NPU的配置，高配中的高配。允许我们把一些大模型经过智能（NPU）的方法，Push到车端，这是全端侧的语义。

它具备几个特点，第一，多模态，大家看到打开那扇窗，有摄像头的数据，能解决在高速开窗，噪音比较大的时候的识别率。第二，全端侧，算力高，可以达到500毫秒的极速响应，它不需要云端交互，可以很快给出一条执行的指令。第三，因为它的全端侧，所以隐私上有天然的保护，对用户的隐私保护意识也比较友好。

所有的语音交互都是全端侧的，比较直观的感受就是反应快，我们在全端侧部署了文心一言模型，所以整个人车的交互发生了如此大的变化，这也解释了为什么现在每辆极越01的智能语音日均交互达到63次，因为一来一回像乒乓球一样，很容易就把迭代的交互次数变多了，你会发现它的整个回应，包括它的整个执行都是符合预期，非常稳定的预期。

在智能驾驶方面，潘云鹏表示，现在很多厂商推出了没有激光雷达的方案，我们在开发极越01的时候，一开始也是接有激光雷达的，在保险杠灯下面的位置。后来，我们决定要去掉激光雷达，因为从人类驾驶的模式来看，头顶上也没顶一个主动光传感器，基本还是通过视觉，人脑手脚配合形成一个动作。我们车上的摄像头包括毫米波雷达的覆盖范围比人类广，它完全可以替代掉额外的激光雷达，完成驾驶的动作。激光雷达作为一个比较精益的光学传感器，它在使用的过程当中，也会对环境比较敏感，售后的维修成本自然也会水涨船高，总体有前后成本的差别。当激光雷达给的结果和其它感知的结果不一致的时候，就会非常纠结，而且激光得满足光学基本的物理属性，在一些有金属表面反射比较强的场景之下，必须得消除伪影和鬼影，这些东西的整个长尾效应比较明显，需要导入大量的成本。

总体来讲，我们发现有没有激光雷达对用户的体验，特别是安全方面，没有任何的变化。我们后来决定资源聚焦，先把帽子扔到墙里，所以我们做了这么一个比较坚决的决定。

去年10月27号发布这款车1.1版本，到现在的1.4版本，以及即将推出的1.5版本，每一个版本都会发现它的视觉性能，包括智驾的体验都极大提升，这也印证了我们当年对视觉路线的判断，一旦拐点到来之后，它的迭代周期频率更敏捷。大家看紫色的线是我们纯视觉的方案，切线会更抖，上升的更快。我们发现2024年是拐点到来，也是“涌现”的一年，这里既表示性能上的涌现，也是玩家上的“涌现”，最近大家发现头部玩家和其他厂商也陆续发布了自己纯视觉的方案，我们发现玩家越来越多，赛道也越来越拥挤的现象。

我们在极越01上对这些模型做了重构，意味着我们有一个比较大的基础模型，合并之后，这个基础模型具备几个能力，第一，具备在线绘图的能力，是帮助我们去泛化，去开城，主要是应对地图数据没有那么完善，信息没有那么准确的时候，它可能做一些实时线图，这是为什么我们可以很快开放全国的原因之一。

第二，目标监测和持续跟踪，我们对于行人进入视野，到被遮挡再出来，整个过程中，可以对行人的目标轨迹，或者对行人的识别，可以做到持续的追踪，持续的预测，这样会让车有一些预处理的能力，而不是突然变成鬼探头的场景。

第三，OCC的占用网络。之前的感知必须得先认识它是个什么样的障碍物。而极越是避开这个逻辑，不需要识别它是什么样的障碍物，可以直接看到在目前的行驶区域或者行驶路径被遮挡，它能够自然绕开，它能极大的提升障碍物检测和安全性能。

最后是场景理解，基于所有基础能力的加持，可以对每帧视频的数据做出最准确的判断，跟看图说话类似，可以帮助智驾在预测和沟通的过程中，做出更好的判断。

在自我成长上，潘云鹏表示：极越01量产以来，我们收到4万条Simo的反馈，大家在用车过程中，只要说：Simo我有几个问题，或者是：Simo我要吐槽，SIMO就可以把用户当时描述的场景或者当时的问题反馈回来。我们发现通过AI的能力，分类越来越准，我们现在对问题分类能力的准确率，部分已经到了98%以上。

我们以1.4为例，共修复了5500多个反馈，在每一次用户反馈的同时，修复的同时，用户的满意度也在提高，产品质量越来越好，这也是整个Simo问题闭环的逻辑。这是PPA开通之后整个的渗透率，我们整体的PPA的日均渗透率到了50%左右，超越了几个超一线城市或者一线城市。在5月中旬发布之后将覆盖一百城，后续很快拓到300城，到2024年，所有的乡间道路都能开。