首页> 新闻列表> 正文

北京车展极越潘云鹏:智能体都要具备自我复盘或者自我迭代的能力

作者:丁祎

日期:2024-04-30 22:25

阅读:21679

2024年北京车展上极越汽车旗下的第二款车型——极越07首发亮相,并将于下半年正式上市。发布会后极越展台,极越智能软件副总裁潘云鹏先生分享了极越在产品上的一些思考。

202405102237589853.JPG

潘云鹏表示,极越作为汽车机器人,AI定义汽车,如果之前讲的是基于逻辑的推理,之前软件定义汽车的年代是推理,我们现在更多的是AI定义汽车,需要的东西不一样,我们需要见多识广,需要背更多的英文题,这里需要高算力,包括高质量的数据和大量的参数模型。scaling Laws,主要讲的是在算力一定的情况下,更多的数据更高的参数,往往会带来更好的效果,还是遵循这个Scaling Laws往前发展,中文翻译是大力出奇迹,更多的数据,更多的算力往往有更好的性能。

202405102238013042.JPG

极越在开发智能化的时候,就是以AI定义产品形态,定义汽车机器人的基础和能力,就像李彦宏提到的未来机器人的形态有可能是一辆车。我们当时定义汽车机器人所具备的三大基础能力,包括自然交流、自由移动、自我成长。自然交流,就像现在你一言我一语非常自然的沟通;自由移动是高阶智能驾驶的能力。自我成长是通过数据,统一用户的反馈,把这个产品做的越来越好,有更好的语感,这是自我成长的能力。整个极越01在打造产品的时候最基本的AI核心,简单的产品架构,我们分三个部分,红色紫色和蓝色的,红色的部分是自然交流的部分,我们最底层的AI核心能力是全端侧的语音,大家知道我们的8295在中国少量量产,后面越来越多的车也搭载了8295,我们这个8295使用了完整的两个NPU的配置,高配中的高配。允许我们把一些大模型经过智能(NPU)的方法,Push到车端,这是全端侧的语义。

它具备几个特点,第一,多模态,大家看到打开那扇窗,有摄像头的数据,能解决在高速开窗,噪音比较大的时候的识别率。第二,全端侧,算力高,可以达到500毫秒的极速响应,它不需要云端交互,可以很快给出一条执行的指令。第三,因为它的全端侧,所以隐私上有天然的保护,对用户的隐私保护意识也比较友好。

所有的语音交互都是全端侧的,比较直观的感受就是反应快,我们在全端侧部署了文心一言模型,所以整个人车的交互发生了如此大的变化,这也解释了为什么现在每辆极越01的智能语音日均交互达到63次,因为一来一回像乒乓球一样,很容易就把迭代的交互次数变多了,你会发现它的整个回应,包括它的整个执行都是符合预期,非常稳定的预期。

202405102238001013.jpg

在智能驾驶方面,潘云鹏表示,现在很多厂商推出了没有激光雷达的方案,我们在开发极越01的时候,一开始也是接有激光雷达的,在保险杠灯下面的位置。后来,我们决定要去掉激光雷达,因为从人类驾驶的模式来看,头顶上也没顶一个主动光传感器,基本还是通过视觉,人脑手脚配合形成一个动作。我们车上的摄像头包括毫米波雷达的覆盖范围比人类广,它完全可以替代掉额外的激光雷达,完成驾驶的动作。激光雷达作为一个比较精益的光学传感器,它在使用的过程当中,也会对环境比较敏感,售后的维修成本自然也会水涨船高,总体有前后成本的差别。当激光雷达给的结果和其它感知的结果不一致的时候,就会非常纠结,而且激光得满足光学基本的物理属性,在一些有金属表面反射比较强的场景之下,必须得消除伪影和鬼影,这些东西的整个长尾效应比较明显,需要导入大量的成本。

总体来讲,我们发现有没有激光雷达对用户的体验,特别是安全方面,没有任何的变化。我们后来决定资源聚焦,先把帽子扔到墙里,所以我们做了这么一个比较坚决的决定。

去年10月27号发布这款车1.1版本,到现在的1.4版本,以及即将推出的1.5版本,每一个版本都会发现它的视觉性能,包括智驾的体验都极大提升,这也印证了我们当年对视觉路线的判断,一旦拐点到来之后,它的迭代周期频率更敏捷。大家看紫色的线是我们纯视觉的方案,切线会更抖,上升的更快。我们发现2024年是拐点到来,也是“涌现”的一年,这里既表示性能上的涌现,也是玩家上的“涌现”,最近大家发现头部玩家和其他厂商也陆续发布了自己纯视觉的方案,我们发现玩家越来越多,赛道也越来越拥挤的现象。

  我们在极越01上对这些模型做了重构,意味着我们有一个比较大的基础模型,合并之后,这个基础模型具备几个能力,第一,具备在线绘图的能力,是帮助我们去泛化,去开城,主要是应对地图数据没有那么完善,信息没有那么准确的时候,它可能做一些实时线图,这是为什么我们可以很快开放全国的原因之一。

第二,目标监测和持续跟踪,我们对于行人进入视野,到被遮挡再出来,整个过程中,可以对行人的目标轨迹,或者对行人的识别,可以做到持续的追踪,持续的预测,这样会让车有一些预处理的能力,而不是突然变成鬼探头的场景。

第三,OCC的占用网络。之前的感知必须得先认识它是个什么样的障碍物。而极越是避开这个逻辑,不需要识别它是什么样的障碍物,可以直接看到在目前的行驶区域或者行驶路径被遮挡,它能够自然绕开,它能极大的提升障碍物检测和安全性能。

最后是场景理解,基于所有基础能力的加持,可以对每帧视频的数据做出最准确的判断,跟看图说话类似,可以帮助智驾在预测和沟通的过程中,做出更好的判断。

202405102237593842.JPG

在自我成长上,潘云鹏表示:极越01量产以来,我们收到4万条Simo的反馈,大家在用车过程中,只要说:Simo我有几个问题,或者是:Simo我要吐槽,SIMO就可以把用户当时描述的场景或者当时的问题反馈回来。我们发现通过AI的能力,分类越来越准,我们现在对问题分类能力的准确率,部分已经到了98%以上。

我们以1.4为例,共修复了5500多个反馈,在每一次用户反馈的同时,修复的同时,用户的满意度也在提高,产品质量越来越好,这也是整个Simo问题闭环的逻辑。 这是PPA开通之后整个的渗透率,我们整体的PPA的日均渗透率到了50%左右,超越了几个超一线城市或者一线城市。在5月中旬发布之后将覆盖一百城,后续很快拓到300城,到2024年,所有的乡间道路都能开。

  • 点赞
  • 收藏
相关评论
查看更多
相关车系
相关推荐