端到端、世界模型、车路云……谁将成为2025年“AI+交通”最热词?

   日期:2024-12-29    作者:wlswzxjzpc 移动:http://ljhr2012.riyuangf.com/mobile/quote/80491.html

1942年,科幻小说家艾萨克·阿西莫夫(Isaac Asimov)在他的短篇小说《转圈圈》(Runaround)中第一次明确提出了“机器人三定律”,这一定律也被称为“现代人工智能技术的基石”。

阿西莫夫可能没有完全预见到,八十年后的世界会多么接近他的科幻梦想。

如今,人们生活在一个由人工智能渗透的世界里,这个世界在许多方面已超越阿西莫夫的想象。2024年,我们见证了一系列人工智能技术的创新与涌现。从AI视频生成模型Sora到GPT-4o,一系列生成式人工智能新技术相继问世、更新迭代,让人感觉到似乎“未来已来”。

这一年,大模型、端到端、世界模型、车路云等已成为交通智能化领域最具革命性的技术应用,不仅提升了驾驶体验,还为城市交通的安全性、效率和可持续性带来新的可能。

对照着自动驾驶领域这几年的行业热词按图索骥,可以把握自动驾驶算法模型的发展脉络。在特斯拉的带动下,自2021年至今,自动驾驶行业这几年的动态热词依次为:BEV+Transformer、OCC占用网络、无图NOA、端到端。

BEV(鸟瞰图)网络通过矢量化的鸟瞰视角检测白名单障碍物,OCC通过体素化的占用网络预测3D空间的占位情况,实现对通用障碍物的感知,到无图NOA的阶段,自动驾驶算法可以通过车道网络实时建图,构建道路拓扑。

再到今年大火的端到端,一方面,由于消除了传统分模块方案中各种小模型的冗余,计算资源得以集约化使用,神经网络的参数量或规模得以进一步提升;另一方面,无论是分段式端到端还是一体式端到端,感知到决策之间的传输带宽增加,信息损失减少,进一步增强了系统的感知能力。

对于驾驶而言,感知交通环境信息越全面、越及时,驾驶的安全性也就相对越高。因此,自动驾驶系统对感知能力的需求是没有上限的。

数据正在成为端到端最大瓶颈

相较于分模块的自动驾驶方案,端到端方案主要解决了两个问题。首先,从人工逻辑代码到数据驱动,人工智能真正摆脱了“人工”,从此可以使用海量的数据迭代模型的性能;其次,通过自动抽取信息,减少信息损失,可以充分利用数据中的信息。

端到端最核心的一点在于将自动驾驶算法进行了全面的AI化,转向了完全的数据驱动,但这意味着需要更加海量的数据进行模型的训练。

但对于到底需要多少数据才能训练出一个完美的自动驾驶模型,业界并没有一个统一的标准。之前有报道称,特斯拉2024年初的视频训练片段数量将近3000万个。按照每个视频片段30秒、30FPS的帧率、8个摄像头计算,训练图片数量高达220亿张。

此外,这种规模的训练数据训练出来的自动驾驶系统的等级仍未达到L3,自动驾驶系统能力每提高一个等级,需要的训练数据量至少会提升一个数量级,也就是说,要达到L4,至少需要训练几亿个视频片段。

端到端虽然强化了数据的作用,但大模型的引入却增加了庞大的数据标注需求。在基于语言模型的自动驾驶大模型中,其输入是当前驾驶场景的图片,其输出是各类交通参与者、道路拓扑、交通信号标识的语义信息,这种模型不具备自回归特性,进行有监督学习,其训练需要海量的数据标注工作。

这引发了一个新的问题:如果端到端自动驾驶模型的训练还需要继续打标签,在源源不断产生的海量数据面前,还如何保证高效训练?这也是一直以来影响端到端进一步发展的最大阻碍。

世界模型实现从感知到认知的跃迁

无论是BEV检测的白名单障碍物还是OCC占用网络检测的通用障碍物,从本质上来说,都属于基于判别式AI实现的对分立物体的单独感知。

生成式AI大模型具备的超强理解能力使得视觉语言模型、大语言模型、世界模型可以建立对当下场景的整体认知,实现从感知到认知的阶跃。

举例来说,BEV可以检测到一个行人,大模型可以通过意图理解判断出这是一个要横穿马路的行人。BEV网络可以检测到前方的一个车辆,大模型可以更进一步,通过长时序信息判断出这是一个即将减速的车辆。

也就是说,在基于判别式AI的物体识别之外,生成式AI的意图理解和长时序理解能力使其可以建立对整体驾驶环境的理解,更加贴近人类驾驶的知识逻辑。

自动驾驶真正的挑战并不在于能否检测(感知)出各个独立的物体,而是要准确判断(认知)物体的意图,根据车辆、行人微妙多变的姿态做出准确的博弈和决策,只有建立了这样复杂的语义理解和场景理解能力,才能像老司机那样游刃有余地驾驭各种路况。而从部分到整体,从分立到连续,从感知到认知,正是大模型给传统自动驾驶感知技术栈带来的重大转变。

同时,通过从历史数据中生成预测情景,世界模型不仅规避了数据收集和标注带来的限制,还增强了在模拟环境中训练自主系统的能力,这些环境可以反映甚至超越现实世界条件的复杂性。

这种方法预示着一个新时代的到来,在这个时代,自动驾驶汽车具备反映某种直觉的预测能力,使它们能够以前所未有的复杂程度响应各类交通环境。

世界模型可以通过模拟和预测其他车辆、行人和动态环境变化,从而帮助自主系统做出更安全、更高效的驾驶决策。例如,世界模型可以预测交通流量、路况变化以及潜在的风险因素,使自动驾驶车辆能够提前做出反应,避免事故和优化行驶路径。

尽管世界模型已经表现出巨大的技术潜力,但其发展和应用仍面临挑战。

首先,是数据的多样性和质量。世界模型依赖大量高质量的数据进行训练和测试。然而,获取和处理这些数据往往需要耗费大量时间和资源。如何确保模型从多样化和高质量的数据中学习,是下一阶段世界模型在发展过程中迫切需要解决的问题。

其次,巨量的计算资源需求。训练和运行世界模型需要大量的计算资源,特别是在处理高维数据和复杂场景时。

第三,模型的可解释性。世界模型的复杂性使其决策过程难以解释和理解,这将在医疗诊断、自动驾驶等应用场景中可能带来潜在风险。

车路云,一个正在发生的潮流

如果说以上自动驾驶技术都是“舶来品”,那么车路云一体化则是一个带有鲜明“中国智慧”的技术方案。

2024年,是车路云一体化全面落地的里程碑年份。面对汽车智能化、网联化的大势所趋,中国率先提出车路云一体化与智能网联汽车融合发展的新路径,并发挥中国在统筹规划、基础设施建设、信息通信技术等方面的优势,积极开展试点。

1月,工业和信息化部、公安部、交通运输部等五部门联合印发《关于开展智能网联汽车“车路云一体化”应用试点的通知》,这是“车路云一体化”首次被写入国家政策文件。7月,五部门正式对外公布《关于智能网联汽车“车路云一体化”应用试点城市名单的通知》,共计20个城市进入试点,从南到北、由西至东覆盖全国。

道路上布设的智能路侧设施如AI数字道路基站、V2X通信设备能够实时监测路况,通过多源数据融合技术,将不同类型、不同来源的数据进行有机整合,从而为后续的数据分析提供更丰富的素材。

根据车百智库研究报告显示,一辆L4级别自动驾驶汽车,每日通过车内外传感器采集的行驶数据、环境数据和行为数据等,已达到10TB量级,是传统汽车的5-10倍。其预计,在路上行驶的智能汽车每年上传到云端的数据超过7万PB。

在收集到海量的交通数据之后,云端利用大数据和AI算法,对数据进行分析与挖掘,从中提取有价值的信息。例如,通过对交通流量进行数据分析,交管部门可以根据实时交通流和道路情况智能调整配时方案,提高道路通行效率。同时,车辆也能接收到车路云网络的信息,提前了解道路上的障碍和危险,从而采取相应措施确保行车安全。


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号