分享好友 最新动态首页 最新动态分类 切换频道
端到端、世界模型、车路云……谁将成为2025年“AI+交通”最热词?
2024-12-29 18:28

1942年,科幻小说家艾萨克·阿西莫夫(Isaac Asimov)在他的短篇小说《转圈圈》(Runaround)中第一次明确提出了“机器人三定律”,这一定律也被称为“现代人工智能技术的基石”。

阿西莫夫可能没有完全预见到,八十年后的世界会多么接近他的科幻梦想。

如今,人们生活在一个由人工智能渗透的世界里,这个世界在许多方面已超越阿西莫夫的想象。2024年,我们见证了一系列人工智能技术的创新与涌现。从AI视频生成模型Sora到GPT-4o,一系列生成式人工智能新技术相继问世、更新迭代,让人感觉到似乎“未来已来”。

这一年,大模型、端到端、世界模型、车路云等已成为交通智能化领域最具革命性的技术应用,不仅提升了驾驶体验,还为城市交通的安全性、效率和可持续性带来新的可能。

对照着自动驾驶领域这几年的行业热词按图索骥,可以把握自动驾驶算法模型的发展脉络。在特斯拉的带动下,自2021年至今,自动驾驶行业这几年的动态热词依次为:BEV+Transformer、OCC占用网络、无图NOA、端到端。

BEV(鸟瞰图)网络通过矢量化的鸟瞰视角检测白名单障碍物,OCC通过体素化的占用网络预测3D空间的占位情况,实现对通用障碍物的感知,到无图NOA的阶段,自动驾驶算法可以通过车道网络实时建图,构建道路拓扑。

再到今年大火的端到端,一方面,由于消除了传统分模块方案中各种小模型的冗余,计算资源得以集约化使用,神经网络的参数量或规模得以进一步提升;另一方面,无论是分段式端到端还是一体式端到端,感知到决策之间的传输带宽增加,信息损失减少,进一步增强了系统的感知能力。

对于驾驶而言,感知交通环境信息越全面、越及时,驾驶的安全性也就相对越高。因此,自动驾驶系统对感知能力的需求是没有上限的。

数据正在成为端到端最大瓶颈

相较于分模块的自动驾驶方案,端到端方案主要解决了两个问题。首先,从人工逻辑代码到数据驱动,人工智能真正摆脱了“人工”,从此可以使用海量的数据迭代模型的性能;其次,通过自动抽取信息,减少信息损失,可以充分利用数据中的信息。

端到端最核心的一点在于将自动驾驶算法进行了全面的AI化,转向了完全的数据驱动,但这意味着需要更加海量的数据进行模型的训练。

但对于到底需要多少数据才能训练出一个完美的自动驾驶模型,业界并没有一个统一的标准。之前有报道称,特斯拉2024年初的视频训练片段数量将近3000万个。按照每个视频片段30秒、30FPS的帧率、8个摄像头计算,训练图片数量高达220亿张。

此外,这种规模的训练数据训练出来的自动驾驶系统的等级仍未达到L3,自动驾驶系统能力每提高一个等级,需要的训练数据量至少会提升一个数量级,也就是说,要达到L4,至少需要训练几亿个视频片段。

端到端虽然强化了数据的作用,但大模型的引入却增加了庞大的数据标注需求。在基于语言模型的自动驾驶大模型中,其输入是当前驾驶场景的图片,其输出是各类交通参与者、道路拓扑、交通信号标识的语义信息,这种模型不具备自回归特性,进行有监督学习,其训练需要海量的数据标注工作。

这引发了一个新的问题:如果端到端自动驾驶模型的训练还需要继续打标签,在源源不断产生的海量数据面前,还如何保证高效训练?这也是一直以来影响端到端进一步发展的最大阻碍。

世界模型实现从感知到认知的跃迁

无论是BEV检测的白名单障碍物还是OCC占用网络检测的通用障碍物,从本质上来说,都属于基于判别式AI实现的对分立物体的单独感知。

生成式AI大模型具备的超强理解能力使得视觉语言模型、大语言模型、世界模型可以建立对当下场景的整体认知,实现从感知到认知的阶跃。

举例来说,BEV可以检测到一个行人,大模型可以通过意图理解判断出这是一个要横穿马路的行人。BEV网络可以检测到前方的一个车辆,大模型可以更进一步,通过长时序信息判断出这是一个即将减速的车辆。

也就是说,在基于判别式AI的物体识别之外,生成式AI的意图理解和长时序理解能力使其可以建立对整体驾驶环境的理解,更加贴近人类驾驶的知识逻辑。

自动驾驶真正的挑战并不在于能否检测(感知)出各个独立的物体,而是要准确判断(认知)物体的意图,根据车辆、行人微妙多变的姿态做出准确的博弈和决策,只有建立了这样复杂的语义理解和场景理解能力,才能像老司机那样游刃有余地驾驭各种路况。而从部分到整体,从分立到连续,从感知到认知,正是大模型给传统自动驾驶感知技术栈带来的重大转变。

同时,通过从历史数据中生成预测情景,世界模型不仅规避了数据收集和标注带来的限制,还增强了在模拟环境中训练自主系统的能力,这些环境可以反映甚至超越现实世界条件的复杂性。

这种方法预示着一个新时代的到来,在这个时代,自动驾驶汽车具备反映某种直觉的预测能力,使它们能够以前所未有的复杂程度响应各类交通环境。

世界模型可以通过模拟和预测其他车辆、行人和动态环境变化,从而帮助自主系统做出更安全、更高效的驾驶决策。例如,世界模型可以预测交通流量、路况变化以及潜在的风险因素,使自动驾驶车辆能够提前做出反应,避免事故和优化行驶路径。

尽管世界模型已经表现出巨大的技术潜力,但其发展和应用仍面临挑战。

首先,是数据的多样性和质量。世界模型依赖大量高质量的数据进行训练和测试。然而,获取和处理这些数据往往需要耗费大量时间和资源。如何确保模型从多样化和高质量的数据中学习,是下一阶段世界模型在发展过程中迫切需要解决的问题。

其次,巨量的计算资源需求。训练和运行世界模型需要大量的计算资源,特别是在处理高维数据和复杂场景时。

第三,模型的可解释性。世界模型的复杂性使其决策过程难以解释和理解,这将在医疗诊断、自动驾驶等应用场景中可能带来潜在风险。

车路云,一个正在发生的潮流

如果说以上自动驾驶技术都是“舶来品”,那么车路云一体化则是一个带有鲜明“中国智慧”的技术方案。

2024年,是车路云一体化全面落地的里程碑年份。面对汽车智能化、网联化的大势所趋,中国率先提出车路云一体化与智能网联汽车融合发展的新路径,并发挥中国在统筹规划、基础设施建设、信息通信技术等方面的优势,积极开展试点。

1月,工业和信息化部、公安部、交通运输部等五部门联合印发《关于开展智能网联汽车“车路云一体化”应用试点的通知》,这是“车路云一体化”首次被写入国家政策文件。7月,五部门正式对外公布《关于智能网联汽车“车路云一体化”应用试点城市名单的通知》,共计20个城市进入试点,从南到北、由西至东覆盖全国。

道路上布设的智能路侧设施如AI数字道路基站、V2X通信设备能够实时监测路况,通过多源数据融合技术,将不同类型、不同来源的数据进行有机整合,从而为后续的数据分析提供更丰富的素材。

根据车百智库研究报告显示,一辆L4级别自动驾驶汽车,每日通过车内外传感器采集的行驶数据、环境数据和行为数据等,已达到10TB量级,是传统汽车的5-10倍。其预计,在路上行驶的智能汽车每年上传到云端的数据超过7万PB。

在收集到海量的交通数据之后,云端利用大数据和AI算法,对数据进行分析与挖掘,从中提取有价值的信息。例如,通过对交通流量进行数据分析,交管部门可以根据实时交通流和道路情况智能调整配时方案,提高道路通行效率。同时,车辆也能接收到车路云网络的信息,提前了解道路上的障碍和危险,从而采取相应措施确保行车安全。

最新文章
Apple 苹果 iPhone X 智能手机屏幕测评报告
平均色温:屏幕在灰阶范围内的平均色温值,在NTSC-1978、Adobe RGB或sRGB色彩测试中,主流以D65,6500K为标准,也存在或存在过D75,7500K或NTSC-J 9300K标准,但不常用。色温偏高,色调将偏冷[蓝],色温低则色调偏暖[黄],由于目前已证明LE
360借条协商缓催延期还款的流程和技巧
360借条协商缓催延期还款一、 了解360借条催收机制及逾期后果360借条作为一款便捷的网络借贷平台,其催收机制也相对完善。一旦借款人逾期未还款,平台会采取一系列催收措施,这些措施的强度会随着逾期时间的延长而逐渐加大。初期,可能只是
cms系统简介与测试技巧.pdfVIP
cms系统简介与测试技巧-CAL-FENGHAI.-(YICAI)-CompanyOne1Cms系统的定义CMS具有许多基于模板的优秀设计,可以减少开发的成本。CMS的功能并不只限于文本处理,它也可以处理图片、Flash动画、声像流、图像甚至电子邮件档案。CMS还分各个平台
Emby开心版安装教程 windows emby完全使用指南
1.在图片上显示文本时,特别是使用内存设备显示动态文本时,文本显示(如GUI_DispString("Op Fancy's Blog");)背景默认是桌面背景。  (小记:桌面背景默认时黑色,可以通过调用如GUI_SetBkColor(GUI_WHITE);将桌面背景色设置为白色。)
AnyDoor任意门 – 完美服装替换,一键换装,实现图片上任意元素的挪移变幻,效果出色!!!
AnyDoor的命名灵感来源于其功能与神奇的“任意门”相似,能够实现物体的即时移动。AnyDoor 是一款创新的AI工具,能够将任何对象(如人物、动物或物品)无缝集成到新的图像或视频场景中。这款扩散的图像生成器,借助先进的算法,实现了在用
4款AI自动生成 PPT 神器,甩开你的同龄人
毕业论文答辩、工作项目汇报……都离不开PPT制作。我问一下各位,你做一份PPT需要多长时间?毫无疑问,时间单位必然以小时甚至天来计算。现在,你可以仅花费不到几分钟的时间,ai自动生成一份堪称完美的PPT。今天给大家推荐几个ai自动生成p
AI智能是什么呢?
AI(Artificial Intelligence)就是人工智能,通俗理解就是模拟人的意识、思维的信息过程。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。目前关于AI的划分,大致可以分为三大类型。1、AI芯片加持代表:麒麟970我们最熟悉
displaytester中文版烧屏修复软件下载
display tester汉化版是烧屏残影修复app,手机烧屏完美恢复工具app,是很好用的烧屏修复检测软件。可以帮助我们用户测试并查询你的屏幕是否有问题的应用,检测完成还支持快速修复。例如屏幕不灵敏,或者是颜色有问题等等,致力于帮助和解决
AI虚拟模特换装软件实测,一键生成男装,女装模特试穿
AI模特生成软件实测,一键生成内衣、男装,女装模特试穿!直接上图!1、快速设计迭代:AI模特换装通过智能化技术,使设计师能够迅速对模特的服装进行更换和调整,大幅度缩短了设计迭代周期。在快速变化的时尚行业中,这一功能让企业能够及
2023年人工智能上市公司龙头股一览(2023/2/16)
  人工智能上市公司龙头股有:  长安汽车000625:人工智能龙头股。  2月15日消息,长安汽车5日内股价下跌1.54%,今年来涨幅上涨9.6%,最新报13.650元,市盈率为29.04。  1月20日消息,长安汽车主力资金净流入2.21亿元,超大单资金
相关文章
推荐文章
发表评论
0评