分享好友 最新动态首页 最新动态分类 切换频道
北理工团队在激光雷达点云数据3D目标检测领域取得新突破
2024-12-26 10:08

该研究成果以题为“MsSVT++: Mixed-scale Sparse Voxel Transformer with Center Voting for 3D Object Detection”的论文形式发表在国际顶级期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》上。IEEE TPAMI作为人工智能、模式识别和图像处理等领域的顶级权威期刊,其影响因子为23.6,是中国计算机协会(CCF)推荐的人工智能领域A类期刊。论文的第一作者为北京理工大学李佳男副研究员,通讯作者为许廷发教授。

针对真实大规模场景中存在的远距离目标误检漏检和3D检测模型在精度和计算效率之间难以平衡的瓶颈问题,科研团队提出了一种全稀疏体素Transformer点云特征提取网络架构(MsSVT),如图1所示。该网络架构引入了混合尺度注意力机制,捕获感兴趣目标的局部细粒度几何信息与长程上下文信息;运用三维空间中非空体素的稀疏特性,仅对非空体素位置执行混合尺度注意力操作,从而提升了计算效率,实现了高效的激光雷达点云3D目标检测。

图1. MsSVT点云特征提取网络架构图

该方法基于混合尺度注意力机制的强大多尺度特征捕获能力(见图2(a)-(d)),在大规模Waymo数据集上的检测精度超过了同期性能最优的双阶段检测器。图2(e)-(f)展示了部分在Waymo数据集上的部分检测结果,该方法可以精确检测仅具有极度稀疏点云表示的远距离车辆目标,并在处理带有巨大尺度变化的密集行人时也表现出优异的性能。

图2. 注意力图(a)-(d)及目标检测结果可视化(e)-(f)

该研究成功克服了三维场景中由于远距离目标点云极度稀疏而导致的目标定位困难以及漏检等问题,实现了精度与计算效率的平衡,为真实大规模场景下基于激光雷达点云数据的3D目标检测及应用提供了方法和关键技术支持。

论文详情:J. Li, S. Cong, L. Ding and T. Xu, MsSVT++: Mixed-scale Sparse Voxel Transformer with Center Voting for 3D Object Detection, in IEEE Transactions on Pattern Analysis and Machine Intelligence, doi: 10.1109/TPAMI.2023.3345880.

论文链接:https://ieeexplore.ieee.org/document/10371785


附作者简介:

李佳男,博士,北京理工大学光电学院预聘助理教授(特别副研究员),新加坡国立大学博士后。主要从事光电成像目标探测与识别等方面的研究,主持国家自然科学基金等项目 5 项。以第一/共一作者发表IEEE TPAMI 4篇,IEEE TNNLS、CVPR等论文11篇,ESI高被引论文1篇;以通讯作者发表论文40余篇;谷歌学术总引4000余次。入选中国科协及北京市科协“青年人才托举工程”项目,获得中国图象图形学学会优秀博士学位论文,王大珩光学奖等荣誉。指导学生获得 ICCV 2021“反无人机跟踪”挑战赛国际冠军及最佳论文奖、第四届“空天杯”创新创意大赛二等奖、中国高等教育博览会“校企合作 双百计划”典型案例等。

许廷发,博士,国家一级重点学科“光学工程”学科责任教授,博士研究生导师。光电成像技术与系统教育部重点实验室主任,北京理工大学重庆创新中心智能化和大数据技术实验室主任。近年来带领其科研团队围绕光电成像探测与识别、计算成像和人工智能等领域不断深化研究。主持承担国家自然科学基金委重大科研仪器研制项目等50多项。在国际、国内等系列期刊发表学术论文190余篇,其中被SCI/EI收录100余篇。以第一发明人申请国家发明专利87项,已授权和公示35项。获省部级科技进步二等奖等奖项3项。指导研究生获得中国图象图形学学会优秀博士学位论文,二人次获得王大珩高校学生光学奖,二人次获得全国光学与光学工程博士生学术联赛全国百强,获得中国高等教育博览会“校企合作 双百计划”典型案例和重庆英才创新创业示范团队等荣誉称号。

最新文章
AI生成高清美女写真:如何用搜狐简单AI一键制作你的虚拟女友
限时免费,点击体验最近超火的AI生图神器,坐拥3000美女的大男主就是你! https://ai.sohu.com/pc/generate/textToImg?_trans_=030001_yljdaimn 在这个数字时代,生成照片的技术已经不再局限于传统的拍摄和后期处理。想象一下,你的手机或
Cp名称生成器网页版
● 读取外部存储允许程序读取外部存储,如SD卡上读文件● 获取网络状态获取网络信息状态,如当前的网络连接是否有效● 读取电话状态访问电话状态● 获取WiFi状态获取当前WiFi接入的状态以及WLAN热点的信息● 访问网络访问网络连接,可能产生GP
linux的基本命令--常用
一般在公司都有遇到要去一台只搭载来一个基本os的lunix服务器上,安装什么软件的情况,而公司环境一般不能直接连外网下载,只能通过文件上传上去,解压,安装等。 1、基本目录操作 命令格式:ls [- 选
macOS Monterey 12.1 (21C52) 官方正式版原版镜像
对于M1/M2/M3/M4芯片的电脑,如果软件官方未兼容 M1/M2/M3/M4,可以使用 Rosetta2 转译运行。在Apple Silicon ARM Mac电脑上安装Rosetta 2 运行intel应用苹果自家的M1和M2/M3/M4芯片都是ARM架构,所以M1和M2/M3/M4是完全通用的,未来就算有
2023第四季度全球手机出货量报告:苹果登顶、小米第三、华为实现三位数增长!
2月28日消息,市场调查机构Counterpoint Research近日发布2023年第四季度市场监测报告,2023年第4季度全球智能出货量达到3.232亿部,同比增长7%,环比增长8%。据报告数据显示,苹果在2023年第四季度同比增长2%,出货量达到23%,超越三星成
2019nba最强中锋排名(nba最强中锋榜历史)
1、nba五十大中锋2、说一下我心中最强的NBA现役中锋都有谁?3、NBA十大中锋是哪些?4、NBA历史上,最强的中锋球员,分别是哪些人?5、NBA现役实力最强的中锋球员,分别是哪些人?6、如果评选NBA最强的现役十大中锋,谁会入选呢?乔治·迈肯作为中锋
AI如何落地生花?中国电信的答案来了!
飞象网原创(高靖宇/文)人工智能(AI)作为数字化转型的核心动力,正在以前所未有的速度重塑各个行业,尤其是推动了通信行业与其他领域的深度融合。AI赋能下,通信行业从传统的“连接服务提供者”转变为“智能解决方案的引领者”,在AI浪
ChatGPT掀起技术狂潮 “顶流”之下,看人工智能喜与忧
  目前,ChatGPT还没有通过图灵测试的评估。其实,迄今为止,还没有人工智能模型能真正通过图灵测试。  去年11月,美国人工智能研究公司OpenAI发布了一款名为ChatGPT的聊天机器人,其在推出后的几周内就风靡全球,甚至引发了一场新的全
Java最全40K+Star!Mall电商实战项目开源,附源码、教程合集,java面试资料推荐
很多人感叹“学习无用”,实际上之所以产生无用论,是因为自己想要的与自己所学的匹配不上,这也就意味着自己学得远远不够。无论是学习还是工作,都应该有主动性,所以如果拥有大厂梦,那么就要自己努
相关文章
推荐文章
发表评论
0评