(1)根据图像衍生而得,比如通过双目相机,
(2)基于光探测距离和测距系统比如lidar,
(3)基于RGB-D相机获取点云,
(4)Synthetic Aperture Radar (SAR)系统获取。
基于这些不同的原理系统获取的点云数据,其数据的特征和应用的范围也是多种多样。
一、图像衍生点云
用于真实场景,但由于标注的局限性,研究很少。数据集也很少。
传统的摄影测量计算中采用半自动人机交互方式生成三维点,具有严格的几何约束和较高的测量精度。由于人工操作,非常耗时。在测量和遥感行业中,这些早期形成的“点云”被用于绘制和生成数字地表模型(DSM)和数字高程模型(DEM)。一般只能生成2.5D点云。
稠密匹配法、多视角立体视觉(MVS)和运动恢复结构(SfM)改变了图像衍生的点云,开启了多视角立体视觉的时代。SfM可以自动估计相机的位置和方向,使其能够同时处理多视图图像,而稠密匹配法和MVS算法提供了生成大量点云的能力。
缺点:SfM和MVS的点云质量不如传统摄影测量或LiDAR技术生成的点云质量好,对于大区域尤其不可靠。
卫星相机能够在短时间内以相对较低的成本绘制大区域的地图,成为图像衍生点云的重要数据源。
二、LiDAR
激光雷达,一种测量和遥感技术。应用:建筑物(因为由规则平面构成,可应用于分割)、森林
原理:利用激光测量传感器和被测物体之间的距离。大多基于脉冲的测量原理。根据传感器和平台的不同,从每平方米不到10个点到每平方米数千个点,点云密度或分辨率差异很大。
根据平台不同进行分类:
1、机载激光雷达扫描ALS在机载平台上运行。获取成本高。典型数据集:Vaihingen点云语义标注数据集。
2、TLS,也称为静态激光雷达扫描,使用安装在三脚架上的固定传感器进行扫描。优势是能够提供真实、高质量的三维模型。通常用于小型城市或森林的建模,以及遗产或艺术品文档。
3、MLS在地面上的移动车辆上运行,最常见的平台是汽车。高精地图的生成是MLS最重要的应用,即自动驾驶的研究与开发。
4、ULS系统通常部署在无人机或其他无人飞行器上。便宜、灵活。可以提供较短距离的激光雷达测量应用,以更高的精度收集更密集的点云。由于其平台体积小、重量轻,ULS具有很高的操作灵活性。除获取DSM,在农林测量、灾害监测和采矿测量方面具有优势。
在激光雷达扫描中,由于系统始终随平台运动,(GNSS)和惯性测量单元(IMU)数据相结合,以保证高质量的点云匹配。
三、RGB-D 深度图像传感器
主要应用在室内环境,平面分割任务,有多个数据集。
三维图像 = 普通的 RGB 三通道彩色图像 + 深度图Depth Map。(R G B D)
-
像激光雷达一样主动探测深度信息
-
同时测量图像的彩色信息
RGB-D 传感器是一种特定类型的深度感应设备,与 RGB(红色、绿色和蓝色)传感器相机配合使用。它通过在每个像素的基础上使用深度信息(与传感器的距离相关)来增强传统图像。
在RGB-D相机中,不同传感器之间或传感器之间的相对方位元素被标定并已知,因此可以很容易地获得共配准的同步RGB图像和深度图。
点云并不是RGB-D扫描的直接产物。但是由于摄像机中心点的位置是已知的,因此可以很容易地获得深度图中每个像素的三维空间位置,然后直接用于生成点云。
RGB-D相机有三个主要应用:目标跟踪、人体姿势或特征识别以及基于SLAM的环境重建。由于RGB-D传感器距离较近,通常用于室内环境。
原理分类:
1、结构光
基于特征匹配,红外光。
原理:主要硬件有投射仪、相机,通过投射仪主动发射(因此称为主动测量)肉眼不可见IR红外光到被测物体表面,然后通过一个或多个相机拍摄被测物体采集结构光图像,将数据发送到计算单元,通过三角测量原理计算获取位置和深度信息,从而实现3D重建。
有多种投影图案方式,如正弦条纹的相移法、二进制编码的格雷码、相移法+格雷码等。
优点:功耗小、成本低、技术成熟,近距离精度高(毫米级)。
缺点:远距离精度差;室外强光不适宜,容易干扰投影光。
2、双目立体
基于特征匹配,自然光。
原理:通过左右两个摄像头获取图像信息,计算视差。
不主动对外发射光源,因此称为被动深度相机,目前多应用在科研领域。
优点:硬件成本低,可在室外使用。
3、TOF飞行时间
基于飞行时间,红外光。
原理:连续发射不可见光脉冲到被测物体上,接受从物体反射回的光脉冲,探测光脉冲的飞行时间计算被测物体距离
一般分为:脉冲调制和连续调制两种。
优点:测距远,不受表面灰度和特征影响,可用于无人驾驶,可以直接输出被对策物体三维数据,更适合动态场景。
缺点:精度差、很难达到毫米级,室外强光不适用。
对比:
拓展知识:
- RGB:RGB 色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色,RGB 标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色系统之一。
- Depth Map:在 3D 计算机图形中,Depth Map 类似于灰度图像,只是它的每个像素值是传感器距离物体的实际距离。通常 RGB 图像和 Depth 图像是配准的,因而像素点之间具有一对一的对应关系。
图像深度
-
指存储每个像素所用的位数,也用于度量图像的色彩分辨率。
-
确定彩色图像的每个像素可能有的颜色数,或者确定灰度图像的每个像素可能有的灰度级数。它决定了彩色图像中可出现的最多颜色数,或灰度图像中的最大灰度等级。比如一幅单色图像,若每个像素有8位,则最大灰度数目为2的8次方,即256。一幅彩色图像RGB三通道的像素位数分别为4,4,2,则最大颜色数目为2的4+4+2次方,即1024,就是说像素的深度为10位,每个像素可以是1024种颜色中的一种。
特点:
-
与相机距离成比例:较近的表面较暗; 其他表面较轻;
-
与标称平面的距离相关:靠近焦平面的表面较暗; 远离焦平面的表面更轻。
TUM RGB-D数据集
TUM RGB-D数据集介绍 - 知乎 (zhihu.com)
很有名的RGB-D数据集,由TUM的Computer Vision Lab公布。
主要是针对纹理丰富的办公室场景,除此之外,这个数据集还有包含很多其他的场景。
数据集的下载地址是:https://vision.in.tum.de/data/d
四、SAR点云
干涉合成孔径雷达(InSAR)是一种对遥感至关重要的雷达技术,它根据多个SAR图像对的比较生成地表变形或数字高程图。
应用:城市监测、尤其是建筑物结构分割方面很有潜力。
分类:稀疏(<20pts/m^2)、稠密(数百pts/m2)、多源(多源数据融合)
参考资料:
-
(五)深度相机:结构光、TOF、双目相机 - 知乎 (zhihu.com)