Technical Articles
Overview of 3D Vision Measurement
Date:2018-04-16
Source:Samsun Technology
1.将二维图像感知用于三维测量
将三维视觉用于物体测量,最早被业内认可和广泛使用的,就是光截图技术。该技术是将一个由线激光组成的光切面与相机的像平面成一个固定角度,这样相机的像平面上的任意一个像素点就与光平面上的点形成唯一的对应关系,通过标定,实现物体与光平面的交接线的三维测量。这种方法是将三维问题通过光截面实现降维处理,其典型应用是在铁路车辆动态检测系统中用于轮缘截面的精确动态尺寸测量。
激光线扫描测量传感器是基于光截图技术研制而成的。当激光线扫描传感器用于三维测量时,就需要将不同时刻的激光线测量数据拼合起来,形成一个物体的三维整体轮廓,然后,在该轮廓数据点的基础上实现物体的测量和识别。这样的测量系统要求被测量物体匀速平稳的通过传感器的扫描线,将多条扫描线拼合后,在拼合的离散点云中,运算得到被测物体的真正的物理尺寸,这样的运算目前还没有一个公认的统一方法,由于点云数据量大,对运算资源有很高的要求,难以实现实时快速的运算和识别。
使用三维测量的方式,可以提高测量的精度和实时性,克服由于物体移动和不同时刻测量带来的变化误差。
2.将激光测距技术用于三维测量
三维激光扫描设备,广泛用于场景和物体的三维测量和建模。该类设备采用激光测距方法,通过高速激光扫描,实现空间单点深度的测量,扫描得到的测量数据,一般都配有专用三维点云数据管理和三维建模软件,用于反求工程或三维测量。此类三维测量方法,由于运算时间长,人工操作步骤多且相对复杂,一般不能作为在线测量设备。
多线激光雷达是和该方法类似的三维感知设备,由于采用了多线同步扫描,可得到实时的三维空间点云数据,目前将激光雷达用于无人汽车是一个火热的课题,其难点主要在于激光点云数据量大,要实现实时的三维重建和三维识别,对算法和运算资源要求极高。TOF技术与激光感知技术相似,通过光脉冲的飞行时间的测量,达到不同深度物体的感知。微软的Kinect以及苹果公司新推出的 iPhoneX人脸三维解锁技术是以上技术的代表,国内也有不少公司推出了类似的产品,这些产品集成了TOF、激光结构光和图像感知技术,能够快速实时的进行三维感知。对于三维测量和识别方面,由于Kinect推出时间较长,利用Kinect进行三维感知的示例很多,最多的应用是进行人体姿态和动作的感知和捕捉,还有用于室内空间快速测量的示例等。由于这类设备对于深度的测量精度有限,阳光和其他光照对测量结果有影响,同时,有些反光性能不良的物体对测量有影响,所以,在测量领域还很难见到这类设备的具体应用。
3.多目光学被动式三维测量技术
航空摄影测量是一个典型的基于多目光学被动式三维测量技术的应用实例。目前,无人机的大量应用,给航空摄影测量带来了勃勃生机,双倾斜高清相机是这类应用大量采用的图像采集设备,结合地面计算机集群或采用GPU等并行运算方式,通过事后图像匹配运算,得到被摄场景的三维重建图形。这类应用可广泛应用在各类高空巡检和监测以及各类测量需求,代替人工巡检和测量。对于一个固定环境的三维检测,还有一种方式就是将多个相机在不同的角度进行布置,通过多像机间的空间位置关系,将被测空间的三维实时进行感知和测量,这样的系统需要单独搭建和定制化开发。另外一种采用纯光学三维重建的方法,就是针对一个特定的对象,用单相机从各个视角拍摄多幅图像,然后,计算合成物体的三维图像。
以上这些既有的多目三维感知手段,由于图像匹配需要消耗大量的运算资源,而且,在匹配过程中有些歧义很难自动消除,所以都具有事后运算且需要人工干预和修正的特点,一般很难用于实时的三维感知和测量。
虽然目前的深度学习在图像识别方面取得了巨大成功,但都是基于二维图像的,由于二维图像采用针孔成像原理,丢失了大量的空间信息,为了恢复和还原这些信息,就需要进行大量的模型学习,由于大量标注样本的缺失 ,使项目开发周期延长。由于三维数据的明确和直观,在这些信息的基础上,可以极大降低学习量,甚至可以实现一次性无监督学习。
以上只是涉及单次测量结果的分析,对于随时间变化的多次多视角的测量,或者说对于三维视频流的分析和测量,可以在机器视觉的识别和机器视觉理解方面,具有更大的价值。例如:对于以机器视角观察世界来说,通过在静态条件下的长时间三维测量,可以很轻松的判断移动物体的运动方向和运动轨迹,如果结合机器本身的移动传感,根据外界固定环境的位置变化,就可以解算出机器的位置变化,用于机器自身的定位和姿态控制等等。
机器视觉测量技术发展一小步,工业智造发展一大步!
原文链接:http://www.china-vision.org/news/hotpointsub/30550.html
将三维视觉用于物体测量,最早被业内认可和广泛使用的,就是光截图技术。该技术是将一个由线激光组成的光切面与相机的像平面成一个固定角度,这样相机的像平面上的任意一个像素点就与光平面上的点形成唯一的对应关系,通过标定,实现物体与光平面的交接线的三维测量。这种方法是将三维问题通过光截面实现降维处理,其典型应用是在铁路车辆动态检测系统中用于轮缘截面的精确动态尺寸测量。
激光线扫描测量传感器是基于光截图技术研制而成的。当激光线扫描传感器用于三维测量时,就需要将不同时刻的激光线测量数据拼合起来,形成一个物体的三维整体轮廓,然后,在该轮廓数据点的基础上实现物体的测量和识别。这样的测量系统要求被测量物体匀速平稳的通过传感器的扫描线,将多条扫描线拼合后,在拼合的离散点云中,运算得到被测物体的真正的物理尺寸,这样的运算目前还没有一个公认的统一方法,由于点云数据量大,对运算资源有很高的要求,难以实现实时快速的运算和识别。
使用三维测量的方式,可以提高测量的精度和实时性,克服由于物体移动和不同时刻测量带来的变化误差。
2.将激光测距技术用于三维测量
三维激光扫描设备,广泛用于场景和物体的三维测量和建模。该类设备采用激光测距方法,通过高速激光扫描,实现空间单点深度的测量,扫描得到的测量数据,一般都配有专用三维点云数据管理和三维建模软件,用于反求工程或三维测量。此类三维测量方法,由于运算时间长,人工操作步骤多且相对复杂,一般不能作为在线测量设备。
多线激光雷达是和该方法类似的三维感知设备,由于采用了多线同步扫描,可得到实时的三维空间点云数据,目前将激光雷达用于无人汽车是一个火热的课题,其难点主要在于激光点云数据量大,要实现实时的三维重建和三维识别,对算法和运算资源要求极高。TOF技术与激光感知技术相似,通过光脉冲的飞行时间的测量,达到不同深度物体的感知。微软的Kinect以及苹果公司新推出的 iPhoneX人脸三维解锁技术是以上技术的代表,国内也有不少公司推出了类似的产品,这些产品集成了TOF、激光结构光和图像感知技术,能够快速实时的进行三维感知。对于三维测量和识别方面,由于Kinect推出时间较长,利用Kinect进行三维感知的示例很多,最多的应用是进行人体姿态和动作的感知和捕捉,还有用于室内空间快速测量的示例等。由于这类设备对于深度的测量精度有限,阳光和其他光照对测量结果有影响,同时,有些反光性能不良的物体对测量有影响,所以,在测量领域还很难见到这类设备的具体应用。
3.多目光学被动式三维测量技术
航空摄影测量是一个典型的基于多目光学被动式三维测量技术的应用实例。目前,无人机的大量应用,给航空摄影测量带来了勃勃生机,双倾斜高清相机是这类应用大量采用的图像采集设备,结合地面计算机集群或采用GPU等并行运算方式,通过事后图像匹配运算,得到被摄场景的三维重建图形。这类应用可广泛应用在各类高空巡检和监测以及各类测量需求,代替人工巡检和测量。对于一个固定环境的三维检测,还有一种方式就是将多个相机在不同的角度进行布置,通过多像机间的空间位置关系,将被测空间的三维实时进行感知和测量,这样的系统需要单独搭建和定制化开发。另外一种采用纯光学三维重建的方法,就是针对一个特定的对象,用单相机从各个视角拍摄多幅图像,然后,计算合成物体的三维图像。
以上这些既有的多目三维感知手段,由于图像匹配需要消耗大量的运算资源,而且,在匹配过程中有些歧义很难自动消除,所以都具有事后运算且需要人工干预和修正的特点,一般很难用于实时的三维感知和测量。
虽然目前的深度学习在图像识别方面取得了巨大成功,但都是基于二维图像的,由于二维图像采用针孔成像原理,丢失了大量的空间信息,为了恢复和还原这些信息,就需要进行大量的模型学习,由于大量标注样本的缺失 ,使项目开发周期延长。由于三维数据的明确和直观,在这些信息的基础上,可以极大降低学习量,甚至可以实现一次性无监督学习。
以上只是涉及单次测量结果的分析,对于随时间变化的多次多视角的测量,或者说对于三维视频流的分析和测量,可以在机器视觉的识别和机器视觉理解方面,具有更大的价值。例如:对于以机器视角观察世界来说,通过在静态条件下的长时间三维测量,可以很轻松的判断移动物体的运动方向和运动轨迹,如果结合机器本身的移动传感,根据外界固定环境的位置变化,就可以解算出机器的位置变化,用于机器自身的定位和姿态控制等等。
机器视觉测量技术发展一小步,工业智造发展一大步!
原文链接:http://www.china-vision.org/news/hotpointsub/30550.html