LM的控制器演示一出,网上关于该设备工作原理的各路技术讨论异常热烈,我们也在第一时间对其原理进行过剖析和预测。对于网上关于LM控制器原理及应用的曲解,我们非常希望能够之纠正,但是由于缺乏必要的论据支持,我们也无法使大家信服。随着最近工作的进展,我们也对LM控制器的追踪性能进行了模拟,从而证明理论的可行性。但是因为从事相关的专业工作,请允许我们无法如数倾囊,但是我们会在允许的范围内,尽可能为大家详细解读LM控制器的工作原理。以下为我们通过普通摄像头所模拟的LM控制器工作原理及目标追踪性能,无法收看的同学也可移步这里。
LM控制器采用立体视觉原理,配备双摄像头的控制器如同人眼一样,能够对空间物体进行坐标定位。为了方便理解,大家可以试着快速轮流闭合左右眼,可以看到物体的位置会发生平移,这就是视差。一旦出现视差,就可以在人脑中产生空间纵深的感觉,这就是3D电影的基本工作原理。电影在制作的时候分别拍摄给左右眼看的画面,人为制造视差,所以在观看平面画面时会产生三维空间错觉。当然这个视差是不能随意定义的,必须和人眼瞳孔的间距匹配起来,我们称之为基线长度。不同年龄、性别、种族的人群的视觉基线长度都略有差别,所以3D电影不一定适合所有人群观看。
这种应用于立体视觉的测量方法,我们称之为三角测量法。三角测量法是用于定位目标空间位置最常用和最基本的方法,应用场合小到我们常见的Kinect、激光反求等,大到飞机装配等高精度作业环境。在LM控制器的双摄像头基线距离固定后,就可以进行设备校准。校准后的控制器可以精确计算出目标相对于摄像头的空间坐标。

在了解LM控制器的基本工作原理后,下面我们讲讲控制器的工作过程。当我们把手伸到控制器的工作区时,两个摄像头需要同时捕捉目标,并且实时计算目标的视差,就可以得到它的空间信息。这里我们所说的目标是指已经过滤后的目标信息,如指尖和掌心,所以大家不要再想着可以通过控制器来做三维扫描,这是办不到的。控制器的工作区域必须是双摄像头的公共视场区域,所以过于复杂的多点姿势操作控制器是无法识别的。
照明部分。为了更加方便地识别目标,控制器上的LED灯需要对目标进行照明,加强目标与背景的亮度对比,使之更容易识别,同时使设备在光线较暗的环境中也可以使用。相反,如果在室外有太阳或者红外光较充分的地方,会影响控制器的正常使用。
计算效率。LM在算法上主要采用了TBD技术。该技术的一大优点就是能够准确跟踪目标,但是缺点是对于内存有一定压力,而且也会需要一定的计算量,况且还采用了高帧率的双摄像头。根据官方的动态来看,未来LM会通过数学模型的优化再来降低CPU的占用资源。
(关于TBD的简称。该简称来自官方的技术说明,有看官指出仅仅是To-Be-Done/Defined/Determined的缩写,而不是所谓的Tracking-After-Detect。无从考证,我们特此作出说明。因我们不够严谨的研究态度,给各位看官带来的误导,在此表示抱歉;对各位的指正表示感谢。)