1、3D 成像主流方案图表 5:三种 3D 成像方案对比1.3.1、结构光的原理及实现1.3.2、结构光的原理结构光顾名思义就是有特殊结构的光,比如离散光斑、条纹光、编码结构光等。将这样的一维或二维的图像投影至被测物上,根据图像的大小畸变,就能判断被测物的表面形状即深度信息。举个例子,拿一个手电照射墙壁,站近或站远,墙上的光斑是不同大小的,从不同角度照射墙,光斑也会呈现不同的椭圆。这就 是结构光的基础。而深度计算的方式也有多种,如我们这里重点说一下被苹果公 司收购的以色列PrimeSense公司Light Coding方案。图表 6:结构光效果图Light Coding的光源称为“激光散斑”,根据
2、PrimeSense在专利中的描述, 红外激光生成器射出准直后的激光束,通过光学衍射元件DOE(Diffractive Optical Elements,如扩散片和光栅)进行衍射,进而得到所需的散斑图案。这 些散斑具有高度的随机性,而且会随着距离的不同而变换图案。也就是说空间中 任意两处的散斑图案都是不同的。只要在空间中打上这样的结构光,整个空间就 都被做了标记,把一个物体放进这个空间,只要看看物体上面的散斑图案,就可 以知道这个物体在什么位置了。当然,在这之前要把整个空间的散斑图案都记录 下来,所以要先做一次光源基准标定(pattern)。Light Coding 发射940nm波 长的近红
3、外激光,透过diffuser(光栅、扩散片)将激光均匀分布投射在测量空 间中,再透过红外线摄影机记录下空间中每个参考面上的每个散斑,形成基准标 定。标定时取的参考面越密,则测量越精确。获取原始数据后,IR传感器捕捉经过被测物体畸变(调制)后的激光散斑pattern。通过芯片计算,可以得到已知pattern与接收pattern在空间(x, y, z)上的偏移量,求解出被测物体的深度 信息。1.3.3、结构光技术实现结构光的实现难度有如下几个方面:1)首先是经济成本,深度摄像头远高于一般的摄像头;2)摄像头需要的空间和功率限制,手机摄像头已经可以做到很小的体积和很小的功率,但是深度摄像头还很难,特
4、别是如果希望能达到比较 高的精度;3)很多深度摄像头是需要额外光源的,因此还要专门的散热设备。4) 后端的软件匹配。1.3.4、TOF原理及技术实现1.3.5TOF的原理Time of Flight是一种主动式深度感应技术,在每个像素点,除了记录光线 强度信息之外,也记录下来光线从光源到该像素点的时间(即Time of Flight)。 首先让装置发出脉冲光,同时接收目标物的反射光,藉由测量时间差算出目标物 的距离。图表 7:TOF 原理如上图所示,假设脉冲波形的频率为f,接收与发送脉冲波形的相位偏移是 ,则 /2 f为脉冲波形往返所经历的时间。用光速c乘以时间则可以得到 往返距离。1.3.6
5、、TOF技术实现TOF的硬件实现方式和结构光类似,区别只是在于算法上,结构光采用编码 过的光pattern进行投射,而TOF直接计算光往返各像素点的相位差。1.4、双目测距,传统的3D感知方法双目测距原理类似人的双眼,在自然光下通过两个摄像头抓取图像,通过三角形原理来计算并获得深度信息。目前的双摄就是双目测距的典型应用。图表 8:双目测距原理1.5、3D成像是开启AI和AR时代的感知钥匙以AI的机器视觉为例,目前主流在2D图像上通过算法实现智能识别,但是由于2D图像本身包含的信息有限,即使算法再先进,输入信息将成为智能化的短板,如果能够有全面的三维信息,每个对象的三维轮廓、物理特征将更为充分识
6、别, 提升导航、轨迹、识别等AI应用能力。同样的,AR应用中3D成像也是必不可少。图表 9:3D 成像帮助 AI 更精确的空间感知图表 10:2、3D成像即将带动下一轮光学创新浪潮2.1、交互向三维升级,想象空间巨大纵观人机交互的历史,打孔指令带、DOS系统+键盘形成了早期一维人机交互;Windows+鼠标的二维交互方式开启了互联网/PC时代,触摸屏和摄像头的二维交互方式则开启了移动互联网/智能手机时代,而到了以AR为代表的下一代计算平 台,则需要三维的交互方式。图表 11:人机交互历史在移动互联网时代,触摸屏和摄像头成为主要的人机交互媒介。触摸屏可以 方便地实现各种操作,相比键盘和鼠标更为自
7、然和顺畅。摄像头实现了大量的内 容输入,也是一种重要的人机交互媒介。图表 12:触控屏的交互图表 13:摄像头可以实现内容输入但触摸屏和摄像头仍属于2D的交互方式。在触摸屏上,我们只能实现平面范 围内的感应和触控,即使出现了3D Touch等新的触控方式,人机交互也依然只局 限在一个平面上。而现有的摄像头则只能实现2D图片的拍摄,无法实现3D图像的 交互。图表 14:非智能计算平台的输入输出图表 15:智能计算平台的输入输出而到了以AR为代表的下一代计算平台,则需要3D的交互方式,这是由AR设备 的定义所要求的。AR技术是指借助计算机视觉技术和人工智能技术产生物理世界 中不存在的虚拟对象, 并
8、将虚拟对象准确“放置”在现实世界中。通过更自然的 交互,呈现给用户一个感知效果更丰富的新环境。图表 16:AR 技术让一头鲸鱼从地板中跃出由于现实环境是3D 的,所以AR 技术为了实现逼真的效果,也需 要产生3D 的虚拟对象,并把3D 的虚拟对象叠加显示在现实的物理环 境中,这就要求AR 设备可以实现3D 的输入和输出。图表 17:AR 技术需要 3D 的输入和输出由于AR 所需要的是3D 的交互,所以现有的触摸屏和摄像头等2D的交互方式并不满足AR 的要求,需要新的交互技术。 三维交互的应用广泛:精确的脸部识别可以用于解锁、支付;精确的手势及动作识别可以用于家庭游戏娱乐;精确的人形建模可以让
9、网购更有效率,让移动 社交更真实。而全球生物识别(2015 年130亿美金)、游戏(2016 年996 亿美 金)、B2C 电商(2015 年2.2 万亿美金)加在一起粗略统计是一个超过2 万亿 美金级别的市场。哪怕三维成像应用渗透率只有10%,都将造就一个万亿人民币 级别的市场规模。3D 成像的未来想象空间巨大!图表 18:3D 成像电商应用,手表图表 19:3D 成像电商应用,座椅图表 20:3D 成像美容化妆应用2.2、已实现商用,预计成为2017年顶级品牌手机杀手锏从技术角度来说,3D成像并不是近年才新出现的。自2009年微软发布基于3D 成像的游戏体感交互设备Kinect已经有8年时
10、间,而Google的Project Tango也提 出了4年。随着图像处理芯片技术的更新换代,AR需求的不断涌现以及AI大数据 技术的风起云涌,进一步坐实了一个事实:3D成像已经过了技术基础期,即将进 入长达5年以上的高速成长期。2.2.1、微软Kinect2009年6月2日,微软在东京电玩展上首次发布针对XBOX360的体感周边外围 设备Kinect,当时的代号为Project Natal(初生计划)。首日便超过了WII主机 的发售数据,之后再以光速超越游戏市场上的所有记录,让微软在北美乃至全球 市场都可以扬眉吐气。不仅如此,这样具备着强大潜在实力的技术吸引了多达世 界上8成左右的游戏厂商加
11、盟,为后续的游戏产业链奠定了坚实的基础。图表 21:交互式游戏感知设备Kinect彻底颠覆了以往游戏的人机交互方式,相比对手任天堂Wii依靠游戏 杆上的传感器Wii Remote识别用户动作的限制,Kinect不需任何手持设备,能捕 捉玩家全身上下的动作,直接用身体来进行游戏,带给玩家“免控制器的游戏与 娱乐体验”,也让游戏类型更加丰富。图表 22:Kinect 1.0 拆机镜头位置图表23:Kinect 1.0 配置Kinect V1采用PrimeSense(2013年被苹果收购)结构光方案,硬件上由三 个镜头组成,中间的镜头是 RGB 彩色摄像头,用来采集彩色图像。左右两边镜 头则分别为红
12、外激光发射器和红外CMOS 摄像头所构成的3D结构光深度感应器, 用来采集深度数据(场景中物体到摄像头的距离)。彩色摄像头最大支持640*480 分辨率成像,红外摄像头最大支持320*240成像。同时,Kinect V1还搭配了追焦 技术,底座马达会随着对焦物体移动跟着转动。Kinect V1也内建阵列式麦克风, 由四个麦克风同时收音,比对后消除杂音,并通过其采集声音进行语音识别和声 源定位。图表 24:PrimeSense 方案PrimeSense的结构光方案,通过Infrared projector发射一副具有三维纵深 的“立体”编码近红外激光(光源通过准直镜头和DOE器件形成衍射光斑),
13、再 通过接收端的Infrared camera收集经人体反射回来的红外光线。这种光斑具有 高度的随机性,而且随着距离的不同会出现不同的图案,也就是说在同一空间中 任何两个地方的散斑图案都不相同。只要在空间中打上这样的结构光然后加以记 忆就让整个空间都像是被做了标记,然后把一个物体放入这个空间后只需要从物 体的散斑图案变化就可以知道这个物体的具体位置。图表 25:Kinect 识别效果图当然,首先后台需要保存空间标定数据,假设Kinect规定的用户空间是距离电视机的1米到4米范围,每个10cm取一个参考平面,那么标定下来我们就保存了30幅散斑图像,需要进行测量的时候,拍摄一副待测量的散斑图像,作
14、为基准数 据信息。将这幅图像和我们保存下来的基准数据信息依次做互相关运算,这样我 们会得到30幅相关度图像,而空间中的物体存在的位置,在相关图像上会显示出 峰值,把这些缝制一层层叠加在一起,在经过插值运算就会得到整个场景的三维 形状了。2.2.2、Google Project TangoTango在谷歌已存在4年时间,2013年初谷歌的ATAP(先进科技与计划)团队 就已开始着手相关的研发。Project Tango的技术主要是使用传感器和摄像头来 对室内建筑进行3D建模,同时还具备无限宽广的应用场景,包括绘制3D地图,帮 助盲人在陌生的地方导航,让人们能利用家中的环境玩拟真的3D游戏等。图表
15、 26:Tango 效果图2014年2月,Project Tango的原型机亮相,只面对开发者提供首批200台原 型机。根据拆机图片,前置摄像头已省去,后置包含4颗镜头,分别是普通的400 万像素 RGB摄像头,用于3D成像的红外发射器和红外接收器,以及一颗鱼眼镜头用于动作捕捉。这三颗摄像头模组均由大陆模组厂商舜宇光学提供。另值得一提的是,硅谷初创公司Movidius(2016年9月被Intel收购)的处理 器用于辅助CPU进行图像的运算处理。整机配有一颗容量3000mAh容量的锂电池。图表 27:Tango 原型机结构搭载Tango的首款商用机型联想Phab2 Pro于2016年Tech W
16、orld大会正式发布, 价格为499美元,Phab2 Pro尺寸达到了6.4。同时,配有全金属机身和2.5D盖板 玻璃。由于PrimeSense被苹果收购,Google在Phab 2 Pro改用TOF技术进行3D 成像, 设有三种摄像头:最上方一颗是三星的1600万像素RGB CMOS摄像头,用于常规拍 照;最下方是OV鱼眼镜头,用于动作捕捉;两者之间则是TOF系统构成,有上方 的Princeton提供的IR VCSEL,和下方英飞凌及pmd共同提供的IR Depth sensor。 这三颗摄像头模组均由大陆模组厂商舜宇光学提供。图表 28:联想 Phab2 供应商解读图表 29:联想 Pha
17、b2 Pro 配置为了提供三维场景,三种摄像头各司其职,并与其它传感器“合作”,以实 现以下功能:(1)运动追踪(Motion Tracking):通过移动设备自带的多种传感器,在不通过外界信号的情况下,实时获取设备的姿态与位置,追踪设备在三维空间中的运动轨迹。Tango创新性地采用了摄像头与惯性测量单位(IMU)结合的方法来 实现精确的运动追踪功能。(2)环境学习(Area Learning):利用视觉信息记录与索引外界环境,自 动矫正环境构建与运动追踪中积累的误差,识别重复环境。该功能描述起来很容 易,但实施起来则相当的困难,首先设备会对其拍摄的每一帧照片提取特征,然 后对出现的特征进行保
18、存和引索,再利用一些高效的储存和搜索算法,实时地判 断新的一帧是否跟过去曾经拍摄的环境有相似之处,如果匹配准确的话,设备可 以立即利用之前已经收集的环境信息。(3)深度感知(Depth Perception):利用自带的三维飞行时间摄像头扫 描外界三维环境,构筑三维模型,再配合运动追踪,即可告诉设备在空间中的位 置,与四周障碍物的距离。2.3、成本:有望实现对传统生物识别的替代,性价比极高正如我们上文所述,如果将3D成像搭载在手机前置摄像机,可以通过利用人脸识别完成屏幕解锁,同时可以利用虹膜识别完成密码支付,其安全性将强于目前的指纹识别。2.3.1、成本增加较少,安全性更强经过我们的成本推算,
19、以顶级客户方案为例,目前其BOM成本不超过15美元,而前置3D成像完全可以实现对TouchID模组的替代,而后者目前BOM成本约在6-7美元,所以3D成像实际增加成本在5-10美元,成本增加并不明显。2.3.2、手机可以做到屏幕占比很高3D成像除了更安全,实现更多功能以外,也符合苹果持续追求的外观目标: 增加屏幕在手机中的占比。从iPhone4开始,通过窄边框提升屏幕在手机正面占 比,而OLED显示的成熟更可以充分利用正面有效面积,而这时庞大的TouchID区 域已经显的非常碍眼了,所以从我们产业了解到信息,手机厂一直有强烈的意愿 取消掉前置的TouchID模组,而3D成像正好完美解决这一痛点
20、。图表 30:增加屏幕占比是智能手机趋势图表 31:小米 MIX 超高屏幕占比大受追捧2.4、厂商意愿:产业链调研发现国产大厂跟进意愿极强结构光方案最主要的玩家PrimeSense被苹果收购后,部分客户转向了TOF方案,但是仍然有方案公司继续在结构光领域探索。深圳的奥比中光便是其中的代表,目前其结构光方案已经较为成熟,可以商用在机器人、无人机导航等领域,同时手机微型化的方案也正是推出。 经过我们的产业调研,目前国产手机大厂对于3D成像需求非常迫切,跟进意愿极强,已经开始寻找PrimeSense以外的结构光方案合作商,而奥比中光正好弥 补了这一缺口。图表 32:奥比中光行业应用方案图表 33:奥
21、比中光解决方案3、3D成像将是下一个爆发式的创新3.1、回顾触控和双摄,真正的革命渗透速度极快,享受估值溢价3.2、触摸屏曾经的辉煌,大陆电子产业的启蒙大陆电子产业,尤其是上市公司,在2010年以切入苹果产业为标志,享受下游需求快速增长的同时,也实现了对台湾供应链的节节胜利。其中触摸屏可谓是行业的启蒙者:1)自iPhone带动以后,触摸屏在2010年以后实现爆发式成长;2) 以莱宝高科为例切入苹果产业链以后业绩的突飞猛进也让市场记忆深刻;3)随 后国产手机的跟进,造就了一批欧菲、合力泰、信利等触控的大牛股。图表 34:iPhone 带动触控屏行业爆发图表 35:欧菲光等大陆 TP 厂实现戴维斯
22、双击苹果产业开始推动大陆资本市场对于电子的研究范式大为革新,市场认识到 电子行业也是成长股的摇篮。7年以后的今天,虽然市场担心创新放缓,但是任 何快速渗透的技术都不应该忽视,真正的革命能够享受估值溢价。3.3、双摄带动摄像头空间翻倍,微创新也有大能量最近一个快速渗透的例子就是双摄像头,自iPhone7推出以后,双摄已经成为高端手机的标配,其渗透速度也经历快速爆发,即使在手机增长放缓的背景下,舜宇、大立光、丘钛等相关公司也实现了戴维斯双击。 舜宇等公司不是个例,我们认为其股价持续创新高,体现了光学杰出的行业属性,即使是双摄像头个数的创新就能带动行业持续成长。图表 36:未来两年双摄渗透率将爆发图
23、表 37:舜宇光学股价不受行业影响3.4、预期差极大,产业和资本认识不足3.4.1、大陆台湾产业链参与少,3D成像预期差大iPhone刚上市的时候保密性极佳,尤其是iPhone4的上市给市场极大震撼,但随着销量规模的飞速成长和大陆台湾公司越来越多的参与,iPhone创新提前走 漏的案例比比皆是,大部分iPhone8的创新在2016年就已经提前被产业链所获知, 所以资本市场提前会有预期,但是这次3D成像保密性可谓前所未有,消息源是来 自于美股的公司业绩说明会透露的细节。到目前为止,市场对于3D成像究竟用结构光还是TOF尚未认识完全,至于具 体的产业链细节和工作原理更是知之甚少,所以这次光学变革预
24、期差充足。市场 一度有人猜测为苹果将采用TOF的成像方案,也侧面说明了此次3D成像保密的成 功。图表 38:LITE 业绩说明会透露订单后大涨图表 39:VIAV 业绩说明会透露订单后大涨图表 40:结构光成像供应链基本都是海外公司3.4.2、预计苹果将采用前置结构光方案,融合虹膜识别苹果早在多年前已经开始3D成像的布局,2013年收购结构光主要方案是PrimeSense,同时也公布了US9519396 B2(利用三维信息完成合成)、US8933876B2(三维空间手势识别)专利,诸多线索指向苹果未来的3D成像意图。图表 41:苹果近 5 年持续收购 3D 成像公司从原理上来看,结构光只需要拍
25、两次照即可实现3D距离的探测,而TOF成像 延时较长,图像分辨率偏低;同时由于结构光光斑较多,衍射范围大,如果探测 距离较远容易影响精度,所以探测距离是结构光的劣势。苹果2013年斥资3.45亿美元收购PrimeSense,而PrimeSense正是结构光方案 最主要的专利持有者。我们推断苹果的3D成像将会以前置的方式配置,考虑到在 前置方案需要高精度、低延时,同时对于探测距离要求并不高,所以我们认为苹 果的3D成像将会是前置结构光的方式呈现。同时,我们判断在该方案中除了传统的前置RGB摄像头以外,会在两侧增加 发射和接收端用于探测景深信息,其中接收端是特殊制程的CMOS,用于接收窄带 红外光
26、,同时该CMOS也会结合虹膜识别的功能。图表 42:苹果 PrimeSense 结构光方案拆解猜想3.4.3、从iPhone7的TOF传感器窥探苹果的3D成像布局iPhone5开始,苹果已经在距离传感器上面小试牛刀,最早是将AMS的距离传 感器放置在听筒附近,当接电话的时候利用红外光飞行时间(time of flight) 探测到脸部距离以后控制屏幕的亮度,实现更省电的方案。图表 43:iPhone6 的环境距离传感器图表 44:iPhone6 环境距离传感器拆解图这一设计沿用到iPhone6S,直到iPhone7 开始,苹果将原来沿用 的环境距离传感器升级为更精确的TOF传感器。在新的TOF
27、方案中, 利用高效率的VCSEL 激光器和光子接收点阵SPAD 作为发射和接收端,VCSEL 发射出16 个点阵激光,然后利用SPAD 能够探测到比单点距离传感器更丰富的距离、脸型等特征信息。图表 45:iPhone7 的 TOF 环境距离传感器图表 46:iPhone7 TOF 距离传感器拆解图从这一变化可以看出,苹果虽然前置3D 成像不会使用TOF,但是对于TOF 苹果的态度也是开放的,考虑到TOF 在远距离景深探测的优势,我们判断在2018 年 以后TOF 大概率将以后置摄像头的形式出现。苹果在3D 成像的雄心绝对不容小 觑:前置实现手势控制、人脸识别、虹膜识别等短距精确的功能,后置实现
28、AI、 AR 等长距的功能。4、3D成像产业链潜在受益环节分析4.1、关键器件被锁定,严重供不应求,核心零组件拥有充分定价权这次苹果不仅领先了资本,还领先了产业,在苹果精心的布局慢慢浮出水面后,产业发现苹果早已将结构光产业的关键零组件进行了深度绑定,其他品牌厂难以完全复制。 所以,现在产业面临的问题的快速爆发的需求和上游稀缺的产能,所以也不难理解国产品牌对此的深深忧虑,所以我们判断现在的3D成像和去年的双摄格局 非常像,品牌厂为了追求新功能,只有不惜血本寻找有效产能,核心零组件公司 将拥有充分定价权,坐拥数年的黄金成长期!4.2、发射(LDM)发射端主要由点光源VCSEL、准直镜头和扩散片DOE构成。大致原理是VCSEL发出940nm点激光之后通过准直镜头矫准为线性激光,线性激光照射在DOE上发生衍射,形成近千个具备调制信息的光斑(lighting code)。由于扩散片对于光 束进行散射的角度(FOV)有限,所以需要光栅(见下图)将散斑图案进行衍射 “复制”后,扩大其投射角度。这种“复制”效果被称为光学卷积,能得到所需 透射角度的散斑。图表 47:扩产片 DOE 衍射分光图表 48:经光学卷积后的光斑4.2.1、VCSEL光源红外光常被用于3D 成像,发射红外线
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1