看图猜技术!IDEALSEE创始人深度解读Magic Leap One
文章相关引用及参考:映维网
本文来自IDEALSEE创始人宋海涛博士的第一时间技术解读
(映维网 2017年12月21日)12月20日晚,硅谷增强现实公司Magic Leap官网正式发布首款AR眼镜Magic Leap One,声称拥有数字光场、视觉感知、持久化对象、声场音频、高性能芯片组和下一代界面等六大特性。
Magic Leap One一经发布便引起业界轰动,这款神秘产品到底蕴藏了哪些技术奥秘?国内下一代显示技术领域领军企业——成都理想境界科技有限公司(IDEALSEE)创始人宋海涛博士通过官方披露的图片,对其技术方案进行了以下推测:
(一)显示技术
Magic Leap one采用了光纤扫描光场显示技术,两侧突起那部分即是扫描器后端封装部分。宋博士和Google该领域的首席科学家讨论认为,Magic Leap可能用了6阶光场,大概是12或24根光纤组成单侧一组,分辨率应该在单目2.5K左右。但由于激光器的高速调制,所以你实际看起来是看不到颗粒感的。6阶光场图同时直接对人眼视网膜扫描照射,所以不管你怎么看,都会觉得很真实。
宋博士表示,光纤扫描光场显示技术代表着下一代显示技术,正是这项前沿技术使得Magic Leap能在连产品都没有的情况下拿到60亿美金的市场估值,“投资一条OLED生产线都还要60亿美金以上,何况目前OLED/LCD/LCOS/DLP这些第三代显示技术不可能做到真正的光场显示,还有高分辨率、小体积的要求。”
(二)光学技术与像素遮蔽技术
宋海涛博士推测Magic Leap one采用了多层衍射光学元件(DOE)。宋海涛博士说:“据内部人士透露,Magic Leap one的FOV看起来比Hololens大得多,我估计在60度左右。”
据体验者反映,显示的AR内容完全不透明,感觉很像真实的实体,这就说明Magic Leap极有可能采用了高阶的像素遮蔽技术,这样一来,即使在户外强光下也可以清晰真实显示。
宋博士表示这种设计比大家想象的要重要得多。宋海涛博士说:“真正用起来的时候你们就会发现,不采用这种技术的AR Glass都会像Hololens那样在亮背景对比下显示效果较差,在户外基本无法良好使用,而且怎么样也做不出真实显示的效果。此外,在Magic Leap 这样的方案下,你是难以透过镜头看到人眼的,从外向内看会觉得镜片有点倾斜(Magic Leap one的图片也佐证了这一点)。”对此,宋博士还画了张图,简单说明IDEALSEE的专利方案里是如何设计这种系统的。
(三)传感技术
宋博士根据图片进一步推测,眼镜两边的上面和下侧面是4个广角Global shutter SLAM用途的摄像头,两边中间看起来是两个不同焦距的前置摄像头,用于拍照和深度学习人脸/物体识别等(亮灯提示在拍摄,可以单独工作),中间两个是TOF或编码结构光的深度摄像头,用于平面构建和手势识别和物体3D建模支持。宋海涛博士认为,在Magic Leap one后面看不到的部位一定还有两个眼动摄像头,拿到眼动数据来以较少计算量渲染每一帧6阶光场,不然他们的计算力不够。
(四)定制ASIC及其他
宋博士还推测Magic Leap one至少开了2颗ASIC,其中一颗用于处理4目摄像头SLAM算法、眼动跟踪、手势识别、深度图数据处理(这些算法模块有很多IP可以共用,共9颗摄像头需要ISP性能要足够强大、通道要够用,对芯片工艺要求一致,正好一颗ASIC能全部集成),另外一颗应该是深度学习方面的加速芯片,“按Magic Leap的调性,他们不可能不用。”
SLAM、深度、手势等计算值输出到主机,主机把渲染完的结果按照他们6阶光场的自定义编码方式发送大约单目2.5K分辨率的光场图像流到眼镜上,再做自定义解码显示,而且要达到90FPS以上,DP和HDMI单线目前看来似乎带宽都不够。因此,宋博士推测后面两条线缆的作用可能就在于此,用来接入和输出。宋博士说:“他们遭遇到的困难可能在于,头后面的佩戴结构为了考虑滑动和头型大小兼容的尺寸缩放而不便做内部高速电气连接,所以先分成两根线,再合并成一根接入主机。”
关于主机这块,宋博士没有细想,他说:“Magic Leap还没实力去做自己的高性能显卡,应该是X86 CPU+英伟达高性能移动显卡,按帧做指定角度的6阶光场渲染应该还是够的。”
至于外面机壳上的几个孔,宋博士认为应该是降噪和声场麦克风。此外,从照片外观看来,他认为这可能是PR1的机器,接缝处模具似乎没修,另外还有些料可能还没到齐,比如中间深度摄像头似乎缺失盖玻片。宋博士表示,也有从照片上没看懂的地方,比如眼镜右侧下方有一小块凸起的方形结构,不知道里面是什么。
看完以上这些推测,大家应该可以理解Magic Leap为什么需要融资近20亿美金了。宋博士说:“这里面从光场光纤显示(我们称为像源技术)、到光波导(FOV大是要花功夫的)、到像素遮蔽(AR必备神器)、到SLAM/手势/各识别的算法ASIC、再到各个算法和软件系统,基本所有的基础级东西都需要自己研发定制。节约点的话,差不多三五亿美金的基础投入还是要先花出去的。”
通过这次产品透露出的信息来看,宋博士认为,Magic Leap比大家想象得更加专业,世界上能达到这个级别的系统专家估计也不会超过10个人。
最后,宋博士表示,看图猜技术肯定会有猜错的地方,这次解读纯属抛砖引玉,希望能给业界带来更专业深入的探讨。