请选择 进入手机版 | 继续访问电脑版
首页 首页 资讯 深度报道 查看内容

严肃装逼| 深扒,「AR 扫一扫」背后的那些事

2016-6-26 22:35| 发布者: admin |原作者: admin

摘要: 一码不扫,何以扫天下。

上周,我们编辑部狠狠秀了把优越,去体验了一发 HoloLens,速戳(链接)。当然,3000 刀的 HoloLens 免费体验机会并不常有,我们平时想要玩一把 AR,最常见的途径就是「扫码」了。



(额,是扫码又不是打码......)

不知何时起,「扫一扫」成为了街头巷尾常用词,尤其是创业公司的那句「扫一扫,关注我们」简直是地铁梦魇。我们所说的「AR 扫码」远不止二维码一种,背后其实是 AR 跟踪注册技术。

「SLAM」便是一种基于主动重建的跟踪定位方法,其注册方式为无标识跟踪注册(复习上周「AR 跟踪注册技术之 SLAM」)。而早期 AR 跟踪定位技术,主要针对的是认为可控的室内环境,采用人工放置标志的方式实现目标跟踪定位,我们最早见到的「AR 扫码」便是一种有标识 AR 跟踪注册。


准备好了没,一(大)波《严肃装逼》即将来袭。


1、有标识 AR 跟踪注册

顾名思义,比如下面这些「码」便是一种标识,原理很简单,在真实环境中放置人工标志物,这些标志物主要采用 ARToolkit、ARTag、SCR 或环形标识点,通过改变人工表示内部的编码图案,实现多目标的跟踪定位。


基于标识的跟踪注册技术是当前 AR 系统中最成熟和最接近实际应用的注册技术,该注册技术一般采用 IO 系统。在这里插播一条知识——

除了基于标识和无标识跟踪注册外这种视觉跟踪注册的分法外,还有另一种分类方式:inside-looking(IO)和 outside-looking-in(OI)。其中 IO 系统是指光学感应器安装在使用者身上,而标识点是固定不动的;而 OI 系统是指光学感应器固定不动,而标识点安装在使用者身上。(如图)


回到我们的「码」上。

大体来说,基于标识点的注册技术由两部分构成:一个是识别跟踪,一个是计算。

「识别跟踪」是指识别和跟踪摄像机拍到的「码」里的特征点;

「计算」是指根据识别跟踪出特征点的图像坐标信息,在摄像机透视投影模型的基础上,计算摄像机与真实场景的六自由度姿态。

在形形色色的标识码中,最常用的是华盛顿大学的人机交互实验室开发的 ARToolkit 开发软件包。我们 ARinChina 此前也有其教程,感兴趣的朋友可以戳链接


2、无标识 AR 跟踪注册

以上算是 AR 扫码应用的早期,如今,我们不扫「码」,而是改扫「物」了。

扫「物」背后,同样是一种 AR 跟踪注册技术,称为基于关键帧和模型的注册方法。

基于关键帧是利用二维图像的匹配和分析实现,而基于模型则需要先对目标物体或者场景进行建模并标注关键帧,通过获取扫描场景中的关键帧来进行计算,最后形成我们所见到的 AR 效果。

简单来说,以「可口可乐扫出岳云鹏」为例,这个过程需要三步。


第一步:离线过程。

我们扫描得到可口可乐瓶子的 3D 模型,建立来自不同视点的真实场景参考图形数据库,并对其进行关键帧标定,比如瓶盖、瓶身某位置,另外,别忘了准备好小岳岳的视频。

第二步:在线过程。

随机拿出一瓶可口可乐进行扫描,系统首先要去寻找与当前帧最接近的关键帧,建立两帧之间的特征点进行匹配,利用算法找到摄像机和可口可乐的位差。

第三步:播放小岳岳的视频。


另外一种 AR 常见的应用是「场景还原」。早在 2004 年,雅典为迎接奥运会的到来,特别开发了 AR 的文化古迹导游系统 Archeoguide,将奥林匹亚神庙进行了还原。


该系统利用 GPS 实现粗定位,然后采用图像匹配的方式实现精确的无标识跟踪注册。其原理都是一样的,即创建不同视点的真实场景参考图像数据库,然后进行反复匹配,通过算法找到真实场景和参考图像之间的相对位置关系,最后渲染融合显示。


总之「扫一扫」就是一个「构建数据库-匹配关键帧-算出相对位姿-融合显示」的过程,看似简单实则需要复杂的算法进行支撑。

所以,请珍惜每一个让你「扫码」的人。



嗨,这位朋友~扫一扫,关注我们 ARinChina 啊。

本文内容摘自科学出版社出版《增强现实技术导论》,王涌天、陈靖、程德文著。知识让人进步,尊重并感谢原作者。


分享至:
| 人收藏

相关阅读

Copyright © 2013-2017 ARinChina增强现实中国   All Rights Reserved.