科幻实现了?扩增实境有可能为未来的科技?

扩增实境,指得是将虚拟对象投射至现实中的技术,像是「游戏王」中的立体影像装置(去年已有神人完成决斗盘与投影系统),或是去年的 IKEA 型录,不过这只是一部份。扩增实境的对象不一定是 3D 立体影像(只是最多人用,也较有互动性),其原始概念是在你眼前加入现实中没有且可以实时互动的虚拟讯息,比如上面的血量、防御、时间,或是将准星对到队友身上跑出队友的相关信息。前些日子一度爆红的 glass 已能让扩增实境在真实世界中显示虚拟讯息,但还有一个功能并不完善,那就是直接在真实物体上显示正确的虚拟讯息。以CS的游戏画面来说,就是我们还无法让准星(镜头)对准队友(真实物体)后正确显示相关信息(虚拟对象)。
科幻实现了?扩增实境有可能为未来的科技?
为什么不行?人与机器在辨识物体上的差异
心理学将人辨识物体的方式分为「由下至上」与「从上到下」这两种模式(注意,接下来的叙述富有无聊的哲学意味)。「由下至上」指的是我们先是辨认出各种「特征」,根据这些特征进行辨认,这是一种被动的处理方式(也可以说,较为客观)。例如:看到一个有着四条腿、毛茸茸还摇着尾巴又汪汪叫的东西,我们便能说这是一条狗。「从上到下」则反过来,透过「情境」采取主动诠释的方式(较为主观),依据内心的期望来对接受的讯息进行解释。比如在吧台上,摆着两大罐开过的高粱以及一整排装满透明液体的 shot glass,你马上认定这透明液体就是高粱,但实际上你并没有足够多的信息来辨认;如果把 shot glass 换成平常的玻璃杯,旁边也没有任何高粱酒瓶,你或许就会认为这只是一杯白开水。辨认就是识别出「特征」与「情境」这两件事。对人来说,辨识是两种过程交互进行的结果,但对机器就不是这么一回事了,机器只有识别「特征」的能力。因此同一物体只要看起来不一样(换个角度或是光源不一样),机器就会有判别上的困难。

解决方法-标识符与机器学习
在 IKEA 的型录像片中,我们可以看到使用者将 IKEA 型录放在地上,device 侦测型录并显示相对应的虚拟对象,这就是「标识符」的概念(QR Code、二维条形码、RFID 等技术)。既然机器只能辨识「特征」,就为现实物体安上一个机器能够明确辨识的标识符,这样问题就迎刃而解了!不过这样的方法治标不治本,主因是「想要在哪里显示虚拟对象,就要在那里找到 QR Code」,想一下赛亚人侦测战斗力时,还要跟对方说「抱歉我找不到你的 QR Code」,实在是很不直觉又不帅气阿!
但标识符仍当前是解决辨识问题最常使用的方法,不只是计算机容易判读,对人来说也容易制作。标识符的相关技术也还在持续发展中,比如用红外线感应的隐形标识符,可以让真实物体不会再有丑丑的条形码。而另一个方法是让机器也能搞懂复杂情境的能力,这涉及到已经被科幻小说写到烂的人工智能。而在工程领域,「机器学习」正是尝试让机器也能玩阅读空气的跨领域学科,但不要忘了机器基本上还是只有辨识「特征」的能力,机器学习只是将复杂的真实情境简化成机器能辨识的特征。所以该如何让机器进行学习?其实跟人的学习一样,不外乎是从经验中(数据)找出共通点,并作为之后判断的标准。比如说你跟朋友约见面,朋友经常晚十分钟才到,那下次约见面时你就会去衡量自己要不要准时赴约,如果把他写成机器逻辑,那会是「跟别人约见面要准时,但如果是你朋友的话,可能要晚十分钟才对。」(如果对这部分有兴趣,可以参考深度学习──人工智能的现在与未来)。
科幻实现了?扩增实境有可能为未来的科技?
是最后一哩路?还是走不完的一哩路?
扩增实境从提出至今也过了二十年,许多成像与体感操作技术都在突飞猛进,但在辨识技术上却没飞的那么快,这也使得扩增实境的运用大多还是在娱乐媒介上面,像今年 E3 展上,Microsoft 开发的 hololens,把 Minecraft 的世界直接投影在会场上并用体感进行操作;但在日常生活中,辨识技术的不足将使得扩增实境的便利性不佳,如果带 glass 还要找商品条形码才能看到价格,我为什么不直接看柜子上的价格告示牌呢?人类技术能不能突破机器辨识上的落差,成为这最后一哩路最重要的关键,究竟这真的是最后一哩路,还是走不完的一哩路,还有待那些数据科学家们来为我们解答。内文部分来源于:胜博发灾民祈福 http://chiayuan.org.tw/

猜你喜欢

转载自blog.51cto.com/13220658/2328456
今日推荐