科幻实现了?扩增实境有可能为未来的科技?

扩增实境，指得是将虚拟对象投射至现实中的技术，像是「游戏王」中的立体影像装置（去年已有神人完成决斗盘与投影系统），或是去年的 IKEA 型录，不过这只是一部份。扩增实境的对象不一定是 3D 立体影像（只是最多人用，也较有互动性），其原始概念是在你眼前加入现实中没有且可以实时互动的虚拟讯息，比如上面的血量、防御、时间，或是将准星对到队友身上跑出队友的相关信息。前些日子一度爆红的 glass 已能让扩增实境在真实世界中显示虚拟讯息，但还有一个功能并不完善，那就是直接在真实物体上显示正确的虚拟讯息。以CS的游戏画面来说，就是我们还无法让准星（镜头）对准队友（真实物体）后正确显示相关信息（虚拟对象）。
科幻实现了?扩增实境有可能为未来的科技?
为什么不行？人与机器在辨识物体上的差异
心理学将人辨识物体的方式分为「由下至上」与「从上到下」这两种模式（注意，接下来的叙述富有无聊的哲学意味）。「由下至上」指的是我们先是辨认出各种「特征」，根据这些特征进行辨认，这是一种被动的处理方式（也可以说，较为客观）。例如：看到一个有着四条腿、毛茸茸还摇着尾巴又汪汪叫的东西，我们便能说这是一条狗。「从上到下」则反过来，透过「情境」采取主动诠释的方式（较为主观），依据内心的期望来对接受的讯息进行解释。比如在吧台上，摆着两大罐开过的高粱以及一整排装满透明液体的 shot glass，你马上认定这透明液体就是高粱，但实际上你并没有足够多的信息来辨认；如果把 shot glass 换成平常的玻璃杯，旁边也没有任何高粱酒瓶，你或许就会认为这只是一杯白开水。辨认就是识别出「特征」与「情境」这两件事。对人来说，辨识是两种过程交互进行的结果，但对机器就不是这么一回事了，机器只有识别「特征」的能力。因此同一物体只要看起来不一样（换个角度或是光源不一样），机器就会有判别上的困难。

解决方法－标识符与机器学习
在 IKEA 的型录像片中，我们可以看到使用者将 IKEA 型录放在地上，device 侦测型录并显示相对应的虚拟对象，这就是「标识符」的概念（QR Code、二维条形码、RFID 等技术）。既然机器只能辨识「特征」，就为现实物体安上一个机器能够明确辨识的标识符，这样问题就迎刃而解了！不过这样的方法治标不治本，主因是「想要在哪里显示虚拟对象，就要在那里找到 QR Code」，想一下赛亚人侦测战斗力时，还要跟对方说「抱歉我找不到你的 QR Code」，实在是很不直觉又不帅气阿！
但标识符仍当前是解决辨识问题最常使用的方法，不只是计算机容易判读，对人来说也容易制作。标识符的相关技术也还在持续发展中，比如用红外线感应的隐形标识符，可以让真实物体不会再有丑丑的条形码。而另一个方法是让机器也能搞懂复杂情境的能力，这涉及到已经被科幻小说写到烂的人工智能。而在工程领域，「机器学习」正是尝试让机器也能玩阅读空气的跨领域学科，但不要忘了机器基本上还是只有辨识「特征」的能力，机器学习只是将复杂的真实情境简化成机器能辨识的特征。所以该如何让机器进行学习？其实跟人的学习一样，不外乎是从经验中（数据）找出共通点，并作为之后判断的标准。比如说你跟朋友约见面，朋友经常晚十分钟才到，那下次约见面时你就会去衡量自己要不要准时赴约，如果把他写成机器逻辑，那会是「跟别人约见面要准时，但如果是你朋友的话，可能要晚十分钟才对。」（如果对这部分有兴趣，可以参考深度学习──人工智能的现在与未来）。
科幻实现了?扩增实境有可能为未来的科技?
是最后一哩路？还是走不完的一哩路？
扩增实境从提出至今也过了二十年，许多成像与体感操作技术都在突飞猛进，但在辨识技术上却没飞的那么快，这也使得扩增实境的运用大多还是在娱乐媒介上面，像今年 E3 展上，Microsoft 开发的 hololens，把 Minecraft 的世界直接投影在会场上并用体感进行操作；但在日常生活中，辨识技术的不足将使得扩增实境的便利性不佳，如果带 glass 还要找商品条形码才能看到价格，我为什么不直接看柜子上的价格告示牌呢？人类技术能不能突破机器辨识上的落差，成为这最后一哩路最重要的关键，究竟这真的是最后一哩路，还是走不完的一哩路，还有待那些数据科学家们来为我们解答。内文部分来源于：胜博发灾民祈福 http://chiayuan.org.tw/

科幻实现了?扩增实境有可能为未来的科技?

猜你喜欢