AI技术与脸部辨识 辅助FND顺练演算辨识

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/lowpeys5166/article/details/86526684

你可能听过,河南的农村,非洲的城市,每个想象不到的地方,有大量的数据标记员。他们手动把图片里的花瓶和汽车框出来,标上「花瓶」和「汽车」文字。一段时间后,这些人把成千上万张标记的图片打包,传送给远在北京、上海甚至旧金山的 AI 公司。你可以将这些人称为《帮人工智能打工的人》。人工智能发展迅速,大大小小的网络科技公司相继开展研究,投入商用。然而训练可用的 AI,需要大量准确标记好的图片、影片等数据库。

正因为此,市场对数据标记的需求如此大,吸引「帮 AI 打工的人」争相加入,不乏找不到工作的闲散人──毕竟这份工作只需动动鼠标,用不了太多知识。但恐怕不久后,这些人将再次失业。上周,约翰‧霍普金斯大学、史丹佛大学和 Google 专家联合发表一篇论文,介绍使用神经网络自动搜寻神经网络,投入影像分割研究,并取得重要进展:研究人员采用神经架构搜寻(Neural Architecture Seartch,NAS)技术设计一个神经架构(A),放任它自动搜寻/设计新的神经架构(B),投入影像语义分割(semantic image segmentation)工作。

研究人员发现,自动搜寻出来的神经架构 B,在主流小型影像数据集,未经训练就直接使用,表现竟超过人类设计、预先训练好的模型。以往人们一直相信,设计 AI 需要大量知识和经验,简而言之就是需要人来设计。但现在,AI 设计的 AI,已经比人设计的 AI 更强。论文题目为《Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation》。研究人员将能自动搜寻(设计)神经架构的技术命名为 Auto-DeepLab。这个名字来自 DeepLab,Google 人工开发的影像语义分割技术。前面加上 Auto,意思是在 DeepLab 的基础上,新技术可做到很大程度的自动化。

论文署名作者中,两人来自约翰‧霍普金斯大学,第一作者是 Chenxi Liu,曾在 Google 实习;4 人来自 Google;剩余一人来自史丹佛大学,正是前 Google Cloud 首席科学家,计算机视觉学术和业界都知名的李飞飞。「本着 AutoML(注:Google 主导的 AI 计划,将选择算法、超参数调整模型,建模更新和评估模型等工作自动化)和人工智能普及化的精神,对不依赖专家经验知识,自动设计神经网络架构,人们的兴趣有显著提升。」作者提到。在「AI 自动设计 AI」这件事上,Auto-DeepLab 有几个较重要的新尝试。

首先,神经架构搜寻 NAS 技术是 AI 领域的新兴物种,主要用于简单的图片分类。这篇论文里,研究者首次尝试将 NAS 投入高密度的图片预测工作(也就是语义分割更复杂的高分辨率图片,如 Cityscapes 城市街景数据集、PASCAL VOC 2012 和 ADE20K 等数据集)。其次,计算机视觉领域的神经网络架构,通常分为内外两层的两级架构,自动化的神经架构设计往往只能设计内层,外层仍需人来设计和手调。而 Auto-DeepLab 是第一个让 AI 掌握外层设计和调参能力,并在影像语义分割工作得到优异结果的尝试。「影像语义分割」6 个字听起来拗口,其实很好理解:分类一张图,然后将所有像素点归类。比如下面这张图,可简单分成三类。影像语义分割的工作,就是判断每个像素点属于人、自行车还是背景。

需要明确的是,影像语义分割的工作纯粹是判断像素点属于哪类,无法辨识和区分独立物体。不过影像语义分割仍有很重要的意义,比如可用于手机拍照的「人像模式」。采用更优秀的影像语义分割技术,手机能在更高精确度的照片里确认每个像素点,属于人或是背景。目前 Google、小米等公司都在手机拍照使用这技术。理论上,未来的「人像模式」可在毛发、衣物边缘达成更好的效果。

自动驾驶场景里,神经网络需要判断挡在前面的是车、行人还是建筑物,进而采用不同策略行动,这同样需要影像语义分割打基础。

从论文效果来看,Auto-DeepLab 还可移转到其他工作。言外之意,让 AI 自动设计 AI 这件事,可能会有很大的想象空间。比如作者在论文最后提到,目前的研究框架内,他们可继续研究物体辨识方向。如果能取得类似结果,大规模使用,说不定有一天,数据标记(特别是影像标记)这件事,人类标记员的成本等优势可能会消失。如果人工智能可帮人工智能打工,效率还比人高……「帮人工智能打工的人」,会失去工作吗?参考AI人工智能信息:http://www.cafes.org.tw/info.asp

猜你喜欢

转载自blog.csdn.net/lowpeys5166/article/details/86526684
今日推荐