AI基本概念和应用

AI 的发展势头

5.17日美国旧金山Google I/O 大会上，Google CEO 开场就再次强调了公司战略从“Mobile first to AI first”，称 Google 会因此重新思考自己的所有产品，还要把人工智能用到学术研究、医学的层面。所以会议上十几项新产品的宣布，都是在展示 AI 的成果。

习大大在 G20峰会提出人工智能会是未来的发展趋势，十九大报告明确提出“推动互联网、大数据、人工智能和实体经济深度融合”。

近一个月内的新闻AI 也是热门。

迪拜机场 CEO：AI 时代，机场安检和入境检查都会消失。

国际体操联合会（FIG）:计划引进人工智能技术来助力2020年东京奥运会评分系统。

硅谷最神秘的 AI 公司Vicarious :发明新型神经网络，可破解一切验证码

历史以来，人们一致认为验证码是区分人与机器的重要手段，而现在机器也能实现破解一切的验证码，不管是字符、还是图形。

在之前，AI领域的大部分投资是由内部研发投资，集中在谷歌、亚马逊等财力雄厚的巨头公司，现在国内 BAT 也在大力发展 AI。

百度提出All In AI，有号称全球领先的人工智能服务平台。腾讯有 AI Lab以及西雅图 AI 实验室，重点的研究方向为计算机视觉、语音识别、自然语言处理和机器学习。阿里巴巴有人工智能实验室首次亮相，方向是消费级 AI 产品的研发。

这篇文章主要讲讲 AI 的基本概念，并且结合实际生活场景讲讲 AI 的现在的AI都用于哪些领域。

AI 的基本概念

AI：Artificial Intelligence，人工智能。

利用计算机来对人的意识、思维信息过程、智能行为进行模拟（如学习、推理、思考、规划等）和延伸，使计算机能实现更高层次的应用。

ML：Machine Learning，机器学习。

从数据中学习的AI叫做机器学习。机器学习是指从一系列的原始数据中提取人们可以识别的特征，然后通过学习这些特征，最终产生一个模型。

AGI：Artificial General Intelligence，强人工智能。

AGI是拥有像人一样的智慧的计算机，更接近于人力智慧的人工智能。

另外还有几个相关概念提的比较多：

DM：Data Mining，数据挖掘。

从海量数据中“挖掘”隐藏信息，从大量的、模糊的、随机的实际应用数据中，提炼隐含的、规律性的，并且又能被理解的信息。数据挖掘基于数据仓库。

DL：Deep Learning，深度学习。

机器学习的一个子集，用复杂、庞大的神经网络进行机器学习，也是机器学习里面现在比较火的一个Topic，目前在图像，语音等富媒体的分类和识别上取得了非常好的效果。

综合来说，可以理解为：机器学习是实现人工智能的一种手段，也是数据挖掘采用的一个重要方法，但机器学习是另一门学科，并不从属于数据挖掘，也不属于人工智能。

AI 的实际应用

机器视觉：（Machine vision）

应用场景：

Google I/O 大会上，发布了一款名叫 Google Lens 的新相机产品，让在场的所有听众都很雀跃。Google Lens具有一些最基本的AI识别功能。

比如拍一张花朵的照片，可以快速提示用户这是什么花，对花粉过敏的用户群来讲，是一大福利。

去到朋友家，扫描朋友家Wi-Fi 的用户名/密码，或者是条形码，手机就会自动连接到网络上，省去手动查找网络、输入密码的繁琐。

另外，如果来到一个新的城市，打开 Google Lens 对着随便一家餐馆扫描，它能够自动在 Google 的数据库里资料展示出来，包括菜单、评分、营业时间等等，甚至会提醒用户是否需要帮忙预约定位。

优点：便利、快捷

缺点：影响因素多（光源选择、镜头的像素、照片清晰度、对比度）

自动规划

从某个特定的问题状态出发，建立一系列行为标准和操作系列，从而实现一个预先设定的目标，或者期望的效果。

自动规划人类的行为、智能服务于人类的人工智能其实已经发展很久了，只是我们没有意识到，比如搜索和推荐系统。

传统搜索只是搜索一个内容，主流搜索引擎一页给出多个结果，有了人工智能的分析，以一种更切合用户期望和习惯的形式将搜索结果呈现给用户。

比如，用户搜索《爸爸去哪儿》，则排在第一位的是视频播放，点击后能进去立即看视频。甚至猜测用户可能会喜欢《爸爸回来了》，一并推荐给用户。

搜索深圳市平安金融中心，地址和地图出现的同时，也提供给我入口选择我的起点，并且可以选择公交或驾车的方式。传通查询路线的步骤一般会是：查地点》进入地图》设为终点》选择起点》选择交通方式为驾车》确定，现在变成直接：输入起点》点击驾车即可。极大的符合了用户的习惯，也降低了操作的复杂度。

自动驾驶，就是把人类驾驶的手脚、眼睛、大脑分别定义为执行器、控制器、传感器，从而通过机器来模拟实现人类的驾驶行为。

生物识别

通过计算机，与光学、声学、生物传感器、统计学的概念手段结合，利用人体固有的生理特性和行为特征进行个人身份的鉴定。

通常意义的生物识别，包含了指纹识别，人脸识别，视网膜识别，虹膜识别，甚至还有掌纹识别。

从采集纬度上，可分为固有生理特性和人力行为特征。固有生理特性是指指纹、脸像、虹膜，行为特征是指笔迹、声音、步态等。

从自然纬度上，生物识别可分为自然性和非自然性，自然性是指该识别方式，同时适用于人类和其他自然生物。人脸、语音、体形，属于自然性生物识别。指纹、虹膜属于非自然性生物识别。

生物识别的通用流程

人脸识别

基于人的脸部特征信息进行身份识别。

应用场景

小米手机拍照根据人脸的轮廓，肤色，纹理，色彩等特征来计算照片中主人公的年龄。

美国“9.11”事件后，很多国家在机场里使用人脸识别技术，在拥挤的人群中可以随意挑出某一张面孔，并判断他是不是通缉犯。

下图一个典型的对开门进行人脸识别的案例。

优点：免物理接触、不易被个体察觉、自然性

缺点：人脸具有相似性、易变性、可干扰性（例如发型、眼镜、口罩、墨镜、头发、胡须都有可能引起比对失败。而在不同观察角度，人脸的视觉图像也相差很大，另外，人脸识别还受光照条件白天和夜晚，室内和室外影响、年龄等多方面因素的影响。用户的配合程度也有很大的影响。）

虹膜识别

基于眼睛中的虹膜进行身份识别。

人眼睛的虹膜，包含了最丰富的纹理信息，占眼睛外观的65%。虹膜在整个生命历程中将是保持不变的。因此具有唯一性，从而可以作为身份识别的标准。

应用场景：

一般用于政府、军队、银行等安全防务等领域，以及有高度保密需求的场所。

Google.ai有个项目被医学界认为“举世瞩目”的事情，通过眼底扫描片，深度学习来识别糖尿病患者并发出警告。

优点：快捷、精准度高、最可靠的生物识别技术、免物理接触、唯一性。

缺点：采样区域小、图像获取难、镜头对成像影响大、设备造价高。

指纹识别

以用户的十个手指指纹采集和鉴别，作为区分身份的唯一标识。

应用场景

去过美国的同学都知道，美国办理签证时，以及入境时是一定会收集十个手指指纹的。

国内电子版港澳通行证也是存有数字化的个人资料和个人的拇指指纹信息，可以使用拇指指纹，用口岸自助查验通道实现自助通关。

优点：唯一性、终身不变性、便捷性

缺点：需要利用电子压力传感器采集指纹，采集方式需要人为的配合，也容易留下痕迹被恶意伪造。另外容易出现伤口和各种原因导致的不完整性。

机器人学

机器人是一个综合性的人工智能产品。

应用场景

常见的机器人具有机械手和步行结构，可以用来送快递。

专家系统

模拟人类专家解决领域问题的系统。数据库里包含含有大量的某个领域专家水平的知识与经验，跟进用户的咨询进行推理和判断，模拟人类专家的决策过程。

按系统任务类型一般可分为解答型、预测型、控制型、教育型、诊断型。

应用场景

一般比如在线机器人客服、在线测评分析等，就是属于解答型和诊断型

编码遗传

AI Programmer，由人类驱动的部分非常少，只需要在开始输入指令，最后接收适用于某项任务的函数即可，剩下部分全部由机器完成。

AI 的后续发展

更加去人化

语音识别作为一种非常自然的交互方式，在可穿戴设备、智能家居、教育领域等各方面都会有大量的应用场景。Siri、Google Assistant目前已经实现用自然的语言跟用户对话，触发翻译、搜索、通话、支付等需要，代替掉用户手工的操作。

生物识别也可以大量的用于各种安保防卫领域。

消灭体力和重复的任务

去掉一些很有必要、但是重复性高、且难度较低的流水线式工作。

比如可以通过机器人代替人工进行扫描快递单信息按区域进行分拣快递的操作，通过照片自动识别商品所处位置告知用户，实现无人化超市。

预防危险发生

作业场景中危险的部分由机器来动手，这就保证了在背后操作人员的安全。比如用于危险动物纪录片拍摄、地震救援、空中探测等。

这篇文章就讲这些，下一篇文章会讲讲 AI 的架构、AI 的核心、未来一段时间 AI 的重点领域，以及对我们的影响。