学习心得与总结

模式识别的基本定义是根据已有知识的表达，针对待识别模式，判别决策其所属的类别或者预测其对应的回归值，本质上是一种推理过程。模式识别在数学解释上可以看作一种函数映射f(x)，是关于已有知识的一种表达方式，也可以称作模型，狭义的模型由特征提取和回归器组成的。

模式识别的任务形式有分类和回归，前者的输出量是输出量是离散的类别表达，后者则是单个或多个维度连续的信号表达（即回归值）。回归是分类的基础，离散的类别值是由回归值做判别决策得到的，所以分类器是由回归器与判别函数构成，其加上特征提取则构成广义的模型。

很显然想要进行模式识别离不开模型，想要确定模型，就需要先设计好模型结构，然后由机器学习通过训练样本得到模型参数。模型结构通常由设计人员事先给定，不过如何学习模型结构也是当前和未来机器学习领域的研究内容之一。模型结构根据是否适用于线性可分/线性表达，分为线性和非线性两种。

训练样本是通过采样得到的模式，即输入特征空间中的向量，假设满足iid条件，通常是高维度的尚未加工的原始知识，例如一幅图像。训练样本经过学习后得到的模型才是真正知识表达。

训练样本个数远大于模型参数个数时产生Over-determined，没有准确的解，需要加入目标函数以待学习的模型参数作为自变量来额外添加一个标准，并通过优化该标准来确定一个近似解，最大化或最小化目标函数的技术叫作优化算法。训练样本个数远小于模型参数个数时产生Under-determined，有无数个解或无解，需要在目标函数中加入能够体现对于参数解的约束条件，据此从无数个解中选出最优的一个解。

机器学习的常用方式有四种。监督式学习，训练样本及其输出真值都给定，是最常见的学习方式，通常使用最小化训练误差作为目标函数进行优化。无监督式学习 ，只给定训练样本但没有给输出真值，其难度远高于监督式学习，通常根据训练样本之间的相似程度来进行决策，典型应用有聚类和图像分割。半监督式学习，既有标注的训练样本又有未标注的训练样本，可以看作有约束条件的无监督式学习问题，即标注过的训练样本用作约束条件，典型应用有网络流数据。强化学习，机器自行探索决策，真值滞后反馈的过程，适用于累积多次决策动作才能知道最终结果好坏，很难针对单次决策给出对应的真值的任务，例如棋类游戏。

人工智能领域的前沿技术介绍、展望、应用

自动驾驶是近年来汽车领域最热门的话题，科技公司如谷歌、百度等大力投入到自动驾驶算法的研究当中，希望在解决方案的市场中占得先机；传统车企如大众、通用等尝试通过收购和合作的方式加快自动驾驶汽车的落地；科技初创企业如Driver AI、景驰科技等希望以技术供应商的身份切入。

自动驾驶的大致过程分三步。第一，借助技术感知周围的环境，如道路、行人和车辆。第二，构建视觉高精度地图。第三，让AI驾驶员做出决策。自动驾驶算法分规则算法和深度学习算法，规则算法通过人为定义行驶规则的方式帮助车辆进行决策，深度学习算法则通过大量数据的训练实现复杂场景的处理；现在自动驾驶解决方案的发展方向是两种算法相结合，顶层采用规则算法，根据场景进行层级遍历，底层采用深度学习算法，基于具体场景分模块进行深度训练。

自动驾驶在不同场景的渗透速度与技术实现难度和付费方接受程度有关。从场景路况复杂度来看，技术实现难度从低到高依次为园区巴士，公交巴士，货运卡车和打车服务。从客户适用性来看，园区巴士技术难度低，对成本控制效果显著，渗透速度较快；公交巴士付费方为政府，成本不敏感，安全敏感度较高，渗透速度较慢；物流运输行业整体集中度低，巨头有能力和需求实现自动驾驶产品落地，但相对整个市场渗透率仍相对较低；打车服务付费方为商户端，该行业市场很容易获得较高的市场份额，且自动驾驶能够减少40%的运营成本，在高额利润驱动下，渗透速度较快。

自动驾驶改变的不仅仅是驾驶行为，还会带来出行方式、城市规划和零售行业的变革。自动驾驶的普及导致出行服务更加方便快捷，可能会将购买私家车变成一种小众行为；在通勤时间和通勤体验有明显改善后，房地产价值将重新得到评估，城市边界的拓展将会加速；零售品物流更加高效，可能出现移动迷你试衣间或迷你便利店等零售终端。

机器学习第一次作业

学习心得与总结

人工智能领域的前沿技术介绍、展望、应用

猜你喜欢