机器学习系列(一)—— 绪言

一、序言

刚进入研一,目前正在学习机器学习相关课程,从本篇博客开始记录学习历程,和大家一起共同学习进步!在学习之前,最好有数学基础(高等数学、线性代数和概率论数理统计)和Python基础。如果没学过Python可以到这里学习 => 《Python菜鸟教程》。由于本人为初学者,若在内容上有不当之处,还请各位前辈和同学帮忙指出。

在这里插入图片描述

二、机器学习简介

1、机器学习

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径。
机器学习是一类算法的统称,机器学习方法是计算机利用已有的数据(经验),得出了某种模型(规律),并利用此模型预测未来(结果)的一种方法。

在这里插入图片描述

2、机器学习和人工智能

2.1 人工智能、机器学习、神经网络和深度学习的关系如下:

在这里插入图片描述

2.2 机器学习的分类:

  • 有监督学习:分类和回归属于监督学习,这类算法必须知道预测什么。即目标变量的分类信息。(分类问题、回归问题属于有监督学习)
  • 无监督学习:此时数据没有类别信息,也不会给定目标值。(聚类问题属于无监督学习)
  • 强化学习:又称增强学习,通过与环境进行交互来学习解决问题的一类算法。

在这里插入图片描述

2.3 机器学习关注的问题

2.3.1 分类问题

划分有限个类别,根据数据样本的特征,判断属于哪一个类别。常见的如:(1)垃圾邮件分类 (2)图像分类 (3)文字识别

2.3.2 回归问题

根据数据样本上抽取出的特征,预测一个连续值的结果。常见的如:股票走势、房价走势等

2.3.3 聚类问题

根据数据样本上抽取出的特征,让样本抱抱团(相近/相关的样本在一团内)。如:用户群体划分和新闻分类。

三、机器学习的应用

3.1 计算机视觉

典型的应用包括:人脸识别、车牌识别、扫描文字识别、图片内容识别、图片搜索等等。

3.2 自然语言处理

典型的应用包括:搜索引擎智能匹配、文本内容理解、文本情绪判断,语音识别、输入法、机器翻译等等。

3.3 社会网络分析

典型的应用包括:用户画像、网络关联分析、欺诈作弊发现、热点发现等等。

3.4 推荐

典型的应用包括:虾米音乐的“歌曲推荐”,某宝的“猜你喜欢”等等。

四、机器学习的步骤

本部分来自CSDN博主zxhohai
通常学习一个好的函数,分为以下三步:
1、选择一个合适的模型,这通常需要依据实际问题而定,针对不同的问题和任务需要选取恰当的模型,模型就是一组函数的集合。
2、判断一个函数的好坏,这需要确定一个衡量标准,也就是我们通常说的损失函数(Loss
Function),损失函数的确定也需要依据具体问题而定,如回归问题一般采用欧式距离,分类问题一般采用交叉熵代价函数。
3、找出“最好”的函数,如何从众多函数中最快的找出“最好”的那一个,这一步是最大的难点,做到又快又准往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。
学习得到“最好”的函数后,需要在新样本上进行测试,只有在新样本上表现很好,才算是一个“好”的函数。

开发机器学习应用程序的步骤:(Step 4 -5为核心)

  1. 收集数据
  2. 准备输入数据 =>为算法准备特定的数据格式
  3. 分析输入数据 =>确保数据集中没有垃圾数据
  4. 训练算法 =>从输入数据中抽取知识和信息
  5. 测试算法 =>
  6. 使用算法 => 将机器学习算法转化成应用程序,执行实际任务

五、学习路线

0.math (数学基础)

1.python-basic (python基础)

2.numpy(numpy基础)

3.pandas(pandas基础)

4.scipy(scipy基础)

5.data-visualization(数据可视化基础,包含matplotlib和seaborn)

6.scikit-learn(scikit-learn基础)

7.machine-learning(机器学习基础)

8.deep-learning(深度学习基础)

9.feature-engineering(特征工程基础)

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_35843514/article/details/109103424
今日推荐