MachineLearning入门---第1章-基础了解

我目前是一名java程序,对机器学习一无所知,想按照当初学java的路子学机器学习 —了解大概就直接干, 然后回过来慢慢深究其中的理论!

参考:
https://easyai.tech/ai-definition/machine-learning/#what
https://ww2.mathworks.cn/discovery/machine-learning.html

什么是机器学习
机器学习是一种数据分析技术,让计算机执行人和动物与生俱来的活动:从经验中学习。机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预定方程模型。当可用于学习的样本数量增加时,这些算法可自适应提高性能。

机器学习的基本思路

  1. 把现实生活中的问题抽象成数学模型,并且很清楚模型中不同参数的作用
  2. 利用数学方法对这个数学模型进行求解,从而解决现实生活中的问题
  3. 评估这个数学模型,是否真正的解决了现实生活中的问题,解决的如何?

机器学习的实操的7个步骤:

  1. 收集数据
  2. 数据准备(特征工程等)
  3. 选择一个模型(即算法)
  4. 训练
  5. 评估 (指标主要有 准确率、召回率、F值)
  6. 参数调整
  7. 预测(使用)

机器学习的方式
机器学习采用两种技术:监督式学习无监督学习。监督式学习根据已知的输入和输出训练模型,让模型能够预测未来输出;无监督学习从输入数据中找出隐藏模式或内在结构。
监督学习:
监督学习是指我们给算法一个数据集,并且给定正确答案。机器通过数据来学习正确答案的计算方法。监督式学习采用分类和回归技术开发预测模型

常用的分类算法包括:支持向量机 (SVM)、提升 (boosted) 决策树和袋装 (bagged) 决策树、k-最近邻、朴素贝叶斯 (Naïve Bayes)、判别分析、逻辑回归和神经网络。

常用回归算法包括:线性模型、非线性模型、规则化、逐步回归、提升 (boosted) 和袋装 (bagged) 决策树、神经网络和自适应神经模糊学习。

无监督学习
非监督学习中,给定的数据集没有“正确答案”,所有的数据都是一样的。无监督学习的任务是从给定的数据集中,挖掘出潜在的结构。聚类是一种最常用的无监督学习技术

常用的聚类算法包括:k-均值和 k-中心点(k-medoids)、层次聚类、高斯混合模型、隐马尔可夫模型、自组织映射、模糊 c-均值聚类法和减法聚类。

特征工程: https://easyai.tech/ai-definition/feature-engineering/
https://zhuanlan.zhihu.com/p/111296130
特征工程是将原始数据转化成更好的表达问题本质的特征的过程,使得将这些特征运用到预测模型中能提高对不可见数据的模型预测精度。

数据集: https://easyai.tech/ai-definition/3dataset-and-cross-validation/
训练集: 是用来训练模型使用的, 训练集相当于上课学知识,老师手把手教的那些东西;
验证集: 用来验证模型的好坏,及时调整参数,相当于课后练习题,检验学习效果
测试集: 我们通过测试集,来做最终的评,相当于考试,

猜你喜欢

转载自blog.csdn.net/xy3233/article/details/121292786