传统机器学习优缺点 - 代码天地

传统机器学习优缺点

企业开发 2018-08-16 13:00:52 阅读次数: 0

判断算法优劣时，可从以下几点思考：

训练样本的数量
特征空间的维数
特征独立与否？
模型是否是线性可分？
过拟合现象？
速度、性能、内存

logistic回归的优缺点

优点：

容易实现，且易于解释（输出结果为概率）
计算速度快，内存占用少
lr的输出类型是一个与样本相关概率列表，我们任意设定阈值，从而得到我们想要的分类结果；
LR对数据中的小噪音的鲁棒性很好，并且轻微的多重共线性不会对其结果产生特别的影响。严重的多重共线性可以使用LR+L2正则来解决。

缺点：

当训练样本量大时，性能不好，同时容易发生欠拟合现象；
传统的LR是线性二分类器，只能处理二分类问题；
对于非线性特征，需要进行转换；

SVM的优缺点

优点：

相比较LR，其能解决非线性问题；
SVM 的最终决策函数只由少数的支持向量所确定,计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾难”，也就是相对能解决高维问题；
SVM是最好的现成的分类器（现成是指不加修改可直接使用），并且能够得到较低的错误率；

缺点：

SVM算法对大数据训练样本难以实施（需要求解m阶矩阵的运算，m是样本数）
SVM解决多分类问题存在困难
解决非线性问题时，无通用方法，需要谨慎选择核函数

决策树的优缺点

优点：

结果易于理解，可解释性强；
相比较于LR只能处理二值型特征，决策树可以处理连续性特征、数据型特征；
运行速度快；

缺点：

不支持在线学习（有新样本就要重新训练）
容易过拟合
忽略数据集中属性之间的相关性；
数据有缺失时处理困难；

朴素贝叶斯的优缺点

优点：

生成式模型，通过计算概率来进行分类（高偏差/低方差模型），对小数据适应良好适合增量式训练；
预测速度快

缺点：

对输入数据的表达形式很敏感
需要特征条件独立；

DBSCAN的优缺点

优点：

聚类速度快；
基于密度定义，能够有效处理噪声点
和k-means方法比，没有超参数，不需要事先定义簇的个数；
聚类簇形状没有偏倚，可以发现任何形状的簇

基于密度定义，相对抗噪音，能处理任意形状和大小的簇
缺点：

当空间聚类的密度不均匀、聚类间距差相差很大时，聚类质量较差，因为这种情况下参数MinPts和Eps选取困难。
在高维空间，密度的定义是个问题；

猜你喜欢

转载自blog.csdn.net/qq_19784349/article/details/81603012

传统机器学习优缺点

【机器学习】机器学习算法的优缺点

机器学习算法优缺点及应用

各种机器学习分类模型的优缺点

机器学习算法优缺点总结

机器学习常用的分类算法优缺点、

机器学习常用算法的优缺点总结

机器学习算法优缺点改进总结

传统方法与深度学习方法——优缺点辨析

专治机器学习面试：机器学习各个算法的优缺点！

【机器学习】集成学习各方法优缺点特征总结

机器学习-监督学习常见算法优缺点

【机器学习】每种算法的简介+优缺点总结

常见机器学习算法的优缺点

机器学习常见算法优缺点总结

机器学习算法优缺点及其应用领域

机器学习中的五种回归模型及其优缺点

十大机器学习算法优缺点

十大机器学习算法的优缺点及选择依据

常用机器学习算法优缺点及应用汇总

机器学习之多种算法优缺点总结

各种机器学习算法的优缺点（未完成）

机器学习算法优缺点对比及选择（汇总篇）

各种机器学习算法的优缺点（转知乎）

常见机器学习算法优缺点总结

机器学习常见算法分类，算法优缺点汇总

机器学习常见的分类算法的优缺点

机器学习中各个算法的优缺点（一）

机器学习中几个常见模型的优缺点

机器学习中各个算法的优缺点（四）

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)