sklearn.linear_model.LogisticRegression参数说明

其他 2019-11-02 22:50:47 阅读次数: 0

目录

sklearn.linear_model.LogisticRegression参数说明
sklearn.linear_model.LogisticRegressionCV

sklearn.linear_model.LogisticRegression参数说明

直接拷贝博文： https://www.cnblogs.com/wjq-Law/p/9779657.html

LogisticRegression(penalty='l2', dual=False, 
    tol=0.0001, C=1.0, fit_intercept=True, 
    intercept_scaling=1, class_weight=None, 
    random_state=None, solver='warn', max_iter=100,
    multi_class='warn', verbose=0, 
    warm_start=False, n_jobs=None)

penalty：惩罚项，可为'l1' or 'l2'。'netton-cg', 'sag', 'lbfgs'只支持'l2'。 >

'l1'正则化的损失函数不是连续可导的，而'netton-cg', 'sag', 'lbfgs'这三种算法需要损失函数的一阶或二阶连续可导。

调参时如果主要是为了解决过拟合，选择'l2'正则化就够了。若选择'l2'正则化还是过拟合，可考虑'l1'正则化。

若模型特征非常多，希望一些不重要的特征系数归零，从而让模型系数化的话，可使用'l1'正则化。

dual：选择目标函数为原始形式还是对偶形式。

将原始函数等价转化为一个新函数，该新函数称为对偶函数。对偶函数比原始函数更易于优化。

tol：优化算法停止的条件。当迭代前后的函数差值小于等于tol时就停止。
C：正则化系数。其越小，正则化越强。
fit_intercept：选择逻辑回归模型中是否会有常数项bb。
intercept_scaling：
class_weight：用于标示分类模型中各种类型的权重，{class_label: weight} or 'balanced'。

'balanced'：类库根据训练样本量来计算权重。某种类型的样本量越多，则权重越低。

若误分类代价很高，比如对合法用户和非法用户进行分类，可适当提高非法用户的权重。

样本高度失衡的。如合法用户9995条，非法用户5条，可选择'balanced'，让类库自动提高非法用户样本的权重。

random_state：随机数种子。
solver：逻辑回归损失函数的优化方法。

'liblinear'：使用坐标轴下降法来迭代优化损失函数。

'lbfgs'：拟牛顿法的一种。利用损失函数二阶导数矩阵即海森矩阵来迭代优化损失函数。

'newton-cg'：牛顿法的一种。同上。

'sag'：随机平均梯度下降。每次迭代仅仅用一部分的样本来计算梯度，适合于样本数据多的时候。

多元逻辑回归有OvR(one-vs-rest)和MvM(many-vs-many)两种，而MvM一般比OvR分类相对准确一些。但是，'liblinear'只支持OvR。

max_iter：优化算法的迭代次数。
multi_class：'ovr' or 'multinomial'。'multinomial'即为MvM。

若是二元逻辑回归，二者区别不大。

对于MvM，若模型有T类，每次在所有的T类样本里面选择两类样本出来，把所有输出为该两类的样本放在一起，进行二元回归，得到模型参数，一共需要T(T-1)/2次分类。

verbose：控制是否print训练过程。
warm_start：是否使用之前的解决方法作为初始拟合。
n_jobs：用cpu的几个核来跑程序。

sklearn.linear_model.LogisticRegressionCV

相比于LogisticRegression，LogisticRegressionCV使用交叉验证来选择正则化系数C。

猜你喜欢

转载自www.cnblogs.com/wangjs-jacky/p/11784491.html

sklearn.linear_model.LogisticRegression参数说明

sklearn.linear_model.LogisticRegression参数

sklearn.linear_model.LogisticRegression接口参数

sklearn.linear_model.LogisticRegression官方文档

sklearn.linear_model.LogisticRegression模型参数详解与predict、predict_proba源码解析

sklearn.linear_model.LogisticRegression()函数解析（最清晰的解释）

机器学习之逻辑回归（二）：逻辑回归的API调用——sklearn.linear_model.LogisticRegression中参数分别是什么意思

LogisticRegression - 参数说明

简单粗暴理解与实现机器学习之逻辑回归（二）：逻辑回归api介绍sklearn.linear_model.LogisticRegression(solver='liblinear', penalty=‘

sklearn.model_selection import train_test_split 概述、参数说明及用法

sklearn.model_selection 中 train_test_split 概述、参数说明及用法

逻辑斯蒂回归分类算法[sklearn.linear_model/LogisticRegression/最大似然/梯度下降]

sklearn svm.LinearSVC的参数说明

sklearn逻辑回归参数说明

Xgboost的sklearn接口参数说明

sklearn.svm.SVC参数说明

Sklearn之sklearn.linear_model.LogisiticRegression参数详解

sklearn常用的API参数解析：sklearn.linear_model.LinearRegression

model.fit参数说明

机器学习：sklearn.svm.SVC 参数说明

sklearn.feature_extraction.text.CountVectorizer 参数说明

sklearn 神经网络 MLPClassifier简单应用与参数说明

【MLPclassifier】sklearn 神经网络MLPclassifier参数说明

使用sklearn--Random Forest参数说明，随机森林调参数

JDBC参数说明

JVM参数说明

inlate参数说明

Socket参数说明

jvm 参数说明

ldirectord参数说明

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)