分类与预测-LogisticRegression - 代码天地

分类与预测-LogisticRegression

其他 2020-09-21 11:46:09 阅读次数: 0

1. 分类与预测

1.1 介绍与实现过程

分类和预测是预测问题两种主要类型
- 分类主要是预测分类标号（离散属性），构造一个分类模型，输入样本的属性值，输出对应的类别，将每个样本映射到预先定义好的类别中。
- 预测主要是建立连续值函数模型，预测给定自变量对应的因变量的值，是指即那里两种或两种以上变量间相互依赖的函数模型，然后进行预测和控制。
实现过程
- 第一步：学习，通过归纳分析训练样本集建立数据模型，得到相应规则
- 第二步：分类/预测：先用已知的测试样本评估准确性，通过检验后对未知数据进行预测

1.2 常用的分类与预测的算法

方法介绍
- 回归分析：是确定预测属性（数值型）与其他变量间相互依赖的定量关系最常用的统计学方法。包括：线性回归、非线性回归、logistics回归、岭回归、主成分回归、偏最小二乘回归等模型
- 决策树：采用自顶向下的递归方式，在内部节点进行属性比较，并根据不同的属性值从该节点向下分支，最终得到的叶节点是学习划分的类
- 人工神经网络：是一种模仿大脑神经网络结构和功能而建立的信息处理系统，表示神经网络输入与输出变量之间关系的模型
- 贝叶斯网络：又被成为信度网络
- 支持向量机：是一种通过某种非线性映射，把低维的非线性可分转化为高维的线性可分，在高维空间进行线性分析的算法

1.3 Logistic回归分析介绍

Logistic回归的本质实际上是：假设数据服从这个分布，然后使用极大似然估计做参数估计
对于二分类问题，回归模型中只有1-0两种取值（如是和否、发生不发生）假设在p个独立自变量 $x_1$ 、 $x_2$ 、 $x_3$ … $x_p$ 作用下，记y取1的概率为 $p = P (y = 1 ∣ X)$ ，取0的概率为 $1 - p$ ，取1和取0的概率之比为 $\frac{p}{1-p}$ ，称为事件的优势比odds，对优势比取对数，可得： $Logit(p)=ln(\frac{p}{1-p})$ ，则 $p=\frac{1}{1+e-z}$ 即为Logistic函数

1.4 案例操作

import pandas as pd
from sklearn.linear_model import LogisticRegression as LR
filename = r"..\data\bankloan.xls"
data = pd.read_excel(filename)
x= data.iloc[:,:8].values
y = data.iloc[:,8].values
lr = LR()
lr.fit(x,y)
print('模型的平均准确度为：%s'%lr.score(x,y))

猜你喜欢

转载自blog.csdn.net/ava_zhang2017/article/details/108306518

LogisticRegression 预测分类

分类与预测-LogisticRegression

使用sklearn进行鸢尾花分类预测模型：LogisticRegression

LogisticRegression

基于sklearn的LogisticRegression多分类实践

LogisticRegression算法之分类实操

python良\恶性肿瘤预测-LogisticRegression以及SGDClassifier

spark.mllib源码阅读-分类算法1-LogisticRegression

基于sklearn的LogisticRegression二分类实践

Python 分类和预测

7.分类与预测

分类预测&聚类

肿瘤分类与预测（SVM）

逻辑斯蒂回归分类算法[sklearn.linear_model/LogisticRegression/最大似然/梯度下降]

Python scikit-learn，二分类，逻辑回归，LogisticRegression

Python(LogisticRegression)

2.Kaggle：根据所放调料预测菜品属于哪一个菜系（LogisticRegression）

python分类预测模型总结

R语言分类预测---KNN

数据挖掘中的分类与预测

分类与预测算法的评价

python分类预测模型的特点

数据挖掘导论——分类与预测

简单机器学习——最简单分类算法（LogisticRegression二分类线性模型、LinearSVC一对其余分类器）

Coursera吴恩达机器学习编程作业（ex3）用LogisticRegression和NeuralNetwork处理MultiClass分类

逻辑斯蒂回归LogisticRegression 案例01：良/恶性乳腺癌肿瘤诊断分类（逻辑回归算法模型）

基于jieba,TfidfVectorizer,LogisticRegression进行搜狐新闻文本分类利用jieba,word2vec,LR进行搜狐新闻文本分类

利用jieba,word2vec,LR进行搜狐新闻文本分类基于jieba,TfidfVectorizer,LogisticRegression进行搜狐新闻文本分类

分类与预测算法评价标准

xgboost实现蘑菇数据分类预测demo

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)