转 R 广义线性模型1 自变量：Logistic - 代码天地

转 R 广义线性模型1 自变量：Logistic

企业开发 2018-06-06 16:12:16 阅读次数: 4

计划问题：婚内出轨的原因分析

# 1、准备数据

install.packages("AER")
data(Affairs,package="AER")
tt<-Affairs
# 数据集中的几个字段：
# affairs出轨次数,gender性别,age年龄,yearsmarried婚龄,children是否有小孩,
# religiousness宗教信仰评分,educationj教育程度,occupation职业评分,rating婚姻自我评价

# 2、处理数据

# 变量重编码
tt$y[tt$affairs==0]<-0
tt$y[tt$affairs>0] <-1
tt$y<-as.faco
tt<-tt[,-1]

# 3、利用Logictic回归进行拟合

model<-glm(y~.,data=tt,family=binomial())
summary(model)
tstep<-step(model,,direction = c("both"))
summary(tstep)
drop1(tstep)
model<-glm(y~age+yearsmarried+religiousness+rating,data=tt,family=binomial(link = "logit"))
summary(model)
coef(model)
exp(coef(model))

# 4、利用泊松回归进行拟合

model1<-glm(y~.,data=tt,family=poisson())
summary(model1)
tstep<-step(model1,,direction = c("both"))
summary(tstep)
drop1(tstep)
model1<-glm(y~age+yearsmarried+religiousness+rating,data=tt,family=binomial(link = "logit"))
summary(model1)
coef(model1)
exp(coef(model1))

结果分析：

1、这里的模型得到的婚内出轨主要原因依次是：
yearsmarried-1.1 > age-0.96 > religiousness-0.72 > rating-0.63 ,婚龄、年龄、宗教信仰是婚内出轨的主要因素，数值为出轨优势比提升倍数
2、提升婚姻美满程度，可以在一定程度上降低婚内出轨的概率

结果风险：

该问题分析的维度、数据量有限，所分析的结果的误差也相对较高，尽管从逻辑上判断结果是大致正确

参考网站：

http://www.ppvke.com/Blog/archives/30377

https://blog.csdn.net/sjpljr/article/details/70169046

仍存在的问题：

1、各类模型的产生，及演算方法
2、什么情况，适用什么样的模型方法

2、模型的评估方法，及效果提升

附注：

y = 1 / (1+e^-z)，其中：z =β₀+β₁*x₁+β₂*x₂+β₃*x₃+...+β_n*x_n

y为发生概率，取值在[0,1]，（1-y）为不发生概率，经过变换

odds=发生概率/不发生概率=y/(1-y) =e^(β₀+β₁*x₁+β₂*x₂+β₃*x₃+...+β_n*x_n)

odds：一般称为比值、比率、比数；

猜你喜欢

转载自blog.csdn.net/scpcmoon/article/details/80582584

转 R 广义线性模型1 自变量：Logistic

在R软件中使用box-Tidwell验证logistic regression中连续自变量x与logitP呈线性

R语言笔记之广义线性模型压缩方法1

R语言线性模型与广义线性模型—建立预测保险费用模型

R语言广义线性模型函数GLM、glm函数构建逻辑回归模型（Logistic regression）、去除初步验证不具有显著性的特征再次构建逻辑回归模型、简化模型（reduced model）

自变量选择（R语言）

R语言广义线性模型(GLMs)算法和零膨胀模型分析

R语言笔记之广义线性模型压缩方法2

R语言解决Lasso问题----glmnet包（广义线性模型）

R语言中广义线性模型(GLM)中的分布和连接函数分析

广义线性回归模型之0,1变量回归（logit/probit回归）—R语言实现

斯坦福机器学习笔记（二）——Logistic回归和广义线性模型

R语言中GLM(广义线性模型)，非线性和异方差可视化分析

R语言广义线性模型索赔频率预测：过度分散、风险暴露数和树状图可视化

R语言通过伽玛与对数正态分布假设下的广义线性模型对大额索赔进行评估预测

R语言使用bootstrap和增量法计算广义线性模型（GLM）预测置信区间

R语言中的广义线性模型（GLM）和广义相加模型（GAM）：多元（平滑）回归分析保险资金投资组合信用风险敞口

[转]R 模型评估

广义线性模型

R语言对巨灾风险下的再保险合同定价研究案例：广义线性模型和帕累托分布Pareto distributions分析

数据分享|R语言用lme4多层次（混合效应）广义线性模型（GLM），逻辑回归分析教育留级调查数据...

广义线性模型（GLM）

广义线性模型介绍

广义线性模型的理解

线性模型（二）广义线性模型

线性模型选择与广义线性模型

三、模型自变量选择方法

[转] R 简单线性回归 18.06.18

R语言使用caret包的train函数构建广义线性模型算法（glm）构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

R语言使用caret包的train函数构建正则化的广义线性模型（glmnet）构建分类模型、trainControl函数设置交叉验证参数、自定义调优评估指标

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)