数学建模--分类模型/聚类模型

其他 2020-07-23 12:52:58 阅读次数: 0

第1部分_逻辑回归求解二分类问题（spss）

详情参考pdf

保留一列：苹果为1，橙子为0.删除想要预测的值

越接近1，我们越有理由相信它是苹果。

内生性：扰动项和自变量相不相关

连接函数，保证定义在0到1.

论文：我们通过极大似然估计，可以估计出β，记为β-hat，有了它就可以算出yi-hat，然后就可以进行预测

spss操作
分析-回归-二元逻辑回归
把虚拟变量移到因变量。

如果有定型变量，如男和女
点击选项，移到分类协变量，
参考类别决定了把谁设置为对照组。

取3个作为测试组（就是把isapple清除3组），然后预测

第2部分_Fisher线性判别分析（LDA）和多分类问题探究

Fisher线性判别分析

在这里插入图片描述
Fisher线性判别分析原理：同类投影点尽量密集，不同类则尽可能远离。
就是方差要小，就是投影点密集。

SPSS-Fisher线性判别分析

spass
分析-分类-判别式

重点关注

Omega （ω）即，未标准化系数

分类的结果，即代表着预测的准确率

把参数代入2个叶贝丝判别函数，比较大小，较大的就归哪一类。

论文中：判别函数系数、预测的结果、分类的成功率

多分类的问题

导入数据
分析-分类-判别式
分组变量，自变量，定义范围（1,4）
统计 - 费希尔，半标准化
分类-摘要表
保存-预测组成员，组成员概率

在这里插入图片描述

（logistic）逻辑回归也可以用于多分类

spss
1.分析-回归-多远logistic
因变量：kind（最后一个）
因子：4个指标
2.保存
在这里插入图片描述

存在过拟合问题。可以用训练组和测试组来解决。
在这里插入图片描述

作业

在这里插入图片描述

先把原来的文字，转为数字的分类
https://jingyan.baidu.com/article/495ba8410d8f4f38b30edeff.html
2.然后就根据以上的分析-分类-判别式（*，推荐），或者多元logistic 逻辑回归来做。

第1部分_Kmeans聚类算法

分类与聚类

分类与聚类的区别：分类是已经类别的，而聚类是未知的。

在这里插入图片描述

聚类：将样本划分为由类似的对象组成的多个类的过程。

作用：更加准确估计、分析和预测。探究相关性和差异。

K-means算法流程

1.指定类的个数K
2.初始化K个聚类的中心，不一定是样本点，也可以是平面上的任意一点
3.计算其余的各个数据对象到这k个初始聚类中心的距离，将比较近的划分到那个聚类中心
4.调整新类，重新计算出新类的中心
5.重复步骤3和4，看中心是否收敛（不变），一般重复10次就停止循环。

K-means优缺点

聚类中心容易受到异常点的影响，即对缺点3 的解释。

K-means ++ 算法

算法概述

在这里插入图片描述

spss操作

在这里插入图片描述

聚类数：即K，分类的个数，这里取2.

一般取10，不改这个选项也可以。默认10

在这里插入图片描述

spss结果

分类代表着各省份的消费水平的差距
在这里插入图片描述
距离表示对应的省份与最终聚类中心的距离

关于算法的讨论

在这里插入图片描述
K值由经验而定。
量纲不一致可以使用spss来同一量纲。

选中数据-分析-描述统计-描述-移动到变量-确定。
在这里插入图片描述

第2部分_系统层次聚类算法和聚类效果图的绘制（不指定K）

系统层次聚类写论文参考：https://www.bilibili.com/video/BV1i7411k7fB?p=38
在这里插入图片描述

系统层次聚类算法

在这里插入图片描述

spss实现系统聚类

分析-分类-系统聚类
在这里插入图片描述

SPSS结果

在这里插入图片描述

用图形估计聚类的数量

在这里插入图片描述

聚合系数折线图的画法

在这里插入图片描述
粘贴数据，复制到excel表，匹配目标格式。

论文图表说明。辅助我们确定K。

示意图-作图

在这里插入图片描述
1.确定分类。分析-分类-系统聚类分析-保存-单个解，聚类数为3.分为三类。
2.图形-图标构造

先拖图标类型，再拖变量！

然后根据聚类的结果来设置颜色。即分类。所以拖动average linkage。然后就会有颜色区分了

然后点击组/点ID，勾选点ID标签。然后就会有省份的名字了

在这里插入图片描述
双击进去，可以对图进行修改。
点击点。可以对点进行填充。
双击背景，把背景设置为白色。
边框设置为黑色。
双击average linkage，修改文字为类别编号

第3部分_基于密度的聚类算法DBSCAN算法

之前额算法时基于距离来的。

DBSCAN算法–main.m

优缺点

在这里插入图片描述
散点图很聚集，很DBSCAN，有形状，就用DNSCAN进行聚类。
其他情况都使用系统聚类。K-means也可以用，但是论文上可写的东西比较少。

猜你喜欢

转载自blog.csdn.net/qq_30081043/article/details/107403473

数学建模--分类模型/聚类模型

数学建模--（7）聚类模型

数学建模：13 聚类模型

数学建模-聚类模型 K-means聚类

数学建模--分类模型

数学建模—分类模型

数学建模Day9 聚类模型

数学建模不同模型分类评价类预测类优化

数学建模--（6）分类模型

数学建模：12 分类模型

数学建模 --- 分类模型：逻辑回归与 LDA

数学建模Day8 分类模型

数学建模-分类模型 Logistic回归

【Python】使用sklearn构建模型的基本思路记录（处理数据、聚类、分类、回归）

数学建模常用模型

数学建模学习（70）：CatBoost回归分类预测模型

数学建模-分类模型 Fisher线性判别分析

数学建模--数学规划模型

聚类模型

【数模】聚类模型

【Spark】(task5)SparkML基础（分类 | 聚类模型）

数学建模总结:四类基本模型

数学建模评价类模型——模糊综合评价

多元线性回归模型-数学建模类-matlab详解

数学建模-聚类算法 DBSCAN算法

数学建模-聚类算法系统（层次）聚类

数学建模：灰色预测模型

数学建模：排队论模型

数学建模：种群竞争模型

数学建模-层次分析模型

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)