Python根据成绩分析系统浅析 - 代码天地

Python根据成绩分析系统浅析

其他 2019-05-01 15:51:02 阅读次数: 0

案例:该数据集的是一个关于每个学生成绩的数据集,接下来我们对该数据集进行分析，判断学生是否适合继续深造

数据集特征展示

1GRE 成绩 (290to 340)

2TOEFL 成绩(92to 120)

3学校等级 (1to 5)

4自身的意愿 (1to 5)

5推荐信的力度 (1to 5)

6CGPA成绩 (6.8to 9.92)

7是否有研习经验 (0or1)

8读硕士的意向 (0.34to 0.97)

导入包

导入并查看数据集

df = pd.read_csv("D:\\machine-learning\\score\\Admission_Predict.csv",sep = ",")<br>print('There are ',len(df.columns),'columns')<br>for c in df.columns:<br> sys.stdout.write(str(c)+', '

There are 9columns

Serial No., GRE Score, TOEFL Score, University Rating, SOP, LOR , CGPA, Research, Chance of Admit , <br>一共有9列特征

df.info()

<class'pandas.core.frame.DataFrame'>

RangeIndex: 400entries, 0to 399

Data columns (total 9columns):

Serial No. 400non-null int64

GRE Score 400non-null int64

TOEFL Score 400non-null int64

University Rating 400non-null int64

SOP 400non-null float64

LOR 400non-null float64

CGPA 400non-null float64

Research 400non-null int64

Chance of Admit 400non-null float64

dtypes: float64(4), int64(5)

memory usage: 28.2KB<br><br>数据集信息：<br>1.数据有9个特征，分别是学号，GRE分数，托福分数，学校等级，SOP，LOR，CGPA，是否参加研习，进修的几率<br>2.数据集中没有空值<br>3.一共有400条数据

# 整理列名称

df =df.rename(columns={'Chance of Admit ':'Chance of Admit'})<br># 显示前5列数据<br>df.head()

3.查看每个特征的相关性

结论：

1.最有可能影响是否读硕士的特征是GRE，CGPA，TOEFL成绩

2.影响相对较小的特征是LOR，SOP，和Research

4.数据可视化，双变量分析

4.1 进行Research的人数

结论：进行research的人数是219，本科没有research人数是181

4.2 学生的托福成绩

结论：最低分92分，最高分满分，进修学生的英语成绩很不错

4.3 GRE成绩

结论：310和330的分值的学生居多

4.4 CGPA和学校等级的关系

结论：学校越好，学生的GPA可能就越高

4.5 GRE成绩和CGPA的关系

结论：GPA基点越高，GRE分数越高，2者的相关性很大

4.6 托福成绩和GRE成绩的关系

结论：多数情况下GRE和托福成正相关，但是GRE分数高，托福一定高。

4.6 学校等级和是否读硕士的关系

结论：排名靠前的学校的学生，进修的可能性更大

4.7 SOP和GPA的关系

结论： GPA很高的学生，选择读硕士的自我意愿更强烈

4.8 SOP和GRE的关系

结论：读硕士意愿强的学生，GRE分数较高

5.模型

5.1 准备数据集

5.2 回归

5.2.1 线性回归

猜你喜欢

转载自blog.csdn.net/qq_40925239/article/details/89738173

Python根据成绩分析系统浅析

Python-根据成绩分析是否继续深造

Python 课程成绩分析

基于MapReduce的成绩分析系统实现

成绩分析

Python：成绩分类

基于Spark的学生成绩分析系统

《成绩分析系统设计及实现》文献笔记（八）

《成绩分析系统的设计与实现》文献笔记（五）

成绩分析(C++)

C语言成绩分析

蓝桥杯算法之成绩分析

2020省赛-＞成绩分析

学生成绩分析项目

基于数据挖掘的学生成绩分析系统的设计与实现文献收集

《基于数据挖掘技术的学生成绩分析系统的设计与实现》文献笔记（十）

基于 Java（SpringBoot+SSM）+MySQL 实现的（Web）高校成绩分析与管理系统【100010579】

VB+access成绩分析统计系统(论文+源代码)

spring MVC+easyui学生成绩管理系统学生成绩分析系统源码

计算机毕设之Python的高校成绩分析（含文档+源码+部署）

第十五题：根据成绩分等级

计算机毕业论文内容参考|基于java的学生成绩分析系统的设计与实现

【1022】10成绩分析判断

2018研究生数学建模成绩分析

用雷达图来进行成绩分析

2019.6.20义乌测试赛自我成绩分析

使用flask做网页的excel成绩分析

第十一届蓝桥杯 ——成绩分析

sql 查询出各科成绩、平均成绩，总成绩，根据总成绩分数相同，排名相同

Python基础练习——水仙花数、成绩分级

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)