Python数据分析处理（一）——处理剔除异常值以全国数学建模（CUMCM 2011 A题）为实例 - 代码天地

Python数据分析处理（一）——处理剔除异常值以全国数学建模（CUMCM 2011 A题）为实例

其他 2020-03-26 17:09:32 阅读次数: 0

由于经历一些调试，所以代码结构不一定最优，适合数据处理的新手，大神欢迎提出改进

数据来源：

http://www.mcm.edu.cn

设p为均值，s为标准差

由表三可知，元素背景值在[p-s, p+s]，所以应用到表一，将不符合的数据剔除

上代码

import numpy as np
import pandas as pd
path = "E:/Model_building/A/cumcm2011A附件_数据.xls"
s1 = pd.read_excel(path, sheet_name="附件1")
s2 = pd.read_excel(path, sheet_name="附件2")
s3 = pd.read_excel(path, sheet_name="附件3") # 读入一个文件中的三个表
s1 = s1.values # 转化为数值形式
s2 = s2.values
s3 = s3.values
s1 = pd.DataFrame(s1) # 转化为dataframe形式
s2 = pd.DataFrame(s2)
s3 = pd.DataFrame(s3)
print(s1)
s1 = s1.iloc[2:, 0:5]
s2 = s2.iloc[2:, 0:9]
s3 = s3.iloc[2:, :] # 去掉表头等不需要的部分，如表一的右边
print(s1,'\n')
print(s2,'\n')
print(s3,'\n')
l = []
for c in range(1,9): # 将各元素标准差放到列表
a = s2.iloc[: ,c].std()
l.append( a )
print(a,'\n')

p = []
for c in range(1,9): # 各元素均值放到列表
a = s2.iloc[:, c].mean()
p.append( a )

for c in range(0,8):
themin = p[c] - 2*l[c]
themax = p[c] + 2*l[c]
print(themin, ' ', themax)
s2 = s2[(s2.iloc[:, c+1] >= themin )& (s2.iloc[:, c+1] <= themax ) ] # 选出符合的行
print(s2)
print('\n',s2.shape[0],'\n')
ID = pd.DataFrame(s2.iloc[:, 0]) # 表二0列单独成表
print(ID)
s1 = pd.merge(s1, ID, how="inner", right_on=0, left_on=0) # 找出表一0列在表二0列的行，merge，join，constack进行拼接
print(s1)
path = "E:/Model_building/A/" # 保存
s1.to_excel(path+"sheet1.xlsx")
s2.to_excel(path+"sheet2.xlsx")
s3.to_excel(path+"sheet3.xlsx")

Pang文

发布了117 篇原创文章 · 获赞 41 · 访问量 6万+

私信关注

猜你喜欢

转载自blog.csdn.net/pangzhaowen/article/details/103941928

Python数据分析处理（一）——处理剔除异常值以全国数学建模（CUMCM 2011 A题）为实例

Python数据分析处理（二）——数据的标准化处理归一化（极差变换）以数学建模（CUMCM 2011 A）为实例（两表同名行列对应计算）

基于Matlab求解高教社杯全国大学生数学建模竞赛(CUMCM2003B题)-露天矿生产的车辆安排（附上源码+数据+题目）

2011年全国大学生数学建模竞赛c题个人分析

基于Matlab求解高教社杯全国大学生数学建模竞赛(CUMCM2002B题)-彩票问题求解程序（源码+题目）

Python数据处理分析（三）——分类统计，dataframe复制，每一行列数据计算，一列不同元素个数统计，matplotlib画饼图，以数学建模（2011 A）为例

全国大学生数学建模比赛2011B题交巡警服务平台的设置与调度论文与代码

2020高教杯全国大学生数学建模比赛C题用python处理excl的数据

2020年全国大学生数学建模竞赛ABC题怎么分析？

A6.2021年全国数学建模竞赛C题分析-生产企业原材料的订购与运输

2023华数杯全国大学生数学建模A题思路模型分析

2023华数杯全国大学生数学建模B题思路模型分析

2022全国数学建模-C 题复盘古代玻璃制品的成分分析与鉴别

2019全国数学建模大赛c题出租车机场数据

2019全国数学建模大赛c题出租车机场数据（二）

2023国赛数学建模A题B题C题D题E题思路分析 2023全国大学生数学建模思路

2020全国数学建模国赛A题

2023 年高教社杯全国大学生数学建模竞赛-E 题黄河水沙监测数据分析详解+思路+Python代码

(源码版)2023全国大学生数学建模竞赛E题黄河水沙监测数据分析详解+Python代码源码SARIMA模型

2011年数学建模B题遗传算法优化平台设置matlab实现

处理异常值：详细教程与实例分析

2011年第一题

A4.2021年全国数学建模竞赛A题-赛题分析与评阅要点（FAST主动反射面的形状调节）

A7.2022年全国数学建模竞赛A题-波浪能最大输出功率设计-赛题分析与讨论

(源码版)2023 年高教社杯全国大学生数学建模竞赛-E 题黄河水沙监测题一数据分析详解+Python代码

数学建模2011年交巡警平台题目matlab进行数据练习

数学建模（数据分析C题）-建模思路

2023年高教社杯全国大学生数学建模竞赛-【赛题解析篇】E题：黄河水沙监测数据分析

【项目总结】2018年全国大学生数学建模大赛B题简要分析（附代码）

1992-2020合集全国大学生数学建模竞赛(历年赛题题目+定位分析)

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)