2022华中杯C题矿井提升机钢丝绳的缺陷分析思路讲解

立志每天五点起床的我,脑子非常清醒!啊,题目没见过…所以我们一起来读题,理解理解,作为python常年数模玩家,不能怂!

一、题目导读

第一自然段:就是介绍,大概看一下,用这个东西挖矿的嘛。
在这里插入图片描述
第二自然段:这里介绍了“磁平衡”方法检测缺陷
在这里插入图片描述
以及相关测量判断结果:
在这里插入图片描述

二、问题

2.1 第一问

场景:对于一个六绳长度为960米的钢丝绳,升降十次。要求:对该场景的数据出现不同程度的噪音去噪,并找出所有缺陷数量,程度,位置。
在这里插入图片描述
既然给了数据,就一起来看下数吧,打不开文件就尴尬,用文本形式打开就好了:
在这里插入图片描述
数据似乎看不懂,所以看看数据说明:

文件格式:
1号电压,2号电压,3号电压,4号电压,5号电压,6号电压,方向, 脉冲, 时间戳
1.61, 1.06, 0.97, 0.95, 0.98, 1.47, 1, 1, 102070423

电压值一共有六个,对应了六根钢丝绳的数据。一行数据就是一帧数据。第一列表示第一根绳子的电压值,第二列表示第二根绳子的电压值,…,第六列表示第六根绳子的电压值。

方向“0”代表下行,方向“1”表示上行。

脉冲:其实就是距离,通过距离传感器得到。从1到n递增,每一帧(一行数据代表一帧数据)对应一个脉冲数字,脉冲数每增加1,代表距离增加了0.4米。
可能有多帧数据对应一个脉冲(表示在0.4米内进行了多次测量)。在绘制波形图时,每一帧所对应的距离等于0.4米除以帧数

钢丝绳长为960米,断丝的位置可以用帧表示

每一个文件记录一次运行的监测数据,10个文件记录了10次往返运行的监测数据。注意上行和下行的监测数据不是从同一端记录。

依次对应九列数据,这样的数据转成csv不就好了?用pandas处理! 看了数据说明,数据就理解了。

2.2 第二问

基于第一问结果,建立模型,给出钢丝绳的性能安全评价方法
在这里插入图片描述
大概就是评价模型吧。

三、第一问解析

3.1 数据噪音是什么?

题目说到了有噪音,那么肯定要先去噪,什么是数据噪音搞明白了吗?噪声数据是指数据中存在着错误或异常(偏离期望值)的数据,这些数据对数据的分析造成了干扰。
说一下引擎噪声数据原因,以便于理解:引起噪声数据的原因可能是硬件故障、编程错误、语音或光学字符识别程序(OCR)识别出错等。

3.2 噪音数据去噪方法?

方法如下:

  1. 回归
  2. 异常值检测
  3. MAD 法
  4. 箱型图分析
  5. 聚类

回归方法:
如果变量之间存在依赖关系,即y=f(x),那么我们可以设法求出依赖关系f,从而根据x来预测y,这也是回归问题的实质。实际中更常见的假设是P(y)=N(f(x)),N是正态分布。假设y是观测值且存在噪声,如果我们能求出x和y之间的依赖关系,从而根据x来更新y的值,就可以去除其中的随机噪声,这就是回归去噪的原理。

异常值检测方法:
数据中的噪声可能有两种,一种是随机误差,另外一种可能是错误,比如我们手上有一份学生的体重数据,其中某一位学生的体重纪录是20KG,很明显,这是一个错误,如果这个样本进入了我们训练数据可能会对结果产生很大影响,这也是去噪中使用异常值检测的意义所在。

MAD 法:
MAD 又称为绝对值差中位数法。MAD 是一种先需计算所有因子与平均值之间的距离总和来检测离群值的方法。

箱型图分析:
箱型图提供了一个识别异常值的标准,即大于或小于箱型图设定的上下界的数值即为异常值,箱型图如下图所示
在这里插入图片描述

聚类:
将物理的或抽象对象的集合分组为由类似的对象组成的多个类。找出并清除那些落在簇之外的值(孤立点),这些孤立点被视为噪声。聚类方法有很多,这里不详细介绍,知乎我详细讲过python代码实现和spss分析:https://zhuanlan.zhihu.com/p/499113776

以上方法均可用于去噪,我不能说谁好谁坏,你们可能在网上只看到了一种方法,请不要局限于如此狭隘的思路。去除噪音后,可看清楚题目要求,根据噪音处理后的数据进行求相关结果。后续更新看知乎吧,说得差不读了。

四、第二问解析

钢丝绳安全性能的量化评价方法: 关键词,“评价”

这里介绍几个评价方法:

  1. 综合评价之TOPSIS模型,也叫做优劣解距离法。
  2. 层次分析AHP模型
  3. 灰色综合评价法
  4. BP神经网络综合评价法

还请读者自行尝试,以上的评价方法,我的数模专栏只讲过2,3,更新文章确实费时间,大家自行选择尝试吧。

猜你喜欢

转载自blog.csdn.net/weixin_46211269/article/details/124507737