版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_41185868/article/details/84646909
ML之预测:以某个数据集为例从0到1深入理解科学预测之分类问题的思路框架
总体思路设计框架
1、获取数据集,并确定新数据集的规模
数据集规模为(208*61)
2、确定数据集每个属性的类型
3、对数据集统计特征
Mean = 0.053892307692307684 Standard Deviation = 0.04641598322260027
Boundaries for 4 Equal Percentiles
[0.0058, 0.024375, 0.04405, 0.0645, 0.4264]
Boundaries for 10 Equal Percentiles
[0.0058, 0.0141, 0.022740000000000003, 0.027869999999999995, 0.03622, 0.04405, 0.05071999999999999, 0.059959999999999986, 0.07794000000000001, 0.10836, 0.4264]
Unique Label Values
{'M', 'R'}
Counts for Each Value of Categorical Label
['M', 'R']
[111, 97]
4、筛查数据集中的异常值:用分位数图展示异常点