ML之预测:以某个数据集为例从0到1深入理解科学预测之分类问题的思路框架

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_41185868/article/details/84646909

ML之预测:以某个数据集为例从0到1深入理解科学预测之分类问题的思路框架

总体思路设计框架

1、获取数据集,并确定新数据集的规模

数据集规模为(208*61)

2、确定数据集每个属性的类型

3、对数据集统计特征

Mean = 	0.053892307692307684		Standard Deviation = 	 0.04641598322260027

Boundaries for 4 Equal Percentiles 
[0.0058, 0.024375, 0.04405, 0.0645, 0.4264]
 
Boundaries for 10 Equal Percentiles 
[0.0058, 0.0141, 0.022740000000000003, 0.027869999999999995, 0.03622, 0.04405, 0.05071999999999999, 0.059959999999999986, 0.07794000000000001, 0.10836, 0.4264]
 
Unique Label Values 
{'M', 'R'}

Counts for Each Value of Categorical Label 
['M', 'R']
[111, 97]

4、筛查数据集中的异常值:用分位数图展示异常点

猜你喜欢

转载自blog.csdn.net/qq_41185868/article/details/84646909
今日推荐