Python数据特征分析

二 数据特征分析

完成对数据的质量分析后,剩下的数据就可以绘制表图 计算了某些特征量
等手段进行数据的特征分析

分布分析
揭示数据的分布特征和分布类型

  1. 定量数据:分析分布是对称,发现某些特征值的大小和可疑值,频率分布表、频率分布直方图、茎叶图
  2. 定性数据:饼图、条形图

1.定量分析数据
原则:

  • 各组之间相互排斥
  • 所有数据必须包含
  • 组宽最好相等

步骤
  1. 求极差
  2. 决定组数与组距
  3. 决定分点
  4. 列出频率分布表
  5. 绘制频率分布直方图

定量分析实例

c   销量
2015/3/1    51
2015/2/28   2618.2
2015/2/27   2608.4
2015/2/26   2651.9
2015/2/25   3442.1
2015/2/24   3393.1
2015/2/23   3136.6
2015/2/22   3744.1
2015/2/21   6607.4
2015/2/20   4060.3
2015/2/19   3614.7
2015/2/18   3295.5
2015/2/16   2332.1
2015/2/15   2699.3
2015/2/14   
2015/2/13   3036.8
2015/2/12   865
2015/2/11   3014.3
2015/2/10   2742.8
2015/2/9    2173.5
2015/2/8    3161.8
2015/2/7    3023.8
2015/2/6    2998.1
2015/2/5    2805.9
2015/2/4    2383.4
2015/2/3    2620.2
2015/2/2    2600
2015/2/1    2358.6
2015/1/31   2682.2
2015/1/30   2766.8
2015/1/29   2618.8
2015/1/28   2714.3
2015/1/27   2280.8
2015/1/26   2414
2015/1/25   3130.6
2015/1/24   2716.9
2015/1/23   2930.8
2015/1/22   2504.9
2015/1/21   2559.5
2015/1/20   2168.6
2015/1/19   2436.4
2015/1/18   3234.3
2015/1/17   3061
2015/1/16   2900.1
2015/1/15   2646.8
2015/1/14   2615.2
2015/1/13   2124.4
2015/1/12   1958
2015/1/8    2259.1
2015/1/7    2419.8
2015/1/6    2775
2015/1/5    2594.9
2015/1/4    2468.3
2015/1/3    3004.3
2015/1/2    3313.3
2015/1/1    3613.6
2014/12/31  2655.9
2014/12/30  2644.3
2014/12/29  2565.3
2014/12/27  2525.9
2014/12/26  2778
2014/12/25  2542.1
2014/12/24  2473.3
2014/12/23  2240.1
2014/12/22  2575
2014/12/21  3802.8
2014/12/18  2274.7
2014/12/17  2687.2
2014/12/16  2577.8
2014/12/15  2583
2014/12/14  3282.6
2014/12/13  3113.7
2014/12/12  2661.4
2014/12/11  2553.2
2014/12/10  2511.3
2014/12/9   2710.3
2014/12/8   2468.1
2014/12/7   3041.5
2014/12/6   3178.9
2014/12/5   2594.4
2014/12/4   2381.1
2014/12/3   2415
2014/12/2   2236.4
2014/11/30  3207.2
2014/11/29  3059.5
2014/11/28  3039.1
2014/11/26  2817.5
2014/11/25  2891.8
2014/11/24  2470.1
2014/11/23  3556.6
2014/11/22  3397.7
2014/11/20  2761.6
2014/11/19  2618.2
2014/11/18  2758.3
2014/11/17  2614.3
2014/11/16  3437.1
2014/11/15  3250
2014/11/14  3063.7
2014/11/13  2839.2
2014/11/12  2360.9
2014/11/11  2158.5
2014/11/10  2005.5
2014/11/9   3236.4
2014/11/8   22
2014/11/7   2452.6
2014/11/6   2265
2014/11/5   2566.1
2014/11/4   2527.2
2014/11/3   2326.5
2014/11/2   2941.9
2014/11/1   60
2014/10/31  2520.9
2014/10/30  2446.2
2014/10/29  2549.4
2014/10/28  2449.3
2014/10/27  2162.5
2014/10/26  2781.3
2014/10/25  3060.6
2014/10/24  2064
2014/10/22  2439.7
2014/10/21  2476.2
2014/10/20  2478.3
2014/10/19  2826.2
2014/10/18  2924.8
2014/10/17  2417.5
2014/10/16  2450.1
2014/10/15  2533
2014/10/14  2238.7
2014/10/13  2388.8
2014/10/12  3291.3
2014/10/11  2738.8
2014/10/10  2344.1
2014/10/9   2068.8
2014/10/8   3185.3
2014/10/7   2778.6
2014/10/6   2921.1
2014/10/5   2524.3
2014/10/4   3057.1
2014/10/3   3039.6
2014/10/2   3193.4
2014/10/1   3075.4
2014/9/30   2847.6
2014/9/29   2311.4
2014/9/28   2327.3
2014/9/27   9106.44
2014/9/26   2616.6
2014/9/25   2620.2
2014/9/24   2616.4
2014/9/23   2655.8
2014/9/22   2310.7
2014/9/21   2935.8
2014/9/20   3017.9
2014/9/19   2625.5
2014/9/18   2752.7
2014/9/17   2181.5
2014/9/16   2440.5
2014/9/15   2422.8
2014/9/14   2583.6
2014/9/13   2728.9
2014/9/12   2525.3
2014/9/11   2531.7
2014/9/10   2300.5
2014/9/9    2097.5
2014/9/8    4065.2
2014/9/7    3555.2
2014/9/6    3462.5
2014/9/5    3033.1
2014/9/4    2926.1
2014/9/3    2431.4
2014/9/2    2706
2014/9/1    3049.9
2014/8/31   3494.7
2014/8/30   3691.9
2014/8/29   2929.5
2014/8/28   2760.6
2014/8/27   2593.7
2014/8/26   2884.4
2014/8/25   2591.3
2014/8/24   3022.6
2014/8/23   3052.1
2014/8/22   2789.2
2014/8/21   2909.8
2014/8/20   2326.8
2014/8/19   2453.1
2014/8/18   2351.2
2014/8/17   3279.1
2014/8/16   3381.9
2014/8/15   2988.1
2014/8/14   2577.7
2014/8/13   2332.3
2014/8/12   2518.6
2014/8/11   2697.5
2014/8/10   3244.7
2014/8/9    3346.7
2014/8/8    2900.6
2014/8/7    2759.1
2014/8/6    2915.8
2014/8/5    2618.1
2014/8/4    2993
2014/8/3    3436.4
2014/8/2    2261.7

第一步:求极差

极差=3960-45=3915

第二步:分组

#根据业务逻辑的含义,分组距为500
组数=极差/组距=3915/500=7.83~8

第三步:决定分点

[0,500)[500,1000)[1000,1500)[1500,2000)......[3500,4000)

第四步:绘制频率分表

用excle即可完成,

第五步:绘制频率分布直方图

这里写代码片

定性数据的分布分析
饼形图
条形图
……

贡献度分析

猜你喜欢

转载自blog.csdn.net/weixin_39381833/article/details/80791638