数据挖掘：描述性统计分析

其他 2019-06-11 03:48:35 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/xiaxianba/article/details/91384171

数据分析的基础是统计学，统计学又分描述性统计和推断性统计，其中描述性统计又是统计学的基础，也是推断性统计的前导。其百度百科定义是这样的：描述统计是通过图表或数学方法，对数据资料进行整理、分析，并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。

一、集中趋势分析

平均数：平均数是总和除以总量。
中数：中位数是数值大小位于中间的值，其中数值根据总数的奇偶而不同。
2.1 总数N为奇数时：(N+1)/2
2.2 总数N为偶数时：[N/2+(N/2+1)]/2
众数：众数是出现次数最多的值。
上面已经把描述性统计的分析维度和计算方法都讲清楚了，接下来我们借鉴一个例子来说明下。比如现在有一个班级的身高数据height = [165,166,167,168,170,170,170,172,175,180,190]，我们如何描述这个班级身高的集中趋势呢？

二、离中趋势分析(离散)

极差：最大值减去最小值。
方差：所有数据与平均数之差平方和的平均数。
标准差：离均差平方的算术平均数的平方根，是方差的算术平方根。
变异系数：原始数据标准差与原始数据平均数的比。
上面是从数据的离散程度来描述数据，我们还是用上面那个例子来说明数据的离散程度。

z-score，除了上面离散的分析维度之外，我们还要介绍一个偏离程度，也就是测量值距均值相差的标准差数目，计算公式是：z-score = [X - mean(X)]/std(X)，其中z-score分布的方差和标准差为1，均值为0。

三、相关分析

协方差（COV）：如果有X,Y两个变量，每个时刻的“X值与其均值之差”乘以“Y值与其均值之差”得到一个乘积，再对这每时刻的乘积求和并求出均值，即为协方差。协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况，即当两个变量是相同的情况。协方差为正值表示正相关，负值为负相关，0为不相关。
相关系数（CORRCOEF）：两个变量X,Y的协方差比上各自的标准差乘积。

参考文献
1.描述统计百度百科定义
2.使用Python进行描述性统计

猜你喜欢

转载自blog.csdn.net/xiaxianba/article/details/91384171

数据挖掘：描述性统计分析

描述性统计分析

3. 描述性统计分析

R 描述性统计分析

数据分析（二）----- 描述性统计分析

问卷与量表数据分析（SPSS+AMOS）学习笔记（六）： SPSS 描述性统计分析

数据分析师一定要掌握的基础——描述性统计分析

【Python数据分析】实践编写篇1：用Python程序完成描述性统计分析需求

时间序列分析基础-描述性统计分析（建模前准备工作，代码+数据）

sas入门之（五）--描述性统计分析

实验1-EXCEL描述性统计分析

如何在Python中进行描述性统计分析？

实证论文复刻｜描述性统计分析 stata

什么是描述性统计分析？主要包含哪些内容？ Python

R语言实战-统计分析基础-描述性统计3-Hmisc-describe

在Python里，用股票案例讲描述性统计分析方法（内容来自我的书）

【数据分析&数据挖掘】数组的统计分析

数据的描述性统计

【R描述统计分析】数据的分布

数据的描述性分析

数据分析方法——01描述性统计

数据分析--描述性统计-001

统计分析——描述统计之数据水平描述

描述性统计

数据描述性统计整理

数据描述性统计度量方法

基于Python的数据分析与数据挖掘教程之六：数据的统计分析

数据分析-统计分析

数据分析—统计分析

Python数据挖掘——应用toad包中的detect函数进行描述性统计

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)