Python数据处理过程中一些方法记录

开帖目的:记录一些在写Python工作中经常遇到的一些问题和解决办法,以防遗忘。

开发环境:Ubuntu16.04+Python3

1. lambda

我们在coding过程中提到的 lambda 表达式,通常是在需要一个函数,但是又不想花费精力去构造一个函数的场合下使用,通常也称作它是指匿名函数。

通过一个简单的例子了解其用法

def g1(x):
    return float(x)
    
g2 = lambda x : float(x)
print (g1(6),g2(6))
>>> 6.0 6.0

我们看到g1与g2的功能一样

2.zip函数

迭代函数,日常工作使用频率还是很高的
在这里插入图片描述

3.数据统计量计算

import numpy as np
import stats as sts
scores = [31, 24, 23, 25, 14, 25, 13, 12, 14, 23,
          32, 34, 43, 41, 21, 23, 26, 26, 34, 42,
          43, 25, 24, 23, 24, 44, 23, 14, 52,32,
          42, 44, 35, 28, 17, 21, 32, 42, 12, 34]
#集中趋势的度量
print('求和:',np.sum(scores))
print('个数:',len(scores))
print('平均值:',np.mean(scores))
print('中位数:',np.median(scores))
print('众数:',sts.mode(scores))
print('上四分位数',sts.quantile(scores,p=0.25))
print('下四分位数',sts.quantile(scores,p=0.75))
#离散趋势的度量
print('最大值:',np.max(scores))
print('最小值:',np.min(scores))
print('极差:',np.max(scores)-np.min(scores))
print('四分位差',sts.quantile(scores,p=0.75)-sts.quantile(scores,p=0.25))
print('标准差:',np.std(scores))
print('方差:',np.var(scores))
print('离散系数:',np.std(scores)/np.mean(scores))
#偏度与峰度的度量
print('偏度:',sts.skewness(scores))
print('峰度:',sts.kurtosis(scores))

待续…

发布了20 篇原创文章 · 获赞 15 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/github_35965351/article/details/78961114
今日推荐