单因子分析 python 实现 - 代码天地

单因子分析 python 实现

其他 2019-01-05 21:30:48 阅读次数: 0

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import pandas as pd
import numpy as np

## 读取数据
df = pd.read_csv("./HR.csv", header=0)

# 查看数据结构
summary = df.describe()

# 求均值
row_mean = df.mean(axis=1)
col_mean = df.mean()

# 选择数据
## 列
print(df["satisfaction_level"].head())
print(df[0:3])

## 标签
print(df.loc[0:3])
print(df.loc[0, ["satisfaction_level"]])


### 1
### 异常值分析
### 空值处理
sl_l = df["satisfaction_level"]
df[df['satisfaction_level'].isnull()]
#print(sl_l.isnull())
print(sl_l.isnull().sum())
print(sl_l[sl_l.isnull()])
## 对空值的填充
#print(sl_l.fillna(value=5))

## 对空值的丢弃
#print(sl_l.dropna(how="any"))
sl_l = sl_l.dropna(how="any")


### 2
### 数据过大、过小异常处理
le_s = df['last_evaluation']
le_s[le_s.isnull()]
le_s.isnull().sum()

## 偏度
le_s.skew()
## 峰度
le_s.kurt()

## 连续异常值处理方式(取四分位上下界)
#（1） le_s = le_s[le_s <= 1]
q_low = le_s.quantile(q=0.25)
q_high = le_s.quantile(q=0.75)
q_interval = q_high - q_low
k = 1.5

### 数据筛选
le_s = le_s[le_s<q_interval+k*q_interval][le_s>q_low-k*q_interval]

### 分布情况
np.histogram(le_s.values,bins=np.arange(0.0, 1.1,0.1 ))

### 3
## 排序
np_s = df['number_project']
np_s.value_counts(normalize=True).sort_index()

### 4 分布情况
pl5_s = df['promotion_last_5years']
pl5_s.value_counts()
pl5_s.value_counts(normalize=True)

## 5 条件筛选
s_s = df['salary']
s_s.where(s_s!=="nme").dropna()


### 总结 
# 去空值
df = pd.read_csv("./HR.csv", header=0)
df = df.dropna(axis=0,how='any')

df[df['last_evaluation']<=1][df['salary']!='nme']
le_s = df['last_evaluation']
q_low = le_s.quantile(q=0.25)
q_high = le_s.quantile(q=0.75)
q_interval = q_high - q_low
k=1.5
le_s = le_s[le_s<k*q_interval+q_high][le_s>k*q_interval-q_low]
df[le_s<k*q_interval+q_high][le_s>k*q_interval-q_low][df['salary']!='nme']
简单对比分析
df.groupby("department").mean()

待续。。。

猜你喜欢

转载自blog.csdn.net/rojyang/article/details/85783417

单因子分析 python 实现

因子分析-python3实现

python实现因子分析(FA)

Python进行因子分析

python数据分析-因子分析（转载）

评价模型（二）主成分分析、因子分析、二者对比及其对应 PYTHON 实现代码和例题解释

R语言学习记录：因子分析的R实现

单因子分析模块简介

因子分析(Factor Analyse)推导以及R语言实现

Python——因子分析（KMO检验和Bartlett's球形检验）

方差分析的MATLAB实现（单因子）

因子分析

SAS 因子分析

初探多因子选股：基于Fama-Macbeth回归的因子分析框架（附Python3代码）

因子分析 factor analysis (二 ) ：因子分析模型

MATLAB(2)--因子分析

SPSS因子分析案例

因子分析及R使用

因子分析（factor analysis)

R语言因子分析

R 语言因子分析

验证性因子分析

因子分析（R实例）

因子分析计算权重

回归模型的因子分析

MATLAB算法实战应用案例精讲-【数据分析篇】因子分析(FA)（附Java、Python和MATLAB代码）

主成分分析与因子分析

金融评分卡项目—2.银行客户流失预警模型介绍（单因子与多因子分析）

[Rscript]探索性因子分析

数据建模 - 因子分析法

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)