Python数据分析Pandas的编程经验总结 - 代码天地

Python数据分析Pandas的编程经验总结

其他 2019-07-17 15:58:11 阅读次数: 0

Pandas的api 参考手册DataFrame部分：https://pandas.pydata.org/pandas-docs/stable/reference/frame.html

数据处理部分：

待处理的数据：

处理要求：1.food栏，大小写统一，2.删除NaN行，3.把ounces中的负值取绝对值，4.把food名称相同的字段合并，合并后ounces的值为合并前他们的平均值

代码如下：

# -*- coding: utf-8 -*-
import pandas as pd
df = pd.read_csv('E:/python3Project/11.csv')
#print(df)
df['food'] = df['food'].str.lower() #统一大小写字母

df.dropna(inplace=True) #删除数据缺失的记录
print(df)
df['ounces']=df['ounces'].apply(lambda a:abs(a)) #负值不合法，取绝对值
#print(df)
#查找food重复的记录，分组求其平均值
#print(df['food'].duplicated(keep=False))
#d_rows = df[df['food'].duplicated(keep=False)] # keep=False的意思是把所有的food列下重复的字段都找出来
#print(d_rows)
#g_items = d_rows.groupby('food').mean()  # 学学groupBy
#print(g_items)
#g_items['food']=g_items.index #效果就是新增一列food
#print(g_items)


#把第一个出现的bacon替换成平均值
df.loc[0,'ounces']=df[df['food'].isin(['bacon'])].mean()['ounces']
# 删除第二个ounce
df.drop(df.index[4],inplace=True)
print(df)
df.index =range(len(df)) # 重新把row的index排列一下，按照连贯顺序，从小到大
print(df)

#把第一个出现的pastrami替换成平均值
df.loc[0,'ounces']=df[df['food'].isin(['pastrami'])].mean()['ounces']
# 删除第二个ounce
df.drop(df.index[4],inplace=True)
print(df)
df.index =range(len(df)) # 重新把row的index排列一下，按照连贯顺序，从小到大
print(df)

猜你喜欢

转载自www.cnblogs.com/zhangshitong/p/11201319.html

Python数据分析Pandas的编程经验总结

2019-04-01基于python使用pandas、numpy进行数据分析、处理等经验总结

数据分析常见技巧和经验总结

编程经验总结

python pandas数据分析

python 数据分析--pandas

Python数据分析-Pandas

【Python数据分析】pandas知识总结(超全面)

C编程经验总结

职场，编程经验总结

结对编程-经验总结

Pandas数据分析总结(一)

【Python 数据分析】pandas数据导入

Python数据分析_Pandas数据框

Python数据分析：pandas数据合并

Python 爬虫经验总结

Python selenium经验总结

python unnitest 经验总结

Python应用经验总结

数据申请经验总结

数据建模经验总结

Python数据分析处理库Pandas

Python数据分析之pandas学习

python数据分析——pandas（Series）

python数据分析——pandas，numpy，matplot

Python 数据分析包：pandas 基础

Python数据分析库pandas ------ DataFrame

python高级--数据分析(Pandas库)

Python 数据分析Pandas入门

Python 数据分析Pandas进阶

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)