Pandas DataFrame 的常用操作总结 - 代码天地

Pandas DataFrame 的常用操作总结

其他 2019-01-04 00:58:29 阅读次数: 0

预备:

随便搞一个DataFrame 出来先！！！

import numpy as np
import pandas as pd

data = {'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen', 'Hangzhou', 'Chongqing'],
    'year': [2016,2016,2015,2017,2016, 2016],
    'population': [2100, 2300, 1000, 700, 500, 500]}
frame = pd.DataFrame(data, columns = ['year', 'city', 'population'])

print(frame)

1、两列互换 ----> (城市去前面）

一行代码搞定！！！！

frame.insert(0,'city', frame.pop('city'))

说明:

index = 0

colmun_name = 'city'

列的内容 = frame.pop('city')

<class 'pandas.core.series.Series'>

2、创建DataFrame

import pandas as pd
test_dict = {'sip_ip':[ '10.0.0.88' ]}
test_dict_df  = pd.DataFrame(test_dict)
print(test_dict_df)

3、读取文件并重新rename

# 读取CSV 直接命名       
df = pd.read_csv(file_path, header=None, sep='\t', names=['user_agent'])

# 对DataFrame 改名字
df.rename(columns={'oldName1': 'newName1', 'oldName2': 'newName2'}, inplace=True)

4、DataFrame 进行去重

new_clean_data_df = new_clean_data_df.drop_duplicates(subset=['sip_ip'],keep=False).reset_index(drop=True)

5、新增数据(DataFrame_A 为历史数据 DataFrame_B 为当天数据 DataFrame_C为新增数据)

new_clean_data_df = clean_data_df.append(get_black_sip_data_frame)
new_clean_data_df = new_clean_data_df.append(get_black_sip_data_frame)
new_clean_data_df = new_clean_data_df.drop_duplicates(subset=['sip_ip'],keep=False).reset_index(drop=True)

A+B + A 去重后就是 C 了

A是红色， B 是绿色，再加A 是褐色， --> 去重 ,

这样保留的就是新增的了。

未完待续。。。

有一些场景可以描述一下，我来试着实现

猜你喜欢

转载自blog.csdn.net/Cincinnati_De/article/details/85097209

Pandas DataFrame 的常用操作总结

pandas的DataFrame对列的常用操作

Pandas 之 DataFrame 常用操作

pandas库--DataFrame常用操作

pandas dataframe 操作技巧总结

pandas DataFrame的常用方法

pandas DataFrame 的系列操作

Pandas Dataframe操作技巧

Pandas DataFrame的基本操作

Python pandas DataFrame操作

pandas dataframe index 操作

Pandas入门（二）——DataFrame结构及常用操作

Python：pandas之DataFrame常用操作

pandas的数据结构DataFrame的常用操作

pandas之DataFrame常用方法

[Pandas] 查看DataFrame的常用属性

Pandas中DataFrame用法总结

Pandas之DataFrame学习总结

Pandas 之 DataFrame 学习总结

Pandas DataFrame核心点总结

Pandas：DataFrame对象的基础操作

pandas中DataFrame基本操作

pandas.DataFrame()的基本操作

python pandas随笔（DataFrame操作）

[python][pandas]DataFrame的基本操作

pandas基础：Series与DataFrame操作

Pandas之DataFrame基本操作

pandas——DataFrame基本操作(二)

pandas——DataFrame基本操作(一)

pandas--Dataframe基础操作

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)