pandas 整理 - 代码天地

pandas 整理

其他 2018-07-23 22:29:17 阅读次数: 0

df = pd.read_csv(‘文件名’,header = 0)

df.shape 查看文件的行数和列数

df.head(5) 查看文件的前五行

df.drop([列名],axis = 1) 或者 df.drop([列名], 1)

df.drop('c',inplace=True) inplace = True的时候会将原数据也修改

df.列名.unique() 选出这一列的不重复项有哪些

df['diagnosis'] =df['diagnosis'].map({'M' : 0, 'B' : 1}) diagnosis为一列,map中放置一个字典,将一个列中的数据进行重命名

list(df.columns[ : ])取出df的列名

apply函数可以对DataFrame对象进行操作，既可以作用于一行或者一列的元素，也可以作用于单个元素。

df.apply(f) 默认axis为0

df.apply(f,axis=1)

format = lambda x:'%.2f' % x df.applymap(format) 来对数据进行格式的限制

df.sort_values(by=['a','b'])

df.describe() 可以显示出每一列的均值等信息

df.fillna({1:0.5,2:-1})第一列的空值换为0.5 第二列的空值换位-1

numpy的设计目的是处理大数据，不可能一直复制数据，直接在原数据上进行操作如果想得到ndarray切片的一份副本而非视图，需要显示地进行复制，arr[5:8].copy()

pd.read_csv('ex2.csv',names=['a', 'b', 'c', 'd', 'message'])将列重命名

读取文件

withopen('examples/ex7.csv') as f:

lines = list(csv.reader(f))

header, values =lines[0], lines[1:]

读取json文件

import json

result =json.loads(obj)

{'name': 'Wes',

'pet':None,

'places_lived': ['United States', 'Spain','Germany'],

'siblings': [{'age': 30, 'name': 'Scott','pets': ['Zeus', 'Zuko']},

{'age': 38, 'name': 'Katie', 'pets': ['Sixes', 'Stache', 'Cisco']}]}

asjson =json.dumps(result)

asjson

'{"name": "Wes", "places_lived": ["United States", "Spain", "Germany"], "pet": null, "siblings": [{"name": "Scott", "age": 30, "pets": ["Zeus", "Zuko"]}, {"name": "Katie", "age": 38, "pets": ["Sixes", "Stache", "Cisco"]}]}'

siblings =pd.DataFrame(result['siblings'], columns=['name', 'age'])

siblings

猜你喜欢

转载自blog.csdn.net/weixin_38987362/article/details/80898521

pandas 整理

Pandas整理

整理pandas操作

整理 pandas 常用函数

Pandas 与数据整理

Pandas学习整理与实践

Pandas统计函数整理

Pandas 数据清洗与整理

pandas 基础操作整理

pandas常用操作整理

Python pandas基础整理总结

【pandas学习笔记】综合整理

Numpy和Pandas使用整理

pandas 常用操作整理 - Python

pandas库的使用（知识整理）

Pandas 数据清洗与整理(全)

找到一个好的pandas 整理pandas操作

pandas操作，感觉不错，复制过来的整理pandas操作

Numpy，matplotlib和pandas库整理

pandas.read_csv参数整理

【python】Pandas中DataFrame基本函数整理

pandas包常见使用整理

pandas中Series的常用内容整理

Python11-pandas整理03

Python09-pandas整理01

Python10-pandas整理02

pandas.read_csv() 参数 names整理

pandas.read_csv() 参数 header整理

Python数据分析复习整理（Pandas）

Python Pandas 常用函数整理（更新中）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)