pandas 读写csv/excel的常见问题与应对 - 代码天地

pandas 读写csv/excel的常见问题与应对

其他 2020-07-27 11:21:45 阅读次数: 0

首先导入pandas：

import pandas as pd

基本读取
```
s = pd.read_csv('1.csv')
```
这样就是将当前文件夹下的"1.csv"文件读取为DataFrame形式，存储到s中，非常方便。
excel的话同理
```
		s = pd.read_excel('1.csv')
```
基本写入
```
s = pd.DataFrame(a)
s.to_csv('1.csv')
```
注意这是DataFrame类型的方法，如上，可将s保存为’1.csv’中。
编码错误
涉及中文的时候容易出现这样的错误：

UnicodeDecodeError: ‘utf-8’ codec can’t decode bytes in position 0-1

或者

UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-1

这时候需要将代码改为：
```
s = pd.read_csv('1.csv', encoding = 'gbk')
```
这里只是用gbk举例，很多中文的乱码都是因为这个问题。如果还不行的话可以试试其他的编码方式。
读取时的头和索引
对应于pandas的 column 和 index，直接读取的话，会默认将第一行数据读为头，额外生成一列数据为索引，与预期不符。
```
  s = pd.read_csv('1.csv', header = 0)
```
将参数header置为0，那么读入时，则会默认将每列名为为 0， 1， 2, 3，而不会把本该是数据的第一行作为头了。
s = pd.read_csv(‘1.csv’, index_col=0)
```
通过index_col, 可以指定用哪一列作为读取后DataFrame的索引， 如用0就是代表第一列。 
```
零的问题
当存储的数据中有0时，如‘000001’，那么程序会默认为这就是‘1’，结果就存成了1，但事实上你要存的是字符串‘000001’，这就是存储csv时的丢零问题。同理， ‘000001’ 也会被读成1 。
- 存储时不丢零
```
code = '\t000001'
A = pd.DataFrame(code)
A.to_csv('1.csv')
```
在要存储的字符串前面加“\t”，就会使得整个字符串得以保存。
- 读取时不丢零
```
s = pd.read_csv('1.csv'  converters={'code': str})
```
指定参数converts, 可以让某一列代码如’code’ 按str类型读取，就不会自动舍去零了。

猜你喜欢

转载自blog.csdn.net/weixin_39274659/article/details/105272443

pandas 读写csv/excel的常见问题与应对

pandas——读写csv文件和excel文件

pandas 读文件(csv/excel)遇见的问题

pandas 读文件(csv/excel)遇见的问题

pandas读写CSV操作

pandas read excel or csv

pandas读写excel

pandas 读写 excel 数据

python pandas excel 读写

pandas的读写

pandas 读写csv 常用参数

pandas csv文件读写操作

pandas 实现 Excel 常见操作 (2)

pandas 实现 Excel 常见操作 (1)

Pandas的常见用法

Pandas常见用法

pandas 常见操作

Python数据攻略-Pandas进行CSV和Excel文件读写

Pandas读取Excel 、CSV文件

【pandas】pandas中的常见函数

【Python--pandas】pandas读写csv文件---概述

pandas读取csv常见错误及解决方法

pandas读取csv编码问题

使用pandas连接数据库和输出数据库的常见问题

Pandas教程：Python数据框架的10个常见问题

pandas学习-pandas读取数据库、csv、excel

pandas模块常见用法

pandas常见用法总结

pandas 常见绘图总结

pandas读写csv，并增加一列

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)