pandas处理csv - 代码天地

pandas处理csv

其他 2019-05-18 14:24:45 阅读次数: 0

import pandas as pd
from pandas import Series,DataFrame

打开csv文件

deli = pd.read_csv('../得力.csv')

转换为DataFrame数据类型

df = DataFrame(data=deli)

更改列名

df.rename(columns={"title":"商品名称","price":"价格","prodCode":"型号","brand":"品牌","cskucode":"商品id","detailDesc":"商品简介","First_class":"一级分类","Second_class":"二级分类"},inplace=True)
df.drop(["_id"],axis=1,inplace=True)
df

根据列名重新排列

df = df.loc[:,["商品名称","价格","型号","品牌","商品id","商品简介","一级分类","二级分类"]]

处理列中字符串

df["商品名称"] = df["商品名称"].str.strip("\n")
df

保存DataFrame数据为csv文件

df.to_csv("test得力.csv",encoding="utf_8_sig")

关于utf-8与utf_8_sig的区别：

UTF-8以字节为编码单元，它的字节顺序在所有系统中都是一様的，没有字节序的问题，也因此它实际上并不需要BOM(“ByteOrder Mark”)。但是UTF-8 with BOM即utf-8-sig需要提供BOM。

1）程序输出中出现乱码的原因是因为python2中中文编码的问题，需要注意的是要将处理的中文文件的编码和python源文件的编码保持一致，这样不会出现中文乱码。

2）在程序中能够正常输出中文，但是导出到文件后使用excel打开是出现中文乱码是因为excel能够正确识别用gb2312、gbk、gb18030或utf_8 with BOM 编码的中文，如果是utf_8 no BOM编码的中文文件，excel打开会乱码。

其他：

判断列中是否有空值

df.isnull().any(axis=0)

DataFrame文档链接 http://pandas.pydata.org/pandas-docs/stable/reference/frame.html

猜你喜欢

转载自www.cnblogs.com/JinMuBaoBao/p/10885533.html

pandas_csv文件文本处理备忘

pandas处理csv

pandas处理csv文件

pandas 处理 csv

pandas 处理CSV大文件

pandas处理csv格式的数据

使用pandas处理CSV文件

pandas读取并处理csv文件

Pandas处理csv英国降雨数据

pandas | 并行处理dataframe生成新csv

pandas学习：使用pandas处理大型CSV文件

数据处理：用pandas处理大型csv文件

pandas中read_csv的缺失值处理

python pandas简单使用处理csv文件

数据科学简介：如何使用 Pandas 库处理 CSV 文件

pandas导入csv文件

pandas的to_csv函数

pandas分段读取csv

pandas读取csv文件

[pandas] read_csv()

pandas读取csv

pandas read excel or csv

pandas读写CSV操作

pandas操作csv文件

pandas 与csv 的写入与读取

pandas分析csv数据

【Python】Pandas 简介，数据结构 Series、DataFrame 介绍，CSV 文件处理，JSON 文件处理

处理csv

Python数据处理从零开始----第二章（pandas）⑦pandas读写csv文件(1)

pandas读取csv文件进行处理时报错： TypeError: invalid type compariso

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)