我的编程笔记本 - 代码天地

我的编程笔记本

其他 2020-07-29 19:38:21 阅读次数: 0

大数据清洗过程- pandas的文件读取

一般比较简单的方式就直接读取

import pandas as pd 

df = pd.read_csv('data.csv')

但是遇到比较复杂结构的文件，层级较多的情况，例如csv里面的分隔符有分号，又有逗号的时候，需要标注清楚分割方式

df = pd.read_csv('data.csv',sep = ';')

python也有自带的csv文件读取和处理的函数import csv

with open('data.csv', newline = ' ') as csvfile:
    spamreader = csv.reader(csvfile, delimiter= ' ', quotechar = '|')
    headers = next(spamreader)
    for row in spamreader:
        print(','.join(row))

还有一种选择是将数据读到dict字典里面

with open('data.csv') as f :
    f_csv = csv.DictReader(f)
    for row in f_csv:
        #process row

如果是Excel格式, 又有点不同

import xlrd 

data = xlrd.open_workbook('Excel.xls')
#读取其中所有的工作表
print(data.sheet_names())
# 打开第一个工作表
table = data.sheet()[0]
# 获取第一个工作表的行数 
print(table.nrows)

可见对于excel 格式和csv格式的处理方式有些不同

猜你喜欢

转载自www.cnblogs.com/eileencara/p/13399091.html

我的编程笔记本

我的笔记本

我的笔记本(Thinkpad)

我的笔记本2018

我用java写的笔记本

编程英语生词笔记本

python编程用什么笔记本好,python用什么笔记本电脑

python编程用什么笔记本好,学python用什么笔记本好

谈谈我对Mac笔记本的使用感受

我的C++笔记本（逆水行舟）

JavaScript笔记本

Redis笔记本

笔记本

联想笔记本

笔记本电视

Python笔记本

sql笔记本

linux笔记本

ASUS 笔记本

【Android】笔记本

笔记本导购

数学笔记本

笔记本优化

笔记本的保养

MySql笔记本

matlab笔记本

Thinkpad 笔记本

笔记本充电

数据处理01：Python编程笔记本Jupyter！

数据处理01：Python编程笔记本Jupyter

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)