python笔记6:数据处理之导入数据

# -*- coding: utf-8 -*-
#数据一般存储在文件(csv、txt、excel)和数据库中

#1. 导入csv文件(第一行是列名)

from pandas import read_csv

#文件的编码格式也应该是 utf-8 才行,否则报错
df = read_csv(
              'D:/python/workspace/pythonStudy/jysj.csv',
              encoding = 'utf-8'
              )

#2. 导入文本文件(比csv文件自由,没有规定第一行必须是列名)

from pandas import read_table

#没导入有列名的txt文件(默认会把第一行数据当作列名,为了避免,我们应该指定列名):
df = read_table(
                'D:/python/workspace/pythonStudy/jysjWithoutColumnName.txt',
                names=['交易类型','出卖人名称','出卖人证件类型','出卖人证件号码','买受人名称','买受人证件类型','买受人证件号码','房屋坐落','层次','房屋用途','房屋结构','建筑面积',"建筑年代","交易额","交易时间"],
                sep=',' #表示txt中的数据是以逗号隔开的(不加这一句会造成把所有的数据当成一列导入进来)
                )

#导入有列名的txt文件
df = read_table(
                'D:/python/workspace/pythonStudy/jysjWithColumnName.txt',
                names=['交易类型','出卖人名称','出卖人证件类型','出卖人证件号码','买受人名称','买受人证件类型','买受人证件号码','房屋坐落','层次','房屋用途','房屋结构','建筑面积',"建筑年代","交易额","交易时间"],
                sep=','
                )


#3. 导入excel文件
#语法:read_excel(fileName,sheetName,names)

from pandas import read_excel
df = read_excel(
                'D:/python/workspace/pythonStudy/jysj.xls',
                sheetname='吉木萨尔县近三年房屋交易信息'
                )

#4. 解决文件名包含中文的问题:
#加上engine参数即可:
df = read_excel(
                'D:/python/workspace/pythonStudy/中文文件名.xls',
                sheetname='吉木萨尔县近三年房屋交易信息',
                #engine='python'
                )


猜你喜欢

转载自blog.csdn.net/aiyo92/article/details/79131623