前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
PS:如有需要Python学习资料的小伙伴可以点击下方链接自行获取
简介
csv文件是相当普遍的一种数据源文件。一般我们在对小量级数据进行分析时,大多会直接读取.csv的文件。
csv文件的全称是"Comma-Separated Values",解释为用逗号分隔的值。
当我们希望把CSV文件读取到Python中时,最常用的方法之一就是使用pd.read_csv()将CSV数据读取为DataFrame。
环境介绍
- 系统环境:Windows 10
- Python版本:Python 3.7
- 必备库:pandas
核心语句
import pandas as pd
pd.read_csv('/文件路径')
代码样例
假设我们电脑里有个名为“orange_cat”的.csv文件,该文件就保存在如下路径中:
C:/Users/osc/Desktop/
我们用下面的语句就能讲数据导入Python,并重命名为dataSet。
# 读取电脑中的文件到Python中
dataSet = pd.read_csv("C:/Users/osc/Desktop/orange_cat.csv")
核心参数
pd.read_csv()内设有30多个参数,通过配置这些参数,可以在读取.csv的过程中,同时对数据进行筛选与剔除等操作。
- pd.read_csv()参数的官网说明:
https://pandas.pydata.org/pandas-docs/version/0.16.2/generated/pandas.read_csv.html
下面是公式的几个核心参数,一般我只会用到这些。
剩余的20多个参数,如果想了解,建议去pandas的官方网站阅读。