パンダを使用してcsvファイルを読み取る
read_csv()の基本的なパラメーターの概要
filepath_or_buffer:csvファイルのパスと名前、strタイプ
sep:セパレーター、デフォルトsep = '、'
ヘッダー:列名、デフォルト 'infer'、読み取ったcsvに名前がある場合、設定する必要はありません。名前がない場合は、ヘッダーとして設定します=
名前なし:header = Noneの場合、各列名に値を割り当てることができます。デフォルト名=なし
index_col:行のインデックスとして列を選択します。デフォルトindex_col = None
usecols:固定列を選択します。デフォルトusecols = None
skiprows:toスキップする行の数(int)またはスキップする行のインデックス(リスト)、デフォルトのskiprows =なし
nrows:最大行数、デフォルトのnrows =なし
encoding:エンコード形式、utf-8にエラーがあるという文字化けしたプロンプトがある場合、それは必須です「ANSI」などのエンコーディング形式を変更します。デフォルトのエンコーディングは「utf-8」です。
例1 csvファイルを読み取り、名前を付けてタイトルを追加する
header = Noneの場合は以下の通りです、
data = pd.read_csv('学生月考成绩表.csv',sep=',',header=None,names= ['Name','Name1','Name2','Name3','Name4','Name5','Name6'])
data
header = 0の場合、元のタイトルの名前が変更されます
data = pd.read_csv('学生月考成绩表.csv',sep=',',header=0,names= ['Name','Name1','Name2','Name3','Name4','Name5','Name6'])
data
例2データの特定の列を行のインデックスとして選択する
data = pd.read_csv('学生月考成绩表.csv',sep=',',index_col = 'Name')
data
data = pd.read_csv('学生月考成绩表.csv',sep=',',index_col = 'Name')
data.loc['zhangsan','Ranking']
例3データの固定された列と行を選択する
列3、行4を選択します
data = pd.read_csv('学生月考成绩表.csv',sep=',',usecols=['Math'])
data
data = pd.read_csv('学生月考成绩表.csv',sep=',',usecols=['Math'],skiprows=[1,2,3,5])
data
例4 csvファイルの最大行数を選択する
data = pd.read_csv('学生月考成绩表.csv',sep=',',nrows = 3) #提取前三行数据
data
例5 csvファイルを読み取るときに、エンコード形式が変更される
次のように、「名前」列を漢字フォーマットに変更します。
data = pd.read_csv('学生月考成绩表.csv')
data
プロンプトエラー:UnicodeDecodeError: 'utf-8'コーデックは位置0のバイト0xd5をデコードできません:無効な継続バイト
エンコードタイプを変更してください。表示は正常です。
data = pd.read_csv('学生月考成绩表.csv',encoding='ANSI')
data
参照
【1】https://blog.csdn.net/qq_22290797/article/details/104706093