[Python--pandas-1]パンダはcsvファイルを読み取ります

パンダを使用してcsvファイルを読み取る

read_csv()の基本的なパラメーターの概要

filepath_or_buffer:csvファイルのパスと名前、strタイプ
sep:セパレーター、デフォルトsep = '、'
ヘッダー:列名、デフォルト 'infer'、読み取ったcsvに名前がある場合、設定する必要はありません。名前がない場合は、ヘッダーとして設定します=
名前なし:header = Noneの場合、各列名に値を割り当てることができます。デフォルト名=なし
index_col:行のインデックスとして列を選択します。デフォルトindex_col = None
usecols:固定列を選択します。デフォルトusecols = None
skiprows:toスキップする行の数(int)またはスキップする行のインデックス(リスト)、デフォルトのskiprows =なし

nrows:最大行数、デフォルトのnrows =なし
encoding:エンコード形式、utf-8にエラーがあるという文字化けしたプロンプトがある場合、それは必須です「ANSI」などのエンコーディング形式を変更します。デフォルトのエンコーディングは「utf-8」です。

例1 csvファイルを読み取り、名前を付けてタイトルを追加する

header = Noneの場合は以下の通りです、

data = pd.read_csv('学生月考成绩表.csv',sep=',',header=None,names= ['Name','Name1','Name2','Name3','Name4','Name5','Name6'])
data

ここに画像の説明を挿入
header = 0の場合、元のタイトルの名前が変更されます

data = pd.read_csv('学生月考成绩表.csv',sep=',',header=0,names= ['Name','Name1','Name2','Name3','Name4','Name5','Name6'])
data

ここに画像の説明を挿入

例2データの特定の列を行のインデックスとして選択する

data = pd.read_csv('学生月考成绩表.csv',sep=',',index_col = 'Name')
data

ここに画像の説明を挿入

data = pd.read_csv('学生月考成绩表.csv',sep=',',index_col = 'Name')
data.loc['zhangsan','Ranking']

ここに画像の説明を挿入

例3データの固定された列と行を選択する

列3、行4を選択します

data = pd.read_csv('学生月考成绩表.csv',sep=',',usecols=['Math'])
data

ここに画像の説明を挿入

data = pd.read_csv('学生月考成绩表.csv',sep=',',usecols=['Math'],skiprows=[1,2,3,5])
data

ここに画像の説明を挿入

例4 csvファイルの最大行数を選択する

data = pd.read_csv('学生月考成绩表.csv',sep=',',nrows = 3) #提取前三行数据
data

ここに画像の説明を挿入

例5 csvファイルを読み取るときに、エンコード形式が変更される

次のように、「名前」列を漢字フォーマットに変更します。
ここに画像の説明を挿入

data = pd.read_csv('学生月考成绩表.csv')
data

プロンプトエラー:UnicodeDecodeError: 'utf-8'コーデックは位置0のバイト0xd5をデコードできません:無効な継続バイト
ここに画像の説明を挿入
エンコードタイプを変更してください。表示は正常です。

data = pd.read_csv('学生月考成绩表.csv',encoding='ANSI')
data

ここに画像の説明を挿入

参照

【1】https://blog.csdn.net/qq_22290797/article/details/104706093

おすすめ

転載: blog.csdn.net/qq_22290797/article/details/104741567