pandas csv文件相关函数和相关操作
0 注意:inplace = True表示当前操作已经在应用到当前环境中了,比如删除一行,然后inplace = True之后,下次再使用就没有删除的这一行了
1 np.set_printoptions(threshold=np.inf) numpy时使用最大数显示
2 data = pd.read_csv(r"data.csv",nrows=5) 加载固定行数数据
3 data.head(2) 显示固定行数
4 data[“index”].values[0:10] #标签为index的列数据
5 data.columns.values 显示所有标签
6 data.drop(data.index[1],inplace=True) 删除第一行
7 data1.drop_duplicates(‘name’, inplace=True) 删除"name"中的重复数据
8 data.rename(columns={‘index-given’:‘u7777777’,‘wgsize’:‘wwww’}, inplace = True) 替换列表列标签
9 data.insert(5,‘typeSmallSmall’,insert1) #在第五个空子(0,1,2,3,4,5)插入列名字为typeSmallSmall的数据insert1
import pandas as pd
import numpy as np
np.set_printoptions(threshold=np.inf) #最大数显示
# data = pd.read_csv(r"data.csv",nrows=5) #加载固定行数
data = pd.read_csv(r"data.csv")
# data
data.head(2) #显示前五行
index | index-given | benchmark | dataset | comp | rational | mem | localmem | coalesced | atomic | ... | wgsize | transfer1 | wgsize1 | transfer.1 | wgsize.1 | oracle | runtime_cpu | runtime_gpu | src | seq | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 0 | 0 | amd-app-sdk-3.0-BinomialOption-binomial_options | default | 98 | 8 | 13 | 11 | 2 | 0 | ... | 255 | 0.000 | 0.249 | 2048 | 255 | GPU | 3.291073 | 0.152038 | __kernel void A(int a, const __global float4* ... | [129 129 129 ..., 0 127 0] |
1 | 1 | 1 | amd-app-sdk-3.0-BitonicSort-bitonicSort | default | 12 | 2 | 6 | 0 | 6 | 0 | ... | 256 | 0.288 | 0.250 | 131072 | 256 | GPU | 0.121940 | 0.057834 | __kernel void A(__global uint* a, const uint b... | [129 129 129 ..., 0 127 0] |
2 rows × 21 columns
print(data["index"].values[0:10]) #标签为index的列数据
[0 1 2 3 4 5 6 7 8 9]
print(data.columns.values) #第一行,所有标签
['index' 'index-given' 'benchmark' 'dataset' 'comp' 'rational' 'mem'
'localmem' 'coalesced' 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1'
'transfer.1' 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
print(data["index-given"].index[1])
data.drop(data.index[1],inplace=True) #直接删除csv的数据中的第某一行行
print(data["index-given"].index[1])
1
2
data1 = pd.read_csv(r"data1.csv")
print(len(data1["name"]))
data1.drop_duplicates('name', inplace=True) #删除"name"中的重复数据
print(len(data1["name"]))
data1.to_csv(r"data2.csv")
25
20
print(data.columns.values)
data.drop(['benchmark'],axis=1,inplace=True) #删除列 index
print(data.columns.values)
['index-given' 'benchmark' 'dataset' 'comp' 'rational' 'mem' 'localmem'
'coalesced' 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1'
'transfer.1' 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
['index-given' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1' 'transfer.1'
'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
print(data.columns.values)
data.rename(columns={'index-given':'u7777777','wgsize':'wwww'}, inplace = True) #替换列表列标签
print(data.columns.values)
['index-given' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1' 'transfer.1'
'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
['u7777777' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
'atomic' 'transfer' 'wwww' 'transfer1' 'wgsize1' 'transfer.1' 'wgsize.1'
'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
insert1 = data["u7777777"].values
data.insert(5,'typeSmallSmall',insert1) #在第五个空子(0,1,2,3,4,5)插入列名字为typeSmallSmall的数据insert1
print(data.columns.values)
['u7777777' 'dataset' 'comp' 'rational' 'mem' 'typeSmallSmall' 'localmem'
'coalesced' 'atomic' 'transfer' 'wwww' 'transfer1' 'wgsize1' 'transfer.1'
'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']