pandas对csv文件的相关操作

pandas csv文件相关函数和相关操作

0 注意:inplace = True表示当前操作已经在应用到当前环境中了,比如删除一行,然后inplace = True之后,下次再使用就没有删除的这一行了
1 np.set_printoptions(threshold=np.inf) numpy时使用最大数显示
2 data = pd.read_csv(r"data.csv",nrows=5) 加载固定行数数据
3 data.head(2) 显示固定行数
4 data[“index”].values[0:10] #标签为index的列数据
5 data.columns.values 显示所有标签
6 data.drop(data.index[1],inplace=True) 删除第一行
7 data1.drop_duplicates(‘name’, inplace=True) 删除"name"中的重复数据
8 data.rename(columns={‘index-given’:‘u7777777’,‘wgsize’:‘wwww’}, inplace = True) 替换列表列标签
9 data.insert(5,‘typeSmallSmall’,insert1) #在第五个空子(0,1,2,3,4,5)插入列名字为typeSmallSmall的数据insert1

import pandas as pd
import numpy as np
np.set_printoptions(threshold=np.inf) #最大数显示
# data = pd.read_csv(r"data.csv",nrows=5) #加载固定行数
data = pd.read_csv(r"data.csv")
# data
data.head(2) #显示前五行
index index-given benchmark dataset comp rational mem localmem coalesced atomic ... wgsize transfer1 wgsize1 transfer.1 wgsize.1 oracle runtime_cpu runtime_gpu src seq
0 0 0 amd-app-sdk-3.0-BinomialOption-binomial_options default 98 8 13 11 2 0 ... 255 0.000 0.249 2048 255 GPU 3.291073 0.152038 __kernel void A(int a, const __global float4* ... [129 129 129 ..., 0 127 0]
1 1 1 amd-app-sdk-3.0-BitonicSort-bitonicSort default 12 2 6 0 6 0 ... 256 0.288 0.250 131072 256 GPU 0.121940 0.057834 __kernel void A(__global uint* a, const uint b... [129 129 129 ..., 0 127 0]

2 rows × 21 columns

print(data["index"].values[0:10]) #标签为index的列数据
[0 1 2 3 4 5 6 7 8 9]
print(data.columns.values) #第一行,所有标签
['index' 'index-given' 'benchmark' 'dataset' 'comp' 'rational' 'mem'
 'localmem' 'coalesced' 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1'
 'transfer.1' 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
print(data["index-given"].index[1])
data.drop(data.index[1],inplace=True) #直接删除csv的数据中的第某一行行
print(data["index-given"].index[1])
1
2
data1 = pd.read_csv(r"data1.csv")
print(len(data1["name"]))
data1.drop_duplicates('name', inplace=True) #删除"name"中的重复数据
print(len(data1["name"]))
data1.to_csv(r"data2.csv")
25
20
print(data.columns.values)
data.drop(['benchmark'],axis=1,inplace=True) #删除列 index
print(data.columns.values)
 
['index-given' 'benchmark' 'dataset' 'comp' 'rational' 'mem' 'localmem'
 'coalesced' 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1'
 'transfer.1' 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
['index-given' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1' 'transfer.1'
 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']

print(data.columns.values)
data.rename(columns={'index-given':'u7777777','wgsize':'wwww'}, inplace = True) #替换列表列标签
print(data.columns.values)
['index-given' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
 'atomic' 'transfer' 'wgsize' 'transfer1' 'wgsize1' 'transfer.1'
 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
['u7777777' 'dataset' 'comp' 'rational' 'mem' 'localmem' 'coalesced'
 'atomic' 'transfer' 'wwww' 'transfer1' 'wgsize1' 'transfer.1' 'wgsize.1'
 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']
insert1 = data["u7777777"].values
data.insert(5,'typeSmallSmall',insert1) #在第五个空子(0,1,2,3,4,5)插入列名字为typeSmallSmall的数据insert1
print(data.columns.values)
['u7777777' 'dataset' 'comp' 'rational' 'mem' 'typeSmallSmall' 'localmem'
 'coalesced' 'atomic' 'transfer' 'wwww' 'transfer1' 'wgsize1' 'transfer.1'
 'wgsize.1' 'oracle' 'runtime_cpu' 'runtime_gpu' 'src' 'seq']



发布了97 篇原创文章 · 获赞 18 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/qq_32460819/article/details/103395916