import pandas as pd # 导入pandas库,并重命名为pd a = pd.read_csv("1.csv") # 读取csv文件 print(type(a)) # 打印a的类型 print(a.dtypes) # 打印csv文件里各字段类型 print("-----------------------------------") print(a.head()) # 默认显示csv文件里前五条数据 print(a.head(3)) # 3表示显示csv里前三条数据 print(a.tail()) # 默认显示csv文件里后五条数据 print(a.tail(3)) # 3表示显示csv里后三条数据 print("-----------------------------------") print(a.columns) # 打印csv文件里的列名 print(a.shape) # 打印csv文件行数,列数 print("-----------------------------------") print(a.loc[0]) # 获取csv文件里第一行数据 print(a.loc[6]) # 获取csv文件里第七行数据 ,[]里的数字代表索引值 print(a.loc[0:2]) # 获取csv文件里第一,二,三行数据 print("--------------获取列名以len结尾的数据---------------------") column_names = a.columns.tolist() # 获取列名 gram_columns = [] # 用来存放以len结尾的列名 for c in column_names: # 循环遍历列名 if c.endswith("len"): # 判断是否是以len结尾的列 gram_columns.append(c) # 是就加入数组里 new_column = a[gram_columns] # 所有列名以len结尾的数据 print(new_column.head(3)) # 打印前三行 print("-----------------------------------") sepal_new = a["sepal_len"] * a["sepal_width"] # 对文件的数据进行乘法计算 print(sepal_new[0:3]) # 打印前三行 a["sepal_new"] = sepal_new # 创建一个新的列,并赋值 print(a.head(3)) print("-----------------------------------") a.sort_values("sepal_new", inplace=True) # 对sepal_new进行排序,默认为升序,inplace在原来基础上进行修改 print(a["sepal_new"][0:3]) a.sort_values("sepal_new", inplace=True, ascending=False) # 降序 print(a["sepal_new"][0:3]) print("-----------------------------------")
python数据分析处理库-Pandas
猜你喜欢
转载自blog.csdn.net/qq_33543737/article/details/86494170
今日推荐
周排行