(1)获取某行数据
如:
获取第0行:file1.loc[0]
获取第0行到第3行数据: file1.loc[0:3]
获取第2行第5行和第10行的数据: file1.loc[[2,5,10]]
或者data_flag = [2,5,10] print(file1.loc[data_flag])
(2)获取某列的数据
如:
获取名为NDB_No的整列: ndb_col = file1["NDB_No"] #NDB_No为列名
获取某两列数据:
columns = ["Zinc_(mg)", "Copper_(mg)"]
print(file1[columns])
获取列名以"(g)"结尾的列:
import pandas
file1 = pandas.read_csv(r"...文件地址..")
col_names = file1.columns.tolist() #以一行的形式读取出文件列名
pram_columns = []
for c in col_names:
if c.endswith("(g)"):
pram_columns.append(c)
gram_df = file1[pram_columns]
print(gram_df.head(3))
(3)将某列数据整体乘除一个值
import pandas
food_info = pandas.read_csv(r"...文件地址...")
div_1000 = food_info["Iron_(mg)"] / 1000 #将这一列所有数据除以1000
print(div_1000)
(4)两列中对应数值相乘除
import pandas
food_info = pandas.read_csv(r"E:\PyCharm\food_info.csv")
water_energy = food_info["Water_(g)"]*food_info["Energ_Kcal"] #两列中对应位置数值相乘
(5)生成新的一列加入到列表当中
import pandas
food_info = pandas.read_csv[r"E:\PyCharm\food_info.csv"]
iron_gram = food_info["iron_(mg)"] / 1000 #将原来的列除以1000生成新的一列
food_info["iron_(g)"] = iron_gram #将新的一列加入到列名为iron_(g)的列中
print(food_info.shape) #查看表格中有多少行多少列
(6)加减乘除操作
参考(3),(4)举一反三吧
还是举个例子吧 >_<
import pandas food_info = pandas.read_csv(r"E:\PyCharm\food_info.csv") weighted_protein = food_info["Protein_(g)"]*2 weighted_fat = -0.75 * food_info["Lipid_Tot_(g)"] initial_rating = weighted_protein + weighted_fat print(initial_rating)
(7)求出列中的最大值
import pandas
food_info = pandas.read_csv(r"E:\PyCharm\food_list.csv")
max_calories = food_info["Energ_Kcal"].max() #求出这一列当中最大的之值
可以让某列除以最大值,算出数据和最大值的比率。