series相当于矩阵中的一行或一列
import pandas as pd
import numpy as np
fandango = pd.read_csv(r"E:\PyCharm\fandango_score_comparison.csv")
series_film = fandango["FILM"] #找出FILM列的所有值
series_rt = fandango["RottenTomatoes"] #找到RottenTomatoes列的所有值
from pandas Import Series
file_names = series_film.values
rt_score = series_rt.values
series_custom = Series(rt_score, index="file_names") #把电影名称(file_names)为索引,对应上影评分数(rt_score),生成Series型数据。
series_custom['Minions (2015)', 'Leviathan (2014)']]
结果为:
original_index = series_custom.index.tolist() #把series所以按照行排列出来
sorted_index = sorted(original_index) #对索引排序,索引为英文所以会自动按照英文字母排序。
sc1 = series_custom.sort_index() #按照键进行排序
sc2 = series_custom.sort_values() #按照值进行排序
print(np.add(series_custom, series_custom)) #对应列相加
如图:
print(np.max(series_custom)) #求最大值
print(np.sin(series_custom)) #正弦值
print(series_custom[series_custom > 50]) #把series_custom中大于50的值返回,“【】”中返回的为布尔值
print(series_custom[(series_custom > 50) & (series_custom < 70)]) #把大于50小于70的值返回
rt_critics = Series(fandango["RottenTomatoes"].values, index=fandango["FILM"])
rt_users = Series(fandango["RottenTomatoes_User"], index=fandango["FILM"])
rt_mean = (rt_critica+rt_usets)/2 #求某两列对应值的平均值
设置索引
fandango_film = fandango.set_index('FILM', drop=False) #设置索引,把FILM作为 fandango的索引
print(fandango_film.index) #查看索引
fandango.loc[0:4] #拿出前五行数据
如图:
fandango_films['Avengers: Age of Ultron (2015)':'Ant-Man (2015)'] #拿出从'Avengers: Age of Ultron (2015)' 到 'Ant-Man (2015)'的数据
如图:
types = fandango_film.dtypes #查看文件类型
float_columns = types[types.values == 'float64'].index #查看文件类型为float64的索引值
float_df = fandango_films[float_columns] #找出文件类型为float64的值