Pandas的Series结构

series相当于矩阵中的一行或一列

import pandas as pd

import numpy as np

fandango = pd.read_csv(r"E:\PyCharm\fandango_score_comparison.csv")

series_film = fandango["FILM"]                 #找出FILM列的所有值

series_rt = fandango["RottenTomatoes"]               #找到RottenTomatoes列的所有值

from pandas Import Series

file_names = series_film.values

rt_score = series_rt.values

series_custom = Series(rt_score, index="file_names")             #把电影名称(file_names)为索引,对应上影评分数(rt_score),生成Series型数据。

series_custom['Minions (2015)', 'Leviathan (2014)']]

结果为:

original_index = series_custom.index.tolist()                       #把series所以按照行排列出来

sorted_index = sorted(original_index)                                  #对索引排序,索引为英文所以会自动按照英文字母排序。

sc1 = series_custom.sort_index()                                        #按照键进行排序

sc2 = series_custom.sort_values()                                     #按照值进行排序

print(np.add(series_custom, series_custom))                    #对应列相加

如图:

print(np.max(series_custom))                                                #求最大值

print(np.sin(series_custom))                                                  #正弦值

print(series_custom[series_custom > 50])                             #把series_custom中大于50的值返回,“【】”中返回的为布尔值

print(series_custom[(series_custom > 50) & (series_custom < 70)])                                    #把大于50小于70的值返回

rt_critics = Series(fandango["RottenTomatoes"].values, index=fandango["FILM"])

rt_users = Series(fandango["RottenTomatoes_User"],  index=fandango["FILM"])

rt_mean = (rt_critica+rt_usets)/2                                         #求某两列对应值的平均值

设置索引

fandango_film = fandango.set_index('FILM', drop=False)             #设置索引,把FILM作为 fandango的索引

print(fandango_film.index)                                                 #查看索引

fandango.loc[0:4]                                                              #拿出前五行数据 

如图:

fandango_films['Avengers: Age of Ultron (2015)':'Ant-Man (2015)']     #拿出从'Avengers: Age of Ultron (2015)'   到   'Ant-Man (2015)'的数据

如图:

types = fandango_film.dtypes                           #查看文件类型

float_columns = types[types.values == 'float64'].index         #查看文件类型为float64的索引值

float_df = fandango_films[float_columns]                             #找出文件类型为float64的值

猜你喜欢

转载自blog.csdn.net/qq_39112101/article/details/85037584
今日推荐