《利用Python进行数据分析》电影数据 - 代码天地

《利用Python进行数据分析》电影数据

其他 2018-10-24 09:22:24 阅读次数: 0

由于原书中都是python2版本的代码，有些方法已过期，在python3中执行不成功。修改后的python3可执行的完整代码如下：

import pandas as pd
unames = ['user_id','gender','age','occupation','zip']
users = pd.read_table('E:/python/geany_workspace/pydata-book-2nd-edition/datasets/movielens/users.dat',sep='::',engine='python',header = None,names=unames)

rnames = ['user_id','movie_id','rating','timestamp']
ratings = pd.read_table('E:/python/geany_workspace/pydata-book-2nd-edition/datasets/movielens/ratings.dat',sep='::',engine='python',header=None,names=rnames)

mnames = ['movie_id','title','genres']
movies = pd.read_table('E:/python/geany_workspace/pydata-book-2nd-edition/datasets/movielens/movies.dat',sep='::',engine='python',header=None,names=mnames)

data = pd.merge(pd.merge(ratings,users),movies)
data[:5]

mean_ratings = data.pivot_table('rating',index =['title'],columns = ['gender'],aggfunc = 'mean')
mean_ratings[:5]

ratings_by_title = data.groupby('title').size()
ratings_by_title[:10]

active_titles = ratings_by_title.index[ratings_by_title>=250]
mean_ratings = mean_ratings.loc[active_titles]
mean_ratings[:5]

top_female_ratings = mean_ratings.sort_values(by='F',ascending=False)
top_female_ratings[:10]

mean_ratings['rating_diff'] = mean_ratings['F'] - mean_ratings['M']
sort_by_diff = mean_ratings.sort_values(by='rating_diff',ascending=False)
sort_by_diff[::-1][:5]

rating_std_by_title = data.groupby('title')['rating'].std()
rating_std_by_title.loc[active_titles].sort_values(ascending = False)[:10]

猜你喜欢

转载自blog.csdn.net/zenmehaichonga_2009/article/details/82854628

《利用Python进行数据分析》电影数据

利用Python进行数据分析

《利用Python进行数据分析》

利用Python进行数据分析——数据清洗与准备

利用Python进行数据分析---数据规整化

《利用Python进行数据分析》 12.1 分类数据

Python图书之《利用Python进行数据分析》

【利用python进行数据分析】附录A Python 学习

python学习日记——利用python进行数据分析

利用Python进行数据分析——Ipython

pandas-利用python进行数据分析

利用Python进行数据分析——pandas入门

《利用Python进行数据分析》笔记二

《利用python进行数据分析》读书笔记

思维导图-利用Python进行数据分析

利用Python进行数据分析：【NumPy】

利用Python进行数据分析：【Matplotlib】

利用Python进行数据分析：【IPython】

利用Python进行数据分析——可视化

利用Python进行数据分析——Pandas

利用Python进行数据分析·第2版

利用Python进行数据分析——基础示例

利用python进行数据分析的引入惯例

利用python进行数据分析(一)

利用Python进行数据分析之pandas

《利用Python进行数据分析》PDF版下载

【利用python进行数据分析】pandas入门

利用Python进行数据分析学习笔记

读利用python进行数据分析后感

【利用python进行数据分析】时间序列

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)