程世东老师TensorFlow实战——个性化推荐，代码学习笔记之数据导入&数据预处理（下）

其他 2018-11-27 00:10:50 阅读次数: 0

这篇主要是进行代码中的一些数值可视化，帮助理解

代码来自于知乎:https://zhuanlan.zhihu.com/p/32078473

/代码地址https://github.com/chengstone/movie_recommender/blob/master/movie_recommender.ipynb

数据预处理过程中的预览：（可以跳过看图片结果）

1.1、Users的初始读取显示

1、Pandas中可以用dataframe.head()和dataframe.tail()查看数据的头五行和尾五行，若需要改变行数，可在括号内指定

pandas主要的两个数据结构是Series和DataFrame

Series可以简单地被认为是一维的数组，Series和一维数组最主要的区别在于Series类型具有索引（index）

DataFrame是将数个Series按列合并而成的二维数据结构，每一列单独取出来是一个Series

dataframe.values则以数组的形式返回DataFrame的元素：所以注意对于users.value的显示不能用head

2、users.value返回的是一个numpy.ndarray类型

如果没有numpy，Python内部只能用list或array来表示矩阵。

假如用list来表示[1,2,3]，由于list的元素可以是任何对象，因此list中所保存的是对象的指针，这样就需要有3个指针和三个整数对象，比较浪费内存和CPU计算时间。

Python的array和list不同，它直接保存数值，和C语言的一维数组比较类似，但是不支持多维，表达形式很简陋，写科学计算的算法很难受。

numpy弥补了这些不足，核心贡献就是提供了ndarray这个存储单一数据类型的多维数组结构

3、ndarray介绍

ndarray可以用np.array这个函数来创建

关于数组的描述信息保存在一个数据结构中，这个结构引用两个对象，一块用于保存数据的存储区域和一个用于描述元素类型的dtype对象。

数据存储区域保存着数组中所有元素的二进制数据，dtype对象则知道如何将元素的二进制数据转换为可用的值。数组的维数、大小等信息都保存在ndarray数组对象的数据结构中。

1.2、users表预处理后的显示

2.1、movie数据的初始读取

2.2、movies去掉年份

For ii,val in enumerate(set(movies['Title'])) 打印ii，val显示：

2.3、movie title转数字字典

For 循环后的title_set如下，加入的是一个单词

Title2int

2.4电影Title转成等长数字列表，长度是15

2.5 电影genres转数字字典

3 ratings读取

4、合并三个表

data = pd.merge(pd.merge(ratings, users), movies)

5、输入x和目标y

6、features_pd.values 和 targets_pd.values

猜你喜欢

转载自blog.csdn.net/yyyxxxsss/article/details/84556800

程世东老师TensorFlow实战——个性化推荐，代码学习笔记之数据导入&数据预处理（下）

程世东老师TensorFlow实战——个性化推荐，代码学习笔记之数据导入&数据预处理（上）

程世东老师TensorFlow实战——个性化推荐，代码学习笔记之③推荐过程

程世东老师TensorFlow实战——个性化推荐，代码学习笔记之②模型训练与测试

TensorFlow实战——个性化推荐

tensorflow个性化推荐

大数据——个性化推荐系统

CSDN 个性化推荐的数据治理

基于tensorflow的个性化电影推荐系统实战

Milvus实战 | 个性化推荐系统

"个性化推荐数据产品与应用"分享汇总

达观数据于敬：个性化推荐系统实践

【大数据】搭建个性化推荐引擎系统

基于大数据的个性化推荐系统

携程个性化推荐算法实践

学习笔记（六）数据预处理之数据变换与数据离散化

使用tensorflow进行电影的个性化推荐

推荐系统笔记（一）：BPR Loss个性化推荐

基于多感官数据的推荐系统：如何打造全面、个性化的推荐系统

推荐系统遇上深度学习(二十)-贝叶斯个性化排序算法原理及实战

R语言深度学习实战：构建个性化推荐系统

BAT大牛亲授个性化推荐算法实战

BAT大牛亲授-个性化推荐算法实战

BAT大牛亲授--个性化推荐算法实战

【机器学习】 - 数据预处理之数据归一化(标准化)与实战分析，正则化

《百面机器学习——学习笔记》个性化推荐系统

Amazon的个性化推荐

个性化推荐理论

个性化推荐系统

机器学习实战基础（九）：sklearn中的数据预处理和特征工程（二）数据预处理 Preprocessing & Impute 之数据无量纲化

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)