用户画像（六）：基于用户搜索数据，构造输入特征

其他 2020-04-16 11:13:47 阅读次数: 0

加载训练好的word2vec模型，求用户搜索结果的平均向量

import numpy as np
file_name = './data/train_querylist_writefile-1w.csv'
cur_model = gensim.models.Word2Vec.load('1w_word2vec_300.model')
with open(file_name, 'r') as f:
    cur_index = 0
    lines = f.readlines()
    doc_cev = np.zeros((len(lines),300))
    for line in lines:
        word_vec = np.zeros((1,300))
        words = line.strip().split(' ')
        wrod_num = 0
        #求模型的平均向量
        for word in words:
            if word in cur_model:
                wrod_num += 1
                word_vec += np.array([cur_model[word]])
        doc_cev[cur_index] = word_vec / float(wrod_num)
        cur_index += 1

doc_cev.shape

在这里插入图片描述

doc_cev[5]

在这里插入图片描述

genderlabel = np.loadtxt(open('./data/train_gender.csv', 'r')).astype(int)
genderlabel.shape

在这里插入图片描述

educationlabel = np.loadtxt(open('./data/train_education.csv', 'r')).astype(int)
educationlabel.shape

在这里插入图片描述

agelabel = np.loadtxt(open('./data/train_age.csv', 'r')).astype(int)
agelabel.shape

在这里插入图片描述

def removezero(x, y):
        nozero = np.nonzero(y)
        y = y[nozero]
        x = np.array(x)
        x = x[nozero]
        return x, y
gender_train, genderlabel = removezero(doc_cev, genderlabel)
age_train, agelabel = removezero(doc_cev, agelabel)
education_train, educationlabel = removezero(doc_cev, educationlabel)
print (gender_train.shape,genderlabel.shape)
print (age_train.shape,agelabel.shape)
print (education_train.shape,educationlabel.shape)

在这里插入图片描述

汪雯琦

发布了916 篇原创文章 · 获赞 1344 · 访问量 19万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_35456045/article/details/105524636

用户画像（六）：基于用户搜索数据，构造输入特征

用户画像（六）：基于用户搜索数据，构造输入特征

用户画像（五）：基于用户搜索数据，姊妹构造词向量特征

用户画像（五）：基于用户搜索数据，姊妹构造词向量特征

用户画像（七）：基于用户搜索数据，建立预测模型

用户画像（七）：基于用户搜索数据，建立预测模型

用户画像（三）：对用户搜索数据的理解

用户画像（三）：对用户搜索数据的理解

用户画像（四）：基于用户搜索数据可以做什么，采取哪些方案呢

用户画像（四）：基于用户搜索数据可以做什么，采取哪些方案呢

[数据挖掘]用户画像

基于大数据的用户画像构建（理论篇）

基于大数据的用户画像构建(理论篇)

项目总结之用户画像构造

大数据中的用户画像

用户画像-数据埋点

用户画像数据建模方法

用户画像

用户画像系列——用户画像数据建模方法

用户画像用户画像表

用户画像：用户画像表

用户画像系列——腾讯防刷负责人：基于用户画像大数据的电商防刷架构

用户画像系列——什么是用户画像？金融行业大数据用户画像实践

基于知识图谱的用户画像技术

推荐系统之基于用户画像推荐

基于MaxCompute构建企业用户画像（用户标签的制作）

用户画像产品化——从零开始搭建实时用户画像(六)

【数据应用案例】用户画像与实践案例

大数据用户画像方法与实践

大数据项目（四）————用户画像

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)