什么是高维组合特征？ - コードワールド

什么是高维组合特征？

その他 2021-11-25 08:55:55 訪問数: null

为了提高模型对数据复杂关系的拟合能力，在做特征工程时常常对一些特征进行组合，构成高阶特征。

以逻辑回归为例，假设数据特征向量为 $X = (x_1, x_2, ..., x_k)$ ，则有

$sigmoid(\sum_{i} \sum_{j} w_{ij} < x_i, x_j >)$

其中 $x_i, x_j >$ 表示 $x_i$ 与 $x_j$ 的组合特征。第 $i, j$ 个特征的取值个数为 $x_i|, |x_j|$ ，那么 $w_{ij}$ 的维度大小为 $x_i|·|x_j|$ 。当 $x_i$ 或 $x_j$ 为ID类特征，例如user id有m个，item id有n个，那么 $w_{ij}$ 的参数规模为 $m * n$ ，生产环境中，uid和nid可达百万级，几乎无法学习 $m * n$ 规模的参数。

一种行之有效的方法是将 $w_{ij}$ 进行矩阵分解，由 $m * n$ 分解为两个 $m * k$ 、 $n * k$ 的矩阵乘法， $k < < m, k < < n$ 。此时 $w_{ij} = x_i^{'} · x_j^{'}$ ，这样需要学习的参数规模为 $(m + n) * k$ ，其实类似于embedding的形式。

欢迎关注微信公众号（算法工程师面试那些事儿)，本公众号聚焦于算法工程师面试，期待和大家一起刷leecode，刷机器学习、深度学习面试题等，共勉～

算法工程师面试那些事儿

おすすめ

転載: blog.csdn.net/qq_40006058/article/details/121344130

什么是高维组合特征？

什么是高维组合特征？

什么是高维组合特征？

向量，高维思考

如何找到有意义的特征组合？

取出一维数组中相同元素，重新组合成二维数组

底部特征到底是什么样？

为什么对数值类型的特征归一化？

为什么要连续特征离散化处理？

AcWing 1027. 方格取数（高维 dp）

特征可视化--带你了解CNN到底在看什么

面向对象什么是依赖关联聚合和组合实现继承？

高并发下的 HashMap 为什么会死循环

高逼格的 SQL 写法：行行比较，别问为什么，问就是逼格高。。

什么是IS-IS中间系统到中间系统？网工、运维必看！

高维稀疏时，线性模型比非线性效果好的原因

如何解决成本高、运维难？华为云数据库是答案

pytorch----一个高维矩阵乘法(维度不同的矩阵乘法)引发的血案

pytorch如何将装有tensor的list转成高维tensor

钱币组合

sizeof 和 strlen 深度理解数组名是什么冒泡排序数组传参二维数组

西电-数据可视化-实验五-高维非空间数据可视化（pyecharts）

为什么需要利联科技高防服务器103.216.154.xx

为什么域名SSL证书的价格这么高？有哪些成本？

为什么高版本的jdk单例不再需要volatile修饰?

震荡行情下，使用什么工具博高收益-网格交易

现货会比期货价格高吗（为什么现货比期货贵）

文本特征处理方法

OpenCv特征匹配

特征选择笔记

おすすめ

ランキング

Oracleのクエリ重複フィールド

An error occurred when ssm used count to query data

【Leyes de la Naturaleza】La sabiduría de las multitudes

JavaWebの研究では、（13）を締結 - セッションの使用は、重複送信フォームを防ぎます

Firebase増加サインアップクォータ

[MyBatisフレームワーク]mybatis入門

ハートレスの世界

Djangoのインストールと使用について

[转] UiPath展開アーキテクチャ

mybatis-plusは楽観的なロック変更を使用します

アーカイブ

もっと

2024-05-14(9)

2024-05-13(8)

2024-05-12(27)

2024-05-11(31)

2024-05-10(33)

2024-05-09(30)

2024-05-08(18)

2024-05-07(34)

2024-05-06(6)

2024-05-05(0)