Recommender Systems Based on Generative Adversarial Networks: A Problem-Driven Perspective

Recommender Systems Based on Generative Adversarial Networks: A Problem-Driven Perspective
基于生成式对抗网络的推荐系统:一个问题驱动的视角

下载链接:链接: https://paper.yanxishe.com/library/16124.

摘要:
推荐系统(RS)在人们网络生活的各个方面都扮演着非常重要的角色。许多公司利用简历来帮助用户发现新的和喜欢的项目。尽管取得了实践上的成功,这些系统仍然存在两个主要问题:数据噪声和数据稀疏性。近年来,生成对抗网络(GANs)在许多领域都取得了成功,因为它们的巨大的潜力来学习复杂的实际数据分布,他们还提供新的RS手段缓解上述问题。特别是由于对抗的学习,可以通过添加对抗的扰动或迫使鉴别器分辨信息和不提供信息的数据的样本处理数据噪声的问题。为了减少数据稀疏性问题,基于GAN的模型能够复制user-item交互的真实分布,并增加可用数据。为了全面了解这些基于GAN的推荐模型,我们对这些研究进行了回顾,并从问题驱动的角度对它们进行了组织。具体地,我们提出了这些模型的分类,并详细地描述了它们及其优点。最后,我们详细阐述了几个有待解决的问题,并对基于GAN的RS的当前趋势进行了扩展。
1、介绍
RS具有广泛性和良好的性能,但仍然存在两个主要问题:数据噪声和数据稀疏性。数据噪声作为一种外在问题,来源于训练数据中不经意的、恶意的、无信息性的反馈[20,23,31]。具体来说,用户有时会点击他们不感兴趣的产品,偶然错误的反馈可能会降低RS的准确性。此外,一些恶意的个人资料或反馈有时会被注入RS,目的是操纵推荐结果。此外,在训练过程中,两两学习中随机选取的负样本往往是无信息样本,会误导推荐模型,降低其性能。与数据噪声问题相比,数据稀疏性是一个内在的问题,因为每个用户通常只消耗可用项的一小部分是不可避免的[96]。现有RS通常依赖于历史交互信息用户和项目之间捕捉用户的兴趣。当大量数据丢失时,很容易看到RS不能满足用户的准确推荐[33,56]。如果没有应对机制,这些问题往往会导致RS失败,导致较差的用户体验。
许多研究人员已经意识到这两个问题所造成的有害影响,并努力减少不利因素。为了缓解数据噪声的影响,这些研究者提出了各种方法来缓解数据噪声问题[44,86,8,63,35]。其中,Zhang等[94]利用隐马尔可夫模型分析攻击用户的偏好序列,然后利用层次聚类将攻击用户与评级行为区分开来。Bag等人提出了一种利用 Bhattacharya系数修正随机噪声的方法以及自我矛盾的概念。Yu等人[88]为了区分信息更丰富的item和未观察到的item。通过将整个训练数据建模为异构信息网络来获取更多的用户信息嵌入表示。为了获得有用的负样本信息,一些研究者采用了大众偏见的方法抽样策略[13,22]。虽然上述方法已经注意到传统模型容易被识别在训练数据中不可避免的噪声,他们只能从一个特定的角度来分辨明显的噪音,他们没有做到不断更新他们的能力,以区分噪声从未观察到的项目。另一方面,很多方法,所有关于数据相似度的问题,都是为了整合辅助信息,如社会关系[76,103,48,84],用户点评[17,47,42],条目内容[12],外部知识图谱[75,77]。虽然辅助信息的整合是有帮助的,但这些方法仍然存在稀疏性问题,只使用少量的观测数据来学习最终的特征,它们不能完全表征数据的复杂性。
表1基于gan的推荐模型的论文数量统计

最近,生成式对抗网络(GANs)引领了深度学习领域的一场革命[102,18],如图像和音频[97,50,41,78]。GANs的原理是在生成器和鉴别器之间玩一个对抗极大极小的游戏。该生成器主要学习实际观测数据的分布,然后使用生成的样本来混淆鉴别器。鉴别器需要判断输入样本是否来自生成器。
GANs在其他领域的成功应用为RS树立了良好的榜样,一些开创性的工作已经在这一领域迈出了第一步[82]。根据近三年与RS相关的顶级会议的统计,基于GAN的推荐模型的论文数量逐年增加,如表1所示。在2018年基于GANs的信息检索(IR)模型研讨会上, 研究人员[95]指出基于GAN的RS将成为一个热点领域的RS。原因在于,GANs的想法带来了新的机会抵抗噪声数据的干扰和缓解数据稀疏。在现有的基于GAN的RS中,为了减少RS对数据的干扰,一些研究人员验证了加入对抗扰动的有效性,并在目标函数中引入极小极大对策来减少数据噪声。与此同时,其他研究人员试图使用鉴别器以一种对抗性的方式从未观察到的例子中区分出信息更丰富的样本。为了缓解数据稀疏性问题,现有的基于GANs的推荐模型不仅可以通过增加user-item交互信息直接生成用户偏好,还可以通过增加辅助信息合成用户偏好,可以显著降低数据稀疏性。
然而,据我们所知,很少有系统的综述对基于GAN的推荐模型的现有研究和当前进展进行了充分的分析。为此,本文从问题驱动的角度对这些模型进行了研究和回顾。具体来说,我们将现有的研究分为两个部分,第一部分是对降低数据噪声的不利影响的方法的综述,另一部分是对缓解数据稀疏性问题的模型的综述。希望本文的研究能够为后续GAN基RS的研究奠定基础。综上所述,本篇综述的主要贡献如下:

1、为了全面了解最新的基于GAN的推荐模型,我们对这些研究进行了回顾,并从问题驱动的角度对它们进行了组织。
2、我们从两个角度系统地分析了基于GAN的RS数据噪声问题的缓解模型:(1)缓解随机和恶意噪声;(2)根据数据噪声的来源,将未提供信息的样本与未观察到的样本进行区分
3、我们从两个方面对利用GANs来缓解数据稀疏性问题的推荐模型进行了系统的综述:(1)通过增加交互信息来生成用户偏好的模型;(2)通过增加辅助信息来合成用户偏好的模型。
4、我们详细阐述了几个有待解决的问题,并扩展了基于GAN的RS的当前趋势。
2. 生成式对抗网络的发展
它有两个部分:一个生成模型generator和一个判别模型 discriminator。前者学习生成尽可能符合真实数据分布的数据,后者需要识别真实数据和生成的数据。这两个模型相互竞争,并在反馈循环中优化自己。过程如图1所示。

在训练过程中,生成网络G的目标就是尽量生成真实的数据去欺骗判别网络D。而D的目标就是尽量把G生成的数据和真实的数据分别开来。这样,G和D构成了一个动态的“博弈过程”。
损失函数:

Pdata定义为真是数据概率分布函数,而Pz是生成数据的概率分布。D(x)代表x来自于真实数据分布而不是pg的概率,我们训练D来最大化分配正确标签给不管是来自于训练样例还是G生成的样例的概率.我们同时训练G来最小化log(1−D(G(z)))。换句话说,D和G的训练是关于值函数V(G,D)的极小化极大的二人博弈问题;该模型也称为vanilla-GAN,它有一些缺点:无法指示模型的损失函数的训练过程以及生成的样本缺乏多样性。
当实际数据和生成数据的分布不重叠时,函数值趋于常数,导致梯度消失。然后他们[1]提出了用Wasserstein距离代替原来的Jensen-Shannon散度的Wasserstein-GAN(WGAN)。fw是计算Wasserstein距离的函数

WGAN :

然WGAN从理论上解决了训练困难的问题,但它仍然存在生成样本质量低、由于判别器上的lipschitz约束而训练不收敛等问题。因此,Ishaan等人。[27]正则化Lipschitz约束,提出梯度惩罚WGAN模型(WGAN-GP)。Lipschitz约束通过将约束赋给目标函数的惩罚项来逼近。损失函数是

其中,Pr是数据分布,而Pg是生成器分布。如式3所示,参数x越大,对数损失函数越平滑,梯度越小,几乎没有改善.Mao等人。[43]在WGAN的启发下,提出了最小二乘GAN(LSGAN),为鉴别器D提供平滑和非饱和梯度的损失函数。LSGAN有效地缓解了训练的不稳定性,提高了生成数据的质量。
除了修改损耗函数以提高GANs的性能外,一些研究[54,21,14]主要关注鉴别器和发生器的网络结构。Vanilla GAN的结构采用多层感知器(MLP)实现,参数整定困难。为了解决这个问题,Alec等人。[54]由于卷积神经网络(CNN)比MLP具有更好的拟合和表示能力,提出了一种深卷积生成对抗网络(DCGAN)。DCGAN极大地提高了数据生成的质量,为后续的神经网络结构研究提供了参考。DCGAN的结构如图2所示。

尽管GANs作为一种无监督模型受到了广泛的关注,但是GANs中的生成器只能基于随机噪声生成数据,这使得生成的数据往往是无用的。因此,Mirza和Osindero[49]提出了条件GAN(CGAN)模型。通过向模型中添加条件约束,生成器可以生成与条件相关的数据。CGAN可以看作是一种改进,它将无监督的GAN转变为有监督的模型。这一改进也被证明是非常有效的,为以后的相关工作提供了指导。例如,拉普根[21]在拉普拉斯金字塔的框架内集成了CGAN,以生成从粗糙到精细的时尚图像。InfoGAN[14]是CGAN的另一个变体,它将随机噪声分解为噪声和隐式编码,以学习更多可解释和有意义的表示。纵观GANs的最新进展,我们可以发现许多先进的模型被提出,特别是在计算机视觉和自然语言处理领域。这些模型对于缓解RS的数据噪声和数据稀疏性问题有一定的参考价值。

3、基于GAN的数据噪声抑制推荐模型
在推荐系统研究中,数据噪声问题越来越受到重视。它不仅影响系统的精度,而且影响系统的鲁棒性(在异常和危险情况下系统生存的能力)。在本节中,我们将回顾最新的基于GAN的发现偶然的、恶意的噪声和无信息反馈的模型。根据引言中提到的数据噪声来源,我们将基于GANs的模型分为两类,如表2所示,(1)用于减轻偶然和恶意噪声的模型,(2)用于区分无信息样本和未观测项目的模型。
3.1、减少偶然和恶意噪音的模型
将GANs的对抗性思想应用到推荐模型的构建过程中,是一种常用的解决数据噪声问题的方法,包括随机噪声和恶意噪声。他等。[31]验证,首次提出了一种新的对抗式个性化排名模型(APR),以提高模型的泛化性能。对抗扰动的作用是帮助模型预先考虑噪声引起的偏差。具体来说,APR的损失函数包含两个部分:一部分是对贝叶斯个性化排名模型(BPR)的参数进行扰动,使其性能尽可能低;另一部分在没有对手扰动的情况下,使推荐性能尽可能高。APR的损失函数来自这两部分,如公式4所示。

式中,Δ表示对模型参数的扰动,控制扰动的大小,
表示现有模型的参数,w是平衡系数,控制正则化项对抗项可使模型函数更稳定,从而一定程度上可以看做正则化项,文中称作adversarial regularizer,而 w 控制其强度。由于整个过程是先对 进行优化使得损失函数最小,然后对 Δ进行优化使得损失函数最大;
与BPR不同,APR采用快速梯度法[26]进行对抗性训练,寻找最优扰动和参数,以缓解数据噪声问题。这是一个突破性的思想,因为它验证了对抗性扰动对抗矩阵分解的有效性,并利用对抗性扰动来模拟恶意噪声以提高系统的鲁棒性。对于排名任务,APR的推荐性能优于基于DNNs的RS[83,32]。随后,它启发了许多后续的研究工作。

通过延长APR,Tang等。[62]为图像RS设计AMR。AMR基于可视化贝叶斯个性化排名模型(VBPR)[29],在图像的低维向量表示中加入了对抗性扰动。AMR的损失函数为

式中Δi表示对抗性扰动,通过最大化训练数据中的损失函数得到最优扰动。表示AMR中的参数。此外,Tran等人。[65]将APR作为音乐序列推荐模型的一部分,以提高其鲁棒性。
Tong等人。[64]提出了一种协同生成对抗网络(CGAN),以减少噪声的影响,提高RS的鲁棒性。具体来说,CGAN使用可变自动编码器(VAE)[37]作为生成器,其输入是每个项目的评分向量。编码后,生成器从训练数据中学习数据分布,通过嵌入层生成伪项样本。鉴别器的重点是最大化的概率,以区分产生的项目样本和实际项目向量。生成器和判别器的损耗函数分别为

其中,u和v分别表示用户和项目的低维向量表示。此外,作者还将 vanilla GAN调整为WGAN和WGAN-GP,因为它们具有更快的训练速度和更好的性能。与CDAE[83]、NeuMF[32]、IRGAN[71]和GraphGAN[70]等模型相比,CGAN在两个电影推荐数据集上的性能有了显著提高[28,39]。
Yuan等人。[91]为基于DNN的推荐模型提出了一个通用的对抗性训练框架ACAE。他们用一个协同的自动编码器来实现它,通过在不同的参数位置添加扰动来寻求精度和鲁棒性之间的平衡。ACAE的框架如图4所示。通过实验,他们发现加入扰动对原始模型有更显著的影响,其中加入扰动对解码器权重的影响要大于编码器。而对用户嵌入向量和隐藏层添加扰动的影响可以忽略不计。为了更好地控制扰动,他们[92]使用不同的系数来分别控制噪声项,以便从对抗训练中获得更多的好处。

3.2无信息样本与未观测项目的判别模型
推荐系统难以从海量的未观测数据中获取信息量大的数据。具体地说,当模型优化成对目标函数时,负抽样技术往往提供不具信息性的样本。因此,动态地提供信息丰富的阴性样本就显得尤为重要。第一个应用GANs来缓解这个问题是由Wang等人提出的IRGAN。[71]。它将生成式检索模型和判别式检索模型相结合,前者预测给定查询的相关文档,后者预测每个查询文档对的相关性。生成模型作为生成器,通过拟合项目之间的实际关联分布,为给定用户选择信息项。判别式检索模型作为判别器,区分相关项和选定项。然后鉴别器将结果反馈给生成器,以帮助生成器选择更多信息项。生成的项目将作为鉴别器的输入来误导它。IRGAN的损失函数是

式中i表示一个项目,u代表用户,r表示用户和项目之间的关系。
是用户Un与关系r的真实项目分布,
是生成数据的分布,指示用户和项目之间的关系

由于i的采样是离散的,因此可以通过基于策略梯度[79,90]的强化学习来优化,而不是vanilla GAN公式中使用的梯度下降。随后,ABinCF还采纳了IRGAN的快速推荐思想[69]。然而,IRGAN[71]从训练数据中选择离散样本,这导致了一些棘手的问题。IRGAN的生成器根据策略梯度计算的概率生成单独的项目ID或ID列表。在判别器的指导下,生成器可能会被同时标记为“真”和“假”的项混淆,从而导致模型的性能下降。
Fan等人。[23]提出了一种基于GAN的社会推荐模型DASO,该模型应用minimax博弈动态指导信息负采样过程。对于交互信息,生成器根据先验概率选择项目,并将用户项目对作为假样本输出,而判别器则识别每个交互对是否真实。

对于社会化信息,生成器用于选择最相关的朋友作为信息样本,并输出假用户朋友对,而鉴别器识别生成的用户朋友对和真实相关对。

这样,用户的表现就被社会信息和交互信息所考虑。与其他推荐模型[98,24,71]相比,作者发现DASO优于基于DNNs的社会推荐模型[98,24]。Cai等人。[7] 提出了GAN-HBNR用于引文推荐,利用GANs将异构书目网络结构和顶点内容信息整合到一个统一的框架中。它将自动编码器(DAE)[66]作为生成负样本的生成器,因为它比标准的自动编码器产生更好的表示。GAN-HBNR通过提取每个连续向量并与相应的内容向量连接作为输入,同时学习内容和结构的表示,以提高引文推荐的效率。
为了捕获和存储长期稳定兴趣和短期动态兴趣,提出了一种基于神经记忆网络的NMRN-GAN[72]流推荐算法。它还将GANs的思想引入到负抽样中。具体地说,作者提供了一个自适应噪声采样器来优化所提出的模型。生成器的重点是鼓励生成合理的样本来混淆鉴别器。鉴别器的目标是将真品从生成器生成的假货中分离出来。最佳超参数实验表明,在两个数据集[28,39]上,NMRN-GAN明显优于其他比较模型[80,57]。为了更清楚地展示上述车型的具体设计,我们展示了它们的具体设计,并分析了它们的优势,如表3所示。

4、基于GAN的数据稀疏推荐模型
除了数据噪声外,数据稀疏是遥感领域的另一个严重问题。在这一部分中,我们将重点介绍具有代表性的研究模型,以确定近年来最显著和最有希望的进展。根据GANs是如何缓解数据稀疏性的,我们将其分为两类,如表4所示:(1)通过增加交互信息生成用户偏好的模型;(2)通过增加辅助信息来合成用户偏好的模型。
4.1通过增加交互信息生成用户偏好的模型
有一些有效的方法启发了基于GAN的体系结构,以提高RS的效用,以增加缺失的交互信息和缓解数据稀疏性,包括CFGAN[10]、AugCF[73]和PLASTIC[99]等。

CFGAN[10]是第一个基于协同过滤模型(CF)生成用户购买向量而不是商品id的方法,它的灵感来自CGAN[49]。CFGAN的框架如图6所示。G的损失函数为:

其中,生成器的输入是用户u的购买向量Cu和随机噪声z的组合。利用多层神经网络生成低维用户偏好向量 ,判别器将生成的偏好向量与实际购买向量区分开来。其损失函数表示为:

其中,表示真实数据分布,是生成器生成的数据分布,表示元素的乘法,而eu是一个指示向量,说明u是否购买了项目i。为了更好地模拟用户的偏好,该模型使用eu作为掩蔽机制。
在Ciao[61]、Watcha[4]、Movielens[28]三个数据集上,CFGAN比其他最先进的模型(包括IRGAN[71]、GraphGAN[70]、CDAE[83])至少提高了2.8%。这是矢量对抗训练的一个新方向。此外,Chae等人。[9] 提出了一种基于GAN的评级增长模型RAGAN。它利用观测到的数据来学习初始参数,然后由发生器生成可信的数据。最后,利用增广后的数据对传统的CF模型进行训练。AugCF[73]也是一种基于GAN的CF模型,用于生成交互信息。它在不同的tauxiliary信息下为不同的推荐任务生成交互。不同的是,交互的类别也使用条件标签,而不是只使用用户的购买向量。具体来说,有两种训练阶段:(1)生成器在交互类别中为用户生成最喜欢的项。生成的元组(用户、项和交互类别)可以视为原始数据集的有效和实际样本。判别器只用于判断生成的数据元组是否为真。生成器和判别器竞争,直到达到平衡。(2) 生成器是固定的,仅用于生成数据。然后使用判别器来判断用户是否喜欢这些项目。AugCF的损失函数定义为公式16。判别器和生成器在类别标签c和用户u上竞争。为了在判别器模型的两个阶段中有不同的角色,AugCF将前两个关系类别(喜欢或不喜欢)扩展为四个类别:真的喜欢、真的不喜欢、假的喜欢和不喜欢。

式中,表示生成数据的分布,是真实数据的分布。他们的实验使用用户评论作为辅助信息来评估模型,结果表明,AugCF优于基线(Wide&Deep[16]和NFM[30])以及上述模型(DeepCoNN[100]、HFT[46]和NeuMF[32])。
此外,Sun等人。[60]提出了一个基于成对学习的通用GAN框架APL。基于用户偏好已消费物品的假设,APL通过对抗性成对学习将生成器和鉴别器相结合。在这个框架下,生成器尝试为每个用户生成近似真实分布的项。鉴别器主要学习两对项目之间的排序函数,并确定每个用户的偏好。也就是说,对于每对项i和j,鉴别器需要识别哪个项更符合用户的偏好。APL直接使用成对排序作为损失函数,而不是基于概率分布的函数,如公式17所示:

其中,是与GANs的损失函数不同的成对排序损失函数。如果直接设计判别损失函数,使观测项目与生成项目之间的排名得分差异最大化,则原目标函数可等效于WGAN[1],如式18所示:

该模型利用成对损失函数和GumbelSoftmax技术处理梯度消失问题[34]。大量的实验证明了它的有效性和稳定性。GAN也被应用于许多其他的推荐领域,以生成交互和缓解数据稀疏性。例如,将矩阵分解(MF)、递归神经网络(RNN)和遗传算法(GANs)相结合的序列推荐算法PLASTIC[99]。其框架如图9所示。

在对抗式训练过程中,生成器和CGAN[49]一样,以用户和时间为输入,直接预测用户的推荐列表。对于鉴别器,塑料通过暹罗网络集成长期和短期排序模型,以最大限度地提高正确区分真实样本和生成样本的概率。大量的实验表明它比其他模型有更好的性能[53,80,71]。在除了塑料,Yoo等人。[87]结合基于能量的GANs和sequence GANs来学习用户的顺序偏好,并预测下一个推荐项目。RecGAN结合递归推荐网络和GAN来学习用户和项目的时间特征[5]。在RecGAN中,生成器通过拟合项目的分布来预测用户的项目序列。鉴别器确定采样项是否来自用户真实偏好的分布。实验表明,在电影和食品推荐数据集上,它优于所有基线模型,包括PMF[58]、TimeSVD++[38]、RRN[80]和AutoRec[51]。周等。[101]建议APOIR学习用户在位置推荐中的潜在偏好。生成器使用策略梯度选择一组poi(兴趣点),并尝试匹配实际分布。然后,鉴别器将生成的poi与用户的真实浏览行为区分开来。此外,两个组件通过玩一个极小极大博弈来竞争。APOIR的损失函数是

式中,l+表示已访问的POI,而评估用户ui优先访问POI的概率。一旦生成器和鉴别器之间的对抗达到平衡,推荐者(生成器))将为用户推荐高质量的POI。
4.2基于辅助信息的用户偏好综合模型
除了增加交互信息以直接生成用户偏好外,一些研究试图使基于GAN的体系结构的生成器在增加辅助信息方面更适合[9,89,85,52,68]。
RSGAN[89]是为了增加更多可靠的朋友来缓解社交推荐中的稀疏问题。它主要由两部分组成:发生器和鉴别器。负责生成可靠的朋友以及这些朋友消费的物品。它首先构建一个异构网络,以更高的可靠性识别种子朋友。在为每个用户收集种子用户后,通过CDAE将其编码成二进制向量,作为用户不完全的社会偏好[83]。然后通过Gumbel Softmax[34]对高概率朋友的概率分布进行抽样。同样,该策略也用于模拟项目的抽样。另一方面,为了建立候选项目的排序,该模型采用了社会BPR[98]的思想,即。它对候选项进行排序,并为每个用户推荐一个项目列表。如果生成的好友消耗的物品没有帮助,则会惩罚它们,并将梯度返回到,以降低生成此类朋友的概率。RSGAN的损耗函数为

RSGAN的作者用三种模型进行了实验:传统的社会推荐模型[29,98],基于DNN的模型[32],以及其他基于GAN的模型[71,10]。实验结果表明在RSGAN的预测中,它的排名比其他人都好。可能的原因是RSGAN构建了一个动态框架来自适应地生成朋友关系来缓解数据稀疏问题。
KTGAN[85]通过引入外部信息来扩充数据,进一步缓解数据稀疏的问题。该模型主要包括两个阶段:(1)从各种辅助信息和交互信息中提取特征嵌入,构造用户和项目的初始表示;(2)将向量放入基于IRGAN的生成器和判别器中进行对抗性学习。鉴别器试图识别用户项对是生成的还是实的。KTGAN的损耗函数为

式中,估计用户un对项目m进行优先级排序的概率。参数r表示用户和项目的关系。实验结果表明,该算法具有较高的精度和归一化折扣累积增益(NDCG)[83,32,71,70]。特别是,如果生成器能够在训练开始时生成更精确的低维向量表示,则可以训练出一个更好的优化鉴别器,从而提高整个模型的性能。
Perera等人。[52]建议CnGAN学习不同域中非重叠用户从目标域到源域的映射编码。框架如图11所示。E是一种神经网络编码器,它将输入的局部分布转换为密集的潜在向量;生成器G使用目标编码作为输入,为非重叠用户生成源域的映射编码。此外,G使得生成的偏好域尽可能与真实源域一致,从而欺骗鉴别器。损失函数是

鉴别器D区分真实源域编码和生成的编码。特别地,不匹配的源域和目标域编码是G的输入。用户的实际目标域嵌入和源域嵌入之间的重叠是真实映射。形式上,鉴别器的损失函数是

是具有映射关系的匹配对,是没有映射关系的匹配对,是目标域的局部分布,是为给定目标域生成的匹配源域编码。CnGAN为缓解数据稀疏问题提供了一种新的思路,它首次尝试通过生成源域与目标域之间的映射关系,为非重叠用户生成缺失的源域偏好。
雷克瑟斯丹,由王等提出。[68],与CnGAN[52]相似。它还使用了一种对抗性的方法来将用户和项目的潜在表示从不同的域转移到目标域。在基于审查的建议中,Rafailidis等人。[55]使用GAN生成可能与用户偏好相关的评论。鉴别器专注于区分生成的评论和用户编写的评论。与生成用户相关评论类似,生成器还生成与项目相关的评论。该模型通过对抗性学习获取评论信息后,通过联合因子化评分信息来预测用户偏好。此外,为了在时尚推荐中综合出最符合用户喜好的图片,Kang等人。[36]提出了DVBPR,其中生成器被训练成生成看起来真实的适当图像,鉴别器尝试将生成的图像与真实图像区分开来。为了更好地显示上述模型在发生器和鉴别器设计上的区别,我们在表5中列出了它们的具体设计和各自的优点。

5未来的研究方向和开放性问题
虽然基于GaN的推荐模型的研究已经为缓解数据噪声和数据稀疏问题奠定了坚实的基础,但仍然存在几个开放性问题。在这一部分,我们将对它们进行分析,并勾勒出几个有前景的未来研究方向。
5.1对抗训练的地位
基于DNNs的推荐模型由于能够学习更多抽象的用户和项目的表示,并能掌握交互信息的非线性结构特征,因而在对抗训练中的地位成为研究的热点之一。然而,网络结构复杂,参数变化大。我们尝试用不同的系数来控制敌方噪声,以便对那些受敌方噪声影响较小的部位采用较大的噪声系数。如何选择一个合适的对抗训练阵地,已成为今后需要更深入、更广泛探索的重大挑战。
5.2推荐的多生成器和判别器模型
现有的基于GAN的推荐模型通常具有相对固定的网络结构和目的:生成器生成符合实际数据分布的数据,鉴别器识别生成的数据。然而,生成器和鉴别器可以设计成多个网络结构,从各个方面利用用户行为、交互信息或推荐反馈。例如,在[73]中的研究提供了一种新的思路,其中鉴别器不仅用于识别生成的数据,而且还用于预测交互类别,例如,喜欢或不喜欢。
5.3离散训练数据的模型参数优化稳定性问题
将离散训练数据的模型参数优化稳定性问题初步设计为图像域中的连续数据。然而,RS中的交互数据往往是离散的。梯度下降法是对模型参数进行优化的原始方法,但对梯度的更新具有挑战性。这导致模型参数在训练过程中无法收敛。虽然有几位研究者尝试基于策略梯度[79,90]和Gumbel Softmax[34]来训练模型,但基于GAN的推荐模型中参数优化的稳定性仍然是一个有待研究的问题。
5.4基于GAN的推荐模型解释
基于GAN的推荐模型中的生成器和鉴别器大多由属于黑盒模型的DNN构造。也就是说,我们只知道他们的投入和产出,我们很难理解其根本原理。现有的提高遥感可解释性的模型大多是在建议[77,59]之后给出解释,解释的内容往往与结果无关。如果在生成推荐列表的同时,使用GANs来解释推荐结果将是一种很好的方法。在这个框架中,鉴别器不仅判断生成的推荐是否准确,而且还判断生成的推荐是否正确。
5.6基于GAN的推荐模型的可扩展性研究
基于GAN的推荐模型的可伸缩性是推荐模型的关键,因为数据量的不断增加使得时间复杂度成为一个主要考虑因素。虽然随着GPU计算能力的不断提高,GAN已经应用到一些商业产品中,但基于GAN的推荐模型还需要在以下三个方面进行进一步的研究:(1)对非平稳和流式数据(如用户和项目之间的大量交互)进行增量学习;(2)精确计算高维张量和多媒体数据源;(3)模型复杂度和可伸缩性与参数指数增长的平衡。知识提炼[15]是一种方法,它可以利用从教师模型中吸收知识的较小的学生模型来管理这些领域。考虑到训练时间对实时应用至关重要,可伸缩性是另一个值得进一步研究的方向。

6结论
在本文中,我们回顾了最新的基于GAN的推荐模型,并证明了它们能够减少数据噪声问题的不利影响和缓解数据稀疏问题。我们从GANs的发展历史入手,阐明了GANs在RS中的可行性,为了解决数据噪声问题,我们从两个角度介绍了现有的模型:(1)用于消除恶意噪声的模型;(2)从未观察到的数据中发现无信息样本的模型。对于关注数据稀疏性问题的研究,我们将其分为两类:(1)通过增加交互信息来生成用户偏好的模型;(2)通过增加辅助信息来合成用户偏好的模型。

猜你喜欢

转载自blog.csdn.net/qq_38355878/article/details/108573473