【CMU博士论文】神经序列建模与应用,Neural Sequential Modeling and Applications

点上方人工智能算法与Python大数据获取更多干货

在右上方 ··· 设为星标 ★,第一时间获取资源

仅做学术分享,如有侵权,联系删除

转载于 :专知

15327f6c02a3e406714236e49538071e.png

如何在各种设置中建模序列数据是跨许多领域的一个重要机器学习问题,包括对时间序列数据、自然语言文本和事件流的预测。不同领域的序列数据通常具有不同的特征。例如,自然语言文本可以看作是离散变量的序列,而传感器网络信号可以看作是连续向量空间中的多变量序列。为了在如此多的现实领域中开发成功的神经网络模型,我们需要根据数据和问题的性质定制体系结构和算法。本文针对顺序建模及其应用设计了新颖高效的神经网络解决方案。具体来说,这些贡献可以分为四个部分。

https://www.cs.cmu.edu/~glai1/

  • 第一部分主要关注多元序列数据中变量之间的相关性,如多个传感器的时间序列,提出了利用相关模式提高预测精度的新算法,即深度可分图卷积网络(DSGC)(第2章)[60]和分解递归神经网络(FRNN)(第3章)[63]。

  • 第二部分的重点是在时序数据依赖模式的时间建模中结合人类先验知识。具体地说,我们提出了一种新的方法,称为长短期时间序列网络(LSTNet)(第4章)[59],它被证明在不同的应用中特别有效地捕捉各种周期模式。

  • 第三部分重点讨论了变换器Transformers在序列分类任务中的有效算法。具体来说,通过识别常用Transformer架构中的计算冗余,并提出一种新的替代方案,即漏斗Transformers(第5章)[27],我们在计算和精度之间实现了更好的权衡。

  • 第四部分着重于建模/预测事件之间的时间关系,其中的主要挑战是有效地从稀疏标记的数据中学习。我们通过结合高级数据增强、半监督学习和引入人类先验知识来解决这一挑战(第6章)。因此,我们大大提高了这项任务的最先进性能。

26b35e6ea71f7b0e65f4e57c27a56022.png

f60217471ca2ea817153234427d94085.png

3269e714a1c7150a287e16c276b055d9.png

324010e4939fc91b831d048c28fa8368.png

81c372d757b3d93bede46210e9febd65.png

---------♥---------

声明:本内容来源网络,版权属于原作者

图片来源网络,不代表本公众号立场。如有侵权,联系删除

AI博士私人微信,还有少量空位

80fd557ba8a3171893c298f79dd55fb3.png

59dcd74f21ec872721b3b6e675888b33.gif

如何画出漂亮的深度学习模型图?

如何画出漂亮的神经网络图?

一文读懂深度学习中的各种卷积

点个在看支持一下吧b4ed56a7cfcc34b44935620c9e41bfcc.png5bffe32ccc37f56ebc0476969d4baa70.png

猜你喜欢

转载自blog.csdn.net/qq_15698613/article/details/121551438