版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Zoe_Su/article/details/84566409
Exercise-Enhanced SequentialModeling for Student Performance Prediction
智能教育系统中,如何有效预测学生表现是非常重要的,也是进行个性化推荐,学习路径规划的基础,常用的预测方式依赖于专家将学习材料进行的知识成分的标注,如题目对应的知识点等,并没有考虑题面信息。而相同的知识点的题目难度,区分度或其他技能要求都是有所不同的,所以作者考虑将体面信息进行利用,提出了Exercise-Enhanced Recurrent Neural Network (EERNN) 进行学生表现预测。
模型
模型主要包括三部分:1.使用bi-LSTM对题面信息进行表征编码;2.使用另外的LSTM结构进行知识追踪的学习;3.对于最终的预测,将EERNN进行拓展,一是加入马尔可夫性,二是采用了attention机制。
模型优点:
作者所提出的模型优点在于:
- 模型输入不仅利用了学生做题序列,也将题目信息加入其中。
- 模型由于加入attention机制,更加聚焦于当时的效果而不是长期依赖的影响。
- 模型解决了冷启动问题,即对于新来的学生或题目,都可以进行预测。
算法过程:
S表示学生集合,
E表示练习集合,第i个学生的做题过程表示为:
si={(e1i,r1i),(e2i,r2i),…,(eTi,rTi)},其中
eji表示学生i做过的第j个练习,
rji表示对应得分(0或1)。每个练习题是由多个词组成的,对应表示为:
ei={w1i,w2i,…,wMi}。模型要解决的任务是根据学生做题序列和对应的题目信息,预测在下个题目上的得分情况:
r~T+1=P(rT+1=1∣(e1,r1),(e2,r2),…,(eT,rT),eT+1)
上图为模型架构图,
ei表示第i步对应的练习题,
xi是对应题目编码后的向量,
ri为对应答题结果,
x~i为送入模型的输入,具体公式如下:
x~t={[xi,oi][oi,xi]ififri=1ri=0
其中
oi是把
ri扩展为
xi相同维度后的向量。
EERNN模型的马尔可夫特性体现在,T+1时刻输出只与T时刻状态有关,具体如下公式所示:
yT+1=ReLU(W1⋅[hT⊕xT+1]+b1)
r
T+1=σ(W2⋅yT+1+b2)
模型引入注意力机制后,其核心在于使用了题目信息的相似性作为attention的score,具体公式如下:
hatt=∑j=1Tαjhj,αj=cos(xT+1,xj)
模型采用的损失同样为交叉熵损失,公式如下:
L=−∑t=1T(rtlogr
t+(1−rt)log(1−r
t))
结论
文章所提出模型和DKT模型的核心区别在于,1. 在输入中使用了题目信息,2.使用题目编码后的向量做cosine相似性计算,作为注意力机制的score应用与模型。