攻击
supporting facts 的修改:字符调换,替换词(用空格embedding或近同义词,变形词等)
还有针对question的攻击。
梯度下降,在embediing上做攻击,如何decode是个问题。
防御
如果把大量对抗样本加到训练样本一起训练不够显示,作用不是很大,随时都可能会有新的对抗样本。
Tackling Adversarial Examples in QA via Answer Sentence Selection
这篇讲的是先筛选候选句,再进行推理回答。