QA 中的对抗攻击和防御

攻击

supporting facts 的修改:字符调换,替换词(用空格embedding或近同义词,变形词等)

还有针对question的攻击。

梯度下降,在embediing上做攻击,如何decode是个问题。

防御

如果把大量对抗样本加到训练样本一起训练不够显示,作用不是很大,随时都可能会有新的对抗样本。

Tackling Adversarial Examples in QA via Answer Sentence Selection
这篇讲的是先筛选候选句,再进行推理回答。

猜你喜欢

转载自www.cnblogs.com/shona/p/11545183.html
QA