论文全名:Learning to Solve Arithmetic Word Problems with Verb Categorization
模型简称:ARIS
任务:math word problem
论文链接:https://aclanthology.org/D14-1058/
官方项目网站:https://www.cs.washington.edu/nlp/arithmetic(数据集下载地址失效了,看了一下代码是用Java写的……我退缩)
本文是2014年EMNLP论文,是第一个不用预定义模版来解决MWP问题(仅考虑加减场景)的工作。
识别问题状态中的变量和数值,映射到公式中。通过识别7种动词,来分析数学题类型。
(每个动词都识别一下)
简单来说就是识别每个数字对应是加还是减,然后放进公式……
具体细节还挺复杂的,是那种老文章,所以方法我其实没太看懂。以下我能看懂啥就简单介绍啥了。
1. MWP任务介绍
问题首先描述一个状态,然后介绍在状态上的改变,最后提出一个量化问题。
问题中有些信息是无用的。
2. ARIS
预测句子中的动词种类,将问题ground到全局状态转变(由动词种类建模得)。
整个问题被分成很多fragments/句子,每个fragment代表一种状态的转变。
将每个句子表征concat起来,生成公式。
动词种类:
- Observation:初始化
- Positive:加
- Negative:减
有2个container句子的种类:
- Positive transfer
- Negative transfer
- Construct:都涨
- Destroy:都降
全局状态: < E , C , R > <E,C,R> <E,C,R>
实体:数字被关注的那个对象
container(大概类似“实例”的概念,持有属性的对象,如有9只小猫的莉齐)
关系(实体、container、属性(黑色、walnut)、数量(可以是数字、变量、表达式)之间的关系)
(我觉得这种描述方式是很奇怪的,我怀疑是之前的工作有这方面的详细介绍,跟现在的不同)
h h h:名词种类集合
每个数字关联一个实体
然后反正这部分没咋看懂,大致来说就是用规律和语法解析树硬把结构给抠出来。用SVM训练模型。
根据动词来选择公式符号,这种感觉?
3. 实验
3.1 数据集
3.2 指标
准确率(经3折交叉验证的)
3.3 主实验结果
ARIS 2 _2 2
Majority是把所有数字都直接加起来
Gold ARIS是直接用真实句子分类