对话系统语料

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/m0_37490039/article/details/79745216

机器学习尤其是深度学习在训练的时候需要大量的预料,下面介绍一个可以扩展预料的方法。

举个例子,对机器说一句:我想听有声读物。

这样类似的说法有很对,如:播放有声读物,帮我打开一下有声读物,请打开下有声读物。。。。


[我想|帮我|请](播[放]|打开)[一下|下]{app_name.有声读物|抖音}

我们用这样一个模块可以展开成下面72个意思相近的句子:

我想播一下[有声读物].(app_name)
我想播一下[抖音].(app_name)
我想播下[有声读物].(app_name)
我想播下[抖音].(app_name)
我想播放一下[有声读物].(app_name)
我想播放一下[抖音].(app_name)
我想播放下[有声读物].(app_name)
我想播放下[抖音].(app_name)
我想打开一下[有声读物].(app_name)
我想打开一下[抖音].(app_name)
我想打开下[有声读物].(app_name)
我想打开下[抖音].(app_name)
帮我播一下[有声读物].(app_name)
帮我播一下[抖音].(app_name)
帮我播下[有声读物].(app_name)
帮我播下[抖音].(app_name)
帮我播放一下[有声读物].(app_name)
帮我播放一下[抖音].(app_name)
帮我播放下[有声读物].(app_name)
帮我播放下[抖音].(app_name)
帮我打开一下[有声读物].(app_name)
帮我打开一下[抖音].(app_name)
帮我打开下[有声读物].(app_name)
帮我打开下[抖音].(app_name)
请播一下[有声读物].(app_name)
请播一下[抖音].(app_name)
请播下[有声读物].(app_name)
请播下[抖音].(app_name)
请播放一下[有声读物].(app_name)
请播放一下[抖音].(app_name)
请播放下[有声读物].(app_name)
请播放下[抖音].(app_name)
请打开一下[有声读物].(app_name)
请打开一下[抖音].(app_name)
请打开下[有声读物].(app_name)
请打开下[抖音].(app_name)
播一下[有声读物].(app_name)
播一下[抖音].(app_name)
播下[有声读物].(app_name)
播下[抖音].(app_name)
播放一下[有声读物].(app_name)
播放一下[抖音].(app_name)
播放下[有声读物].(app_name)
播放下[抖音].(app_name)
打开一下[有声读物].(app_name)
打开一下[抖音].(app_name)
打开下[有声读物].(app_name)
打开下[抖音].(app_name)
我想播[有声读物].(app_name)
我想播[抖音].(app_name)
我想播放[有声读物].(app_name)
我想播放[抖音].(app_name)
我想打开[有声读物].(app_name)
我想打开[抖音].(app_name)
帮我播[有声读物].(app_name)
帮我播[抖音].(app_name)
帮我播放[有声读物].(app_name)
帮我播放[抖音].(app_name)
帮我打开[有声读物].(app_name)
帮我打开[抖音].(app_name)
请播[有声读物].(app_name)
请播[抖音].(app_name)
请播放[有声读物].(app_name)
请播放[抖音].(app_name)
请打开[有声读物].(app_name)
请打开[抖音].(app_name)
播[有声读物].(app_name)
播[抖音].(app_name)
播放[有声读物].(app_name)
播放[抖音].(app_name)
打开[有声读物].(app_name)
打开[抖音].(app_name)

模版的规则是:

1.在"[]"里的内容是可有可无。

2.在"()"里的内容一定要有的

3."|"代表或的关系

4."{}"里面分别表示slot-key,slot-value

例如,[我想|帮我|请],展开后为“我想”或“帮我”或“请”或“none”(规则1,3)

(播[放]|打开),展开后为”播放“或“播”或“打开”(规则1,2,3)

{app_name.有声读物|抖音},展开后为“[有声读物].(app_name)或[抖音].(app_name)”,app_name表示slot-key,有声读物表示slot-value(规则3,4)

注意展开后的括号只是为了界定slot-key和slot-value的

最好把它们组合成一起。

代码实现戳这里




猜你喜欢

转载自blog.csdn.net/m0_37490039/article/details/79745216
今日推荐