实体识别:序列标注规则

版权声明:凡由本人原创,如有转载请注明出处https://me.csdn.net/qq_41424519,谢谢合作 https://blog.csdn.net/qq_41424519/article/details/82021620

标签说明

标签方案中通常都使用一些简短的英文字符[串]来编码。

标签是打在token上的。

对于英文,token可以是一个单词(e.g. awesome),也可以是一个字符(e.g. a)。

对于中文,token可以是一个词语(分词后的结果),也可以是单个汉字字符。

为便于说明,以下都将token试作等同于字符。

标签列表如下:

  • B,即Begin,表示开始:
  • I,即Intermediate,表示中间
  • E,即End,表示结尾
  • 习近平:B-PER   I-PER   E-PER ;
  • 天安门:B-LOC   I-PER    E-PER  ;
  • 国务院:B-ORG   I-ORG   E-ORG
  • S,即Single,表示单个字符
  • O,即Other,表示其他,用于标记无关字符

猜你喜欢

转载自blog.csdn.net/qq_41424519/article/details/82021620