Brat 标注工具 配置文件 详细说明

1.标注类型配置 annotation.conf: annotation type configuration

# -*- Mode: Text; tab-width: 8; indent-tabs-mode: nil; coding: utf-8; -*-

# 实体类型
[entities]
# 每⾏⼀个实体类型
Entities_name_1
Entities_name_2
Entities_name_3
Entities_name_4

# 关系 
[relations]
# 第一种,关系配置类型:关系名称 关系的属性1, 关系的属性2 “|”分隔符列出所有可能的类型  
Part-of Arg1:Entities_name_1, Arg2:Entities_name_3
Member-of Arg1:Entities_name_1, Arg2:Entities_name_2|Entities_name_3
# 第二种,等价关系配置类型:关系名称 关系的属性1, 关系的属性2, <等价关系类型>:关系的symmetric(对称)、transitive(传递)属性(可单独或同时)
# Equiv等价关系名  “symmetric-transitive”等价关系 
Equiv Arg1:Entities_name_1, Arg2:Entities_name_1, <REL-TYPE>:symmetric
Equiv Arg1:Entities_name_2, Arg2:Entities_name_2, <REL-TYPE>:transitive
Equiv Arg1:Entities_name_4, Arg2:Entities_name_4, <REL-TYPE>:symmetric-transitive
# 第三种,实体重叠关系配置类型:关系名称 关系的属性1, 关系的属性2, <实体重叠类型>:关系的contain(Entities_name_1实体范围可包含(完全)Entities_name_2实体范围)、equal(Entities_name_1、Entities_name_2实体的跨度可以相等)、cross(Entities_name_1、Entities_name_2实体的跨度可以相交)
<OVERLAP>   Arg1:Entities_name_1, Arg2:Entities_name_2, <OVL-TYPE>:contain
# 禁用重叠检查
# <OVERLAP>   Arg1:<ENTITY>, Arg2:<ENTITY>, <OVL-TYPE>:<ANY>


# 事件
[events]
# 事件名称 参数名称:参数类型
Gene_expression Theme:Entities_name_1
Binding Theme+:Entities_name_1
# 事件名称 参数名称:事件|实体, 原因?:<事件>|实体:
# Positive_regulation Theme:<EVENT>|Entities_name_1, Cause?:<EVENT>|Entities_name_1
# Negative_regulation Theme:<EVENT>|Entities_name_1, Cause?:<EVENT>|Entities_name_2
Events_name|GO:0006482	Theme:Entities_name_1, Site?:Entity, Sidechain?:Entities_name_2


# 属性定义
[attributes]
# 名称 参数:<ENTITY([entities]中的任何实体)、RELATION([relations]中的任何实体)、EVENT([events]中的任何实体)、ANY(任何实体)> , 值:
Attributes_name_1 Arg:<ENTITY>
Attributes_name_2 Arg:<EVENT>, Value:Possible|Likely|Certain

2.标注显示配置 visual.conf:

# 定义文本标注的视觉设置
[labels]
[drawing]
# 实体 设置类型:颜色
# 设置标注标签文字颜色类型 fgColor:任何HTML颜色规范,。
# 设置标注标签背景颜色类型bgColor:任何HTML颜色规范,。
# 设置标注标签边框颜色类型 borderColor:任何HTML颜色规范,。支持指定“ darken”设置阴影。
# 设置弧线类型 color:任何HTML颜色规范,设置弧线的颜色。
# 设置线条类型 dashArray:设置为虚线。
Entities_name_1 fgColor:black, bgColor:lightgreen, borderColor:darken
Entities_name_2 color:black, dashArray:-

[labels]

3.注解工具配置 tools.conf: annotation tool configuration

# 工具选项
[options] 
[search] 
[normalization] 
[annotators] 
[disambiguators] 
These sections are all optional: an empty file is a vali 
Option configuration ([options] section) 

# ⽤来配置服务端如何处理分词、分局、验证、⽇志等
[options] : 
# Tokens tokenizer:VALUE,其中的 VALUE:
# whitespace: 按源文本中的空格字符分割(唯一)
# ptblike: 模拟Penn Treebank标记化
# mecab: 使用MeCab执行日语标记化
# Sentences splitter:VALUE, 其中的VALUE:
# regex: 基于正则表达式的句子拆分
# newline: 由源文本中的换行符分隔(唯一)
# Validation validate:VALUE, 其中的VALUE:
# all: 执行完整验证
# none: 不执行任何验证
# Annotation-log logfile:VALUE, 其中的VALUE:
# <NONE>: 无注释记录 
# NAME: 加载至文件路径名 (例如. "/home/brat/work/annotation.log")

Tokens  tokenizer:whitespace
Sentences   splitter:regex
Validation  validate:all
Annotation-log  logfile:/home/brat/work/annotation.log

[normalization]
# BRAT使用SimString进行近似字符串匹配,配置normalization前需安装SimString,参照主页说明(http://chokkan.org/software/simstring/)
# 数据库名称 DB:DBPATH, <设置normalization资源的主页>:HOMEURL, <设置URL模板>:ENTRYURL
# DBNAME:数据库名称,字符只能包含 大小写字母、数字、“-”、“_”
# DBPATH:可选项。相对于brat服务根目录的服务器上DB数据的文件系统路径。如果DBPATH未设置,则系统假定可以在给定的默认位置找到数据库DBNAME。
# HOMEURL:用于标识资源DBNAME和在UI中提供链接以访问资源。
# URLBASE:可选项。设置URL模板,“%s”作为占位符可直接生成资源中改条目的链接。需要

Normalization_name_1 DB:dbs/wiki, <URL>:http://en.wikipedia.org, <URLBASE>: http://en.wikipedia.org/?curid=%s

Normalization_name_2<URL>:http://www.uniprot.org/, <URLBASE>:http://www.uniprot.org/uniprot/%s

[search]
# 设置标注对话框中可用的搜索服务
Google  <URL>:http://www.google.com/search?q=%s
Wikipedia   <URL>:http://en.wikipedia.org/wiki/%s

[annotators]
# 设置可从BRAT调用的自动标注服务
SNER-CoNLL  tool:Stanford_NER, model:CoNLL, <URL>:http://example.com:80/tagger/

[disambiguators]     
# 设置可从BRAT调用的自动语义类别(标注类别)消歧服务
simsem-MUC  tool:simsem, model:MUC, <URL>:http://example.com:80/simsem/%s

4.注解工具配置 kb_shortcuts.conf:

# 键盘快捷工具配置
#  键 标注类型
1 Entities_name_1
2 Entities_name_2
a Entities_name_3
q Entities_name_4

提示

若是实现brat各实体,重复重叠标注,虽可正常标注,但仍出现报错提醒。
可在关系属性中添加一个<OVERLAP> Arg1:<ENTITY>, Arg2:<ENTITY>, <OVL-TYPE>:<ANY>

禁用重叠检查即可。

猜你喜欢

转载自blog.csdn.net/Fuziqp/article/details/129530894