fundação Extração de Informações
O conceito de mapeamento do conhecimento, aplicação e Construção
Qual é o mapa do conhecimento
Normalmente, o mapeamento do conhecimento em == "entidade (Entity)"FIG expressa no nó, com"As relações (relação)" == mapa é expresso na "borda"
triple -> (Audi, Ashkenazi, marca)
mapa do conhecimento é feita principalmente pela Google para search engine optimization
Qual a informação é extraída
dos dados estruturados e semi-estruturado de forma a ser processados e definir a tabela de dados a extracção invólucro complexo como forma.
dados de texto puro não estruturados para extrair automaticamente as informações necessárias por meio de técnicas de processamento de linguagem natural. Este processo é comumente referido comoExtração de informações
A natureza da compreensão de linguagem natural
Natural compreensão da linguagem é essencialmente uma previsão de estrutura.
Muitas tarefas de compreensão da linguagem natural, incluindo, mas não limitado a segmentação chinês palavra, POS tagging, reconhecimento de entidades mencionadas, resolução correferência, análise sintática, rotulagem papel semântico, estão no texto por trás da previsão de estrutura semântica seqüência específica.
A principal tarefa de extração de informações
Nomeado Entity Recognition (Nome Entity Recognition)
extracção relação (relação de Extracção)
Unified entidade (Entity resolução)
Resolução da anáfora (correferência resolução)
mapa de conhecimento edifício
Construir um sistema de mapa de conhecimento não é o foco do desenvolvimento de algoritmos e, de fato, o mais importante é entender o núcleo do negócio, bem como projetar seus próprios padrões de conhecimento
de problemas de negócios específicos 1. Definir
o telefone e os dados pré-processamento 2.
mapa 3. Conhecimento projetar
4. os dados de mapas armazenados no conhecimento
desenvolvimento avaliação da aplicação superior, e o sistema
Construção de mapa diabetes conhecimento
Por livros diabetes relacionada, trabalhos de pesquisa fazem diabetes literatura de mineração e construção de mapa diabetes conhecimento.
1. Com base nos diabetes entidade diretrizes clínicas e trabalhos de pesquisa marcados construir
entre 2 com base em diretrizes clínicas e pesquisas diabetes entidade de edificar
sistema de entidade
Doenças relacionadas com o
1. Os nomes de doenças (Doença)
2. etiologia (Reasono)
3. manifestações clínicas (o Sintoma)
4. Método de inspecção (o teste)
5. O valor de índice de controlo (test_value)
Tratamento relacionado com o
6. O nome da droga (droga)
7. A frequência de administração (Frequência)
8. A dose (quantidade)
9. O método de administração (Método,)
10. O tratamento não medicamentoso (tratamento)
11. A operação (operação)
12. As reacções adversas (SideEff)
entidades gerais:
13 partes (anatomia)
14. Um grau (Nível)
15. A duração (duração)
sistema de relações
Doenças relacionadas com o
1. Verifique Método -> doença (Test_Disease)
2. As manifestações clínicas -> doença (Symptom_Disease)
tratamento 3. Non-droga -> doença (Treatment_Disease)
4. Nome do medicamento -> doença (Drug_Disease)
5. O site -> doença (Anatomy_Disease)
relacionadas com o fármaco
6. A frequência de administração -> Nome da droga (Frequency_Drug)
7. A duração -> Nome da droga (Duration_Drug)
8. A dosagem -> Nome da droga (Amount_Drug)
9. O método de administração -> Nome da droga (Method_Drug)
10. As reacções adversas -> nome do medicamento (SideEff_Drug)
pirralho ferramenta de anotação
software de arquivos de trabalho marcação pirralho base, http: //brat.nlplab.org/. Qual arquivo .txt como o documento original, etiquetas de arquivo .ann informações denotado entidades começando com T, seguido pelo ID entidade, um tipo de entidade, entidade e que corresponde à posição inicial no documento do Word. Se você precisa ver resultados marcados pirralho software, você precisa adicionar .conf arquivo.
site oficial BRAT