Projeto de Aprendizagem máquina (dois) auxiliar extração de informações de inteligência artificial (a)

fundação Extração de Informações

O conceito de mapeamento do conhecimento, aplicação e Construção

Qual é o mapa do conhecimento

Normalmente, o mapeamento do conhecimento em == "entidade (Entity)"FIG expressa no nó, com"As relações (relação)" == mapa é expresso na "borda"
triple -> (Audi, Ashkenazi, marca)
Aqui Insert Picture Descrição
mapa do conhecimento é feita principalmente pela Google para search engine optimization

Qual a informação é extraída
dos dados estruturados e semi-estruturado de forma a ser processados e definir a tabela de dados a extracção invólucro complexo como forma.
dados de texto puro não estruturados para extrair automaticamente as informações necessárias por meio de técnicas de processamento de linguagem natural. Este processo é comumente referido comoExtração de informações
Aqui Insert Picture Descrição

A natureza da compreensão de linguagem natural

Natural compreensão da linguagem é essencialmente uma previsão de estrutura.

Muitas tarefas de compreensão da linguagem natural, incluindo, mas não limitado a segmentação chinês palavra, POS tagging, reconhecimento de entidades mencionadas, resolução correferência, análise sintática, rotulagem papel semântico, estão no texto por trás da previsão de estrutura semântica seqüência específica.
A principal tarefa de extração de informações
Nomeado Entity Recognition (Nome Entity Recognition)
extracção relação (relação de Extracção)
Unified entidade (Entity resolução)
Resolução da anáfora (correferência resolução)

mapa de conhecimento edifício

Construir um sistema de mapa de conhecimento não é o foco do desenvolvimento de algoritmos e, de fato, o mais importante é entender o núcleo do negócio, bem como projetar seus próprios padrões de conhecimento
de problemas de negócios específicos 1. Definir
o telefone e os dados pré-processamento 2.
mapa 3. Conhecimento projetar
4. os dados de mapas armazenados no conhecimento
desenvolvimento avaliação da aplicação superior, e o sistema

Construção de mapa diabetes conhecimento

Por livros diabetes relacionada, trabalhos de pesquisa fazem diabetes literatura de mineração e construção de mapa diabetes conhecimento.
1. Com base nos diabetes entidade diretrizes clínicas e trabalhos de pesquisa marcados construir
entre 2 com base em diretrizes clínicas e pesquisas diabetes entidade de edificar

sistema de entidade

Doenças relacionadas com o

1. Os nomes de doenças (Doença)
2. etiologia (Reasono)
3. manifestações clínicas (o Sintoma)
4. Método de inspecção (o teste)
5. O valor de índice de controlo (test_value)

Tratamento relacionado com o

6. O nome da droga (droga)
7. A frequência de administração (Frequência)
8. A dose (quantidade)
9. O método de administração (Método,)
10. O tratamento não medicamentoso (tratamento)
11. A operação (operação)
12. As reacções adversas (SideEff)

entidades gerais:

13 partes (anatomia)
14. Um grau (Nível)
15. A duração (duração)

sistema de relações

Doenças relacionadas com o

1. Verifique Método -> doença (Test_Disease)
2. As manifestações clínicas -> doença (Symptom_Disease)
tratamento 3. Non-droga -> doença (Treatment_Disease)
4. Nome do medicamento -> doença (Drug_Disease)
5. O site -> doença (Anatomy_Disease)

relacionadas com o fármaco

6. A frequência de administração -> Nome da droga (Frequency_Drug)
7. A duração -> Nome da droga (Duration_Drug)
8. A dosagem -> Nome da droga (Amount_Drug)
9. O método de administração -> Nome da droga (Method_Drug)
10. As reacções adversas -> nome do medicamento (SideEff_Drug)

pirralho ferramenta de anotação

software de arquivos de trabalho marcação pirralho base, http: //brat.nlplab.org/. Qual arquivo .txt como o documento original, etiquetas de arquivo .ann informações denotado entidades começando com T, seguido pelo ID entidade, um tipo de entidade, entidade e que corresponde à posição inicial no documento do Word. Se você precisa ver resultados marcados pirralho software, você precisa adicionar .conf arquivo.
site oficial BRAT

Publicado 46 artigos originais · ganhou elogios 1 · vista 853

Acho que você gosta

Origin blog.csdn.net/qq_33357094/article/details/104754121
Recomendado
Clasificación