Fundación Extracción de Información
El concepto de la cartografía de conocimiento, aplicación y construcción
¿Qué es el mapa del conocimiento
Por lo general, el mapeo de conocimientos en == "entidad (entidad)"La figura expresa en el nodo, con"Las relaciones (relaciones)" == mapa se expresa en el "borde"
de triple -> (Audi, Ashkenazi, marca)
mapa de conocimiento se hace principalmente por Google para la optimización de motor de búsqueda
¿Qué información se extrae
de los datos estructurados y semi-estructurados para ser procesados y definen la tabla de datos de extracción de envoltura complejo como manera.
datos de texto no estructurados para extraer automáticamente la información requerida por medio de técnicas de procesamiento de lenguaje natural. Este proceso se conoce comúnmente comoExtracción de información
La naturaleza de la comprensión del lenguaje natural
comprensión del lenguaje natural es esencialmente una predicción de la estructura.
Muchas de las tareas de comprensión del lenguaje natural, incluyendo, pero no limitado a la segmentación de palabras chino, etiquetado POS, reconocimiento de entidades, la resolución de la correferencia, el análisis sintáctico, etiquetado papel semántico, están en el texto detrás de la secuencia específica de predicción de estructura semántica.
La principal tarea de extracción de información
Llamado Reconocimiento de entidades (nombre de la entidad Reconocimiento)
extracción Relación (Relación de extracción)
entidad unificada (entidad de resolución)
resolución de la anáfora (correferencia Resolución)
Edificio mapa de conocimiento
Construir un sistema de mapa de conocimiento no es el foco del desarrollo de algoritmos y, de hecho, el más importante es entender el núcleo del negocio, así como diseñar sus propios patrones de conocimiento
de los problemas de negocio específicos 1. Definir
el teléfono y datos de procesamiento previo 2.
Mapa 3. Conocimiento diseñar
4. los datos de los mapas almacenados en el conocimiento de
desarrollo de la evaluación de la aplicación superior, y el sistema de
Construcción del mapa de conocimiento de la diabetes
Por los libros de texto relacionados con la diabetes, la diabetes hacen trabajos de investigación literatura minería y la construcción del mapa de conocimiento de la diabetes.
1. Sobre la base de las directrices clínicas de la diabetes entidad y trabajos de investigación marcados construcción de
entre 2 basado en las directrices clínicas y trabajos de investigación de la diabetes entidad de edificar
sistema entidad
relacionados con la enfermedad
1. Los nombres de las enfermedades (enfermedad)
2. etiología (Reasono)
3. manifestaciones clínicas (el síntoma)
método 4. inspección (la prueba)
5. El valor del índice de inspección (test_value)
relacionadas con el tratamiento
6. El nombre de la droga (Drug)
7. La frecuencia de administración (Frequency)
8. La dosis (la cantidad)
9. El método de administración (Método,)
10. El tratamiento no farmacológico (Tratamiento)
11. La operación (Operación)
12. Las reacciones adversas (SideEff)
entidades generales:
13 partes (anatomía)
14. Un grado (nivel)
15. Una duración (duración)
Sistema de relaciones
relacionados con la enfermedad
1. Método de comprobación -> enfermedad (Test_Disease)
2. Las manifestaciones clínicas -> enfermedad (Symptom_Disease)
3. Tratamiento no farmacológico -> enfermedad (Treatment_Disease)
4. Nombre de Drogas -> enfermedad (Drug_Disease)
5. El sitio -> enfermedad (Anatomy_Disease)
relacionada con las drogas
6. La frecuencia de administración -> Nombre del medicamento (Frequency_Drug)
7. La duración -> Nombre del medicamento (Duration_Drug)
8. La dosis -> Nombre del medicamento (Amount_Drug)
9. El procedimiento de administración -> Nombre del medicamento (Method_Drug)
10. Las reacciones adversas -> nombre del medicamento (SideEff_Drug)
palo de golf herramienta de anotación
Archivo de trabajo de marcado de software basada palo de golf, http: //brat.nlplab.org/. En donde archivo .txt que el documento original, la información de etiquetas de archivo .ANN denota entidades que comienzan con T, seguidos por el ID de entidad, un tipo de entidad, entidad y correspondiente a la posición de partida en el documento de la palabra. Si necesita ver resultados marcados palo de golf de software, es necesario agregar .conf.
web oficial del PALO DE GOLF