Notas de estudio de introducción al gráfico de conocimiento (4) -Problemas y métodos de extracción de conocimiento

Tabla de contenido

Extracción de conocimientos básicos: problemas y métodos

1 análisis de problemas

1.1 Fuente de datos de la escena para la extracción de conocimientos

1.2 De la extracción de información a la extracción de conocimiento

1.3 Ejemplos de extracción de conocimientos

1.4 El desafío de la extracción de conocimiento

2 Escenarios y métodos de extracción de conocimiento

2.1 Extracción de conocimiento de datos estructurados

2.1.1 Extraer conocimiento de bases de datos relacionales

2.2 Extracción de conocimiento para datos semiestructurados

2.2.1 conjunto de datos básicos de datos vinculados

2.2.2 Extracción de conocimientos de la enciclopedia YAGO

2.2.3 ZhiShi, yo

2.3 Extracción de conocimiento para datos no estructurados

2.3.1 Reconocimiento de entidades

2.3.2 Extracción de relaciones

2.3.3 Extracción de eventos:


Extracción de conocimientos básicos: problemas y métodos

1 análisis de problemas

1.1 Fuente de datos de la escena para la extracción de conocimientos

  • Datos de texto (semi) estructurado: Inforbox en conocimiento de enciclopedia, tablas estandarizadas, bases de datos, redes sociales, etc.

  • Datos de texto no estructurados: páginas web, noticias, redes sociales, periódicos, etc.

  • Datos multimedia: imágenes, videos

1.2 De la extracción de información a la extracción de conocimiento

  • IE (extracción de información): no estructurado en estructura para extracción
  • KE (extracción de conocimientos): extraído en el almacenamiento de datos que se pueden inferir fácilmente

Diferencia: la extracción de información obtiene datos estructurados y la extracción de conocimiento obtiene conocimiento (representación del conocimiento) que puede ser entendido y procesado por máquinas .
Relaciones: la extracción de conocimiento se basa en la extracción de información. Las tecnologías de procesamiento del lenguaje natural, las envolturas basadas en reglas y
el aprendizaje automático se utilizan comúnmente .

1.3 Ejemplos de extracción de conocimiento

1.4 El desafío de la extracción de conocimiento

1.4.1 Conocimientos poco claros:

Falta de conocimiento

  • La relación es de hecho

  • Faltan etiquetas / atributos

  • Entidad faltante

Inconsistencia del conocimiento

 

2 Escenarios y métodos de extracción de conocimiento

2.1 Extracción de conocimiento de datos estructurados

2.1.1 Extraer conocimiento de bases de datos relacionales

Principio de extracción

  • Clase de mesa
  • Propiedad de columna
  • Recurso de fila / instancia
  • Valor de propiedad de celda)
  • Clave externa: referencia

Extraer conocimiento de bases de datos relacionales

Criterios de extracción:

  • Mapeo directo 

  • R2RML

Herramienta de extracción

  • D2R, Vrituoso, Orcle SW, Morph 等
  • Lenguaje de mapeo R2RML

Entrada: tabla de base de datos, vista,
salida de consulta SQL . Triplete

Ejemplos:

Dos tablas de bases de datos relacionales "Empleado" y "Departamento"

El RDF asignado a la tabla de la base de datos

paso;

  • 1 clase de extracción
  • 2 Extraer atributos
  • 3. Extraer ejemplos
  • 4. Establecer relaciones entre clases

2.2 Extracción de conocimiento para datos semiestructurados

Gráfico de conocimiento de Wikipedia multilingüe a gran escala, una versión estructurada de Wikipedia

2.2.1 conjunto de datos básicos de datos vinculados

Cubre 127 idiomas, 28 millones de entidades, cientos de millones de triples y admite la descarga completa de conjuntos de datos. Patrones fijos para extraer información de la entidad, incluido el resumen, el cuadro de información, la categoría, el enlace de la página, etc.
Como la extracción de conocimientos de enciclopedia

 

2.2.2 Extracción de conocimientos de la enciclopedia YAGO

caracteristicas:

  • YAGO integra WikiPedia y WordNet
  • Cubriendo varios idiomas, 10 millones de entidades, 120 millones de triples
  • Integre GeoNames en YAGO2 y agregue soporte para información espacio-temporal
  • Extraer e inferir información de la entidad mediante reglas

Extracción de conocimientos de la enciclopedia de YAGO

2.2.3 ZhiShi, yo

2.3 Extracción de conocimiento para datos no estructurados

2.3.1 Reconocimiento de entidades

Extrae información atómica del texto

  • Nombre de la persona

  • organización
  • Ubicación
  • Hora Fecha
  • personaje
  • Cantidad

2.3.2 Extracción de relaciones

La extracción de relaciones se refiere a la relación semántica entre entidades.

2.3.3 Extracción de eventos:

Ejemplo de extracción de eventos

Supongo que te gusta

Origin blog.csdn.net/qq_37457202/article/details/108473028
Recomendado
Clasificación