Notas de autoaprendizaje del estudio de conceptos

Notas de autoaprendizaje del estudio de conceptos

Aprendizaje de conceptos:

La comprensión de los siguientes puntos nos ayudará a comprender mejor el concepto de aprendizaje.

  • La relación de orden parcial en matemáticas discretas es la clave para una mejor comprensión del algoritmo FIND_S y el algoritmo de eliminación de candidatos.

  • Comprender desde la perspectiva de los problemas de búsqueda

  • El aprendizaje de conceptos tiene un rendimiento deficiente cuando el conjunto de entrenamiento contiene datos ruidosos

Terminología y representación simbólica

  • Concepto de destino c: es una función booleana h: X → {0,1}

  • Valor del concepto objetivo: c (x)

  • Ejemplo positivo: c (x) = 1

  • Ejemplo de contador: c (x) = 0

  • Ejemplo de entrenamiento: <x, c (x)>

  • Recogida de muestras de formación: D

  • Todas las hipótesis posibles: H

  • Hipótesis única: h, es una función booleana h: X → {0, 1}

Find-S: Encuentra la hipótesis especial extrema

Nuestra hipótesis aquí es conjuntiva

Breve descripción : comience con la hipótesis más específica en H y generalícela cuando la hipótesis no cubra el ejemplo positivo.

La hipótesis más específica:<Ø,Ø,Ø,Ø,Ø,Ø>

Descripción del algoritmo (proceso de formación)

For each positive training instance x
For each attribute constraint ai ∈ h
If        the constraint ai ∈ h is satisfied by x
then    do nothing
else     replace ai ∈ h by the next more general constraint 
               that is satisfied by x
Output hypothesis 

Partiendo de la hipótesis más específica, Find-S garantiza que la salida es la hipótesis más específica consistente con el ejemplo positivo en H

Algoritmo de eliminación de candidatos

  • La salida del algoritmo de eliminación de candidatos es un conjunto de todas las hipótesis coherentes con el ejemplo de entrenamiento, y Find-S es solo una de ellas.
  • Debido a la relación de ordenamiento parcial, el algoritmo de eliminación de candidatos no necesita enumerar explícitamente todos sus miembros al describir el conjunto de entrenamiento.
  • Pero al igual que Find-S, el rendimiento es deficiente cuando hay datos ruidosos.

Espacio variante

  • Límite general G

  • Límite especial S

    初始化:G <- {<?,?,?,?,?,?>}
           S <- {<,,,,,>}
    遍历训练集 d = < x, c (x) >
    If d 是个正例
    	对G:移出G中与d不一致(即假设得到的概念与样本真实概念取值不符)的所有假设
    	对S:移出S中与d不一致的所有假设;如果一个假设h与d一致且G中有比h更一般的假设,那么将该假设加入S
    If d 是个负例
    	对S:移出S中与d不一致(即假设得到的概念与样本真实概念取值不符)的所有假设
    	对G:移出G中与d不一致的所有假设;如果一个假设h与d一致且S中有比h更具体的假设,那么将该假设加入
    

Algunas explicaciones y explicaciones

¿Qué pasa si los datos de entrenamiento contienen errores?

  • Eliminará el concepto de objetivo correcto
  • Datos de entrenamiento suficientes, los límites S y G convergen en un espacio de variante vacío

Aprendiz imparcial

Para asegurar que el concepto objetivo esté en el espacio de hipótesis, necesitamos un espacio de hipótesis que pueda expresar todos los conceptos enseñables . En otras palabras, puede expresar todos los posibles subconjuntos del conjunto de instancias X. Y llamamos al conjunto de todos los subconjuntos del conjunto X el conjunto de potencia de X (Conjunto de potencia)

  • Esta es una hipótesis no solo conjuntiva, y no hay que preocuparse por no poder expresar el concepto objetivo. Sin embargo, el algoritmo de aprendizaje de conceptos no se generalizará en absoluto a partir de los ejemplos de entrenamiento. ! !
  • S se convierte en la disyunción del ejemplo positivo y G se convierte en la negación de la disyunción del ejemplo negativo.

Inutilidad del aprendizaje imparcial

  • Con la introducción anterior, no es difícil comprender la inutilidad del aprendizaje imparcial.

  • Pero también ilustra una propiedad básica del razonamiento inductivo : si el alumno no hace una presunción previa sobre la forma del concepto objetivo, no puede clasificar ejemplos invisibles en absoluto.

  • Dado que el aprendizaje inductivo requiere una cierta forma de presuposición, también llamada inducción de sesgos , podemos utilizar la inducción de sesgos para describir las características de los diferentes métodos de aprendizaje.

Supongo que te gusta

Origin blog.csdn.net/qq_45175218/article/details/104032605
Recomendado
Clasificación