"Aprendizaje automático": sobre el espacio de hipótesis y el espacio de versiones

En el primer capítulo, la introducción arroja un montón de conceptos, y al ver que el espacio hipotético y el espacio muestral son un poco confusos, solo lo sé después de verificar cierta información y registrarlo.

1. Conceptos básicos

    Espacio de hipótesis: el espacio formado por posibles funciones en el aprendizaje automático se denomina "espacio de hipótesis". (El concepto de Enciclopedia Baidu)

    Entiendo: para un determinado problema, un conjunto de todas las condiciones posibles, como el problema de la sandía en el libro, hay tres características de sandía, color, raíz, golpe, estas tres características se pueden usar para describir una sandía, Entre las características conocidas, hay dos tipos de color, tres tipos de raíces y tres tipos de golpes. Según el arreglo y la combinación, hay 18 tipos de situaciones, pero otras sandías pueden no estar limitadas a estos 18 tipos de situaciones. Las características de los melones pueden ser tan buenas como el sonido de las raíces y el color, sin importar cuáles sean las raíces y los colores, pueden ser buenos melones o puede que no haya buenos melones. Las tres características están vacías.

    Espacio de versión: es un subconjunto de todas las hipótesis que son consistentes con el conjunto de datos conocido en el aprendizaje de conceptos. Se supone que el espacio considera todos los casos, pero algunos de ellos son inconsistentes con el conjunto de datos conocido. Por ejemplo, en el conjunto de datos conocido, existe el concepto de buenos melones, por lo que se supone que Ø en el espacio pertenece al espacio de versión.

 

Segundo, el problema de la sandía.

     Según el problema de la sandía, se supone que el espacio debe ser el siguiente:

1 color = *, Genty = *, Knock = *

2 colores = verde-verde, raíz = **, golpe = *

3 colores = ébano, genty = *, golpe = *

4 colores = *, raíz = acurrucado, golpe = *

5 colores = *, genty = rígido, golpe = *

6 Color = *, Genty = ligeramente rizado, golpear = *

7 Color = *, Genty = *, Golpe = Silencio

8 colores = *, genty = *, golpe = claro

9 Color = *, Genty = *, Golpe = aburrido

10 Color = verde-verde, pedestal raíz = rizo, golpe = *

11 Color = verde, pedículo radicular = rígido, golpe = *

12 Color = verde-verde, enraizado = ligeramente rizado, golpe = *

13 Color = negro, enraizado = acurrucado, golpe = =

14 Color = Ébano, Genty = Rígido, Golpe = *

15 Color = Ébano, Genty = Ligeramente rizado, Golpe = *

16 Color = verde-verde, enraizado = *, golpe = turbio

17 Color = verde-verde, arraigado = *, golpe = claro

18 Color = verde-verde, pedestal raíz = *, golpe = opacidad

19 color = ébano, genty = *, golpe = mareado

20 color = negro, genty = *, golpe = claro

21 color = ébano, genty = *, golpe = aburrido

22 Color = *, pedículo de la raíz = acurrucado, golpeando = fangoso

23 Color = *, pedículo raíz = acurrucado, golpe = crujiente

24 Color = *, raíz = acurrucado, golpe = opaco

25 color = *, pedículo radicular = rígido, golpeando = fangoso

26 Color = *, Genty = Fuerte, Golpe = Claro

27 color = *, genty = rígido, golpe = aburrido

28 Color = *, pedículo radicular = ligeramente rizado, golpeando = fangoso

29 Color = *, pedículo radicular = ligeramente rizado, golpeando = crujiente

30 Color = *, pedículo de la raíz = ligeramente rizado, golpe = opaco

31 Color = verde, pedículo radicular = acurrucado, golpeando = fangoso

32 Color = verde, pedículo raíz = acurrucado, golpe = crujiente

33 Color = verde, pedículo de la raíz = acurrucado, golpe = opaco

34 Color = verde, pedículo radicular = rígido, golpeando = fangoso

35 Color = verde, pedículo de la raíz = rígido, golpe = crujiente

36 Color = verde-verde, enraizado = rígido, golpe = opaco

37 Color = verde-verde, pedículo radicular = ligeramente curvado, sonido de golpe = sonido turbio

38 Color = verde-verde, pedículo de la raíz = ligeramente rizado, golpeando = claro

39 Color = verde, pedículo radicular = ligeramente curvado, golpeado = opaco

40 Color = negro, pedículo radicular = acurrucado, golpeando = fangoso

41 Color = negro, enraizado = acurrucado, golpe = crujiente

42 Color = negro, arraigado = acurrucado, golpe = opaco

43 Color = ébano, genty = rígido, golpe = mareado

44 Color = Ébano, Genty = Fuerte, Golpe = Claro

45 color = ébano, genty = rígido, golpe = aburrido

46 Color = Ébano, Genty = Ligeramente rizado, Golpe = Mareado

47 Color = negro, enraizado = ligeramente rizado, golpeando = crujiente

48 Color = Ébano, Genty = Ligeramente rizado, Golpe = Sin brillo

49 Ø

  Los 49 casos anteriores son el espacio hipotético del 'buen melón'

  Según conjuntos de datos conocidos:

Numero Color Genti Golpe Buen melon
1 Verdure Acurrucarse Fangoso Si
2 Ébano Acurrucarse Fangoso Si
3 Verdure Rígido Crujiente No
4 4 Ébano Ligeramente rizado Aburrido No

  De acuerdo con la situación del número 1 en el conjunto de datos, se pueden eliminar 3, 5, 6, 8, 9, 11-15, 17-21, 23-30, 32-49 en el espacio muestral, contradiciéndose entre sí.

  Según el número 2 en el conjunto de datos, se pueden eliminar 2, 10, 16, 31 en el espacio de muestra restante.

  Según el número 3 en el conjunto de datos, se puede eliminar 1 en el espacio de muestra restante.

  Según el número 4 en el conjunto de datos, no hay nada que eliminar.

 

Entonces, el espacio de la versión después del aprendizaje es

  4 colores = *, raíz = acurrucado, golpe = *

  7 Color = *, Genty = *, Golpe = Silencio

  22 Color = *, pedículo de la raíz = acurrucado, golpeando = fangoso

Ese es el contenido de la Figura 1.2 en el libro.

 

3. Alguna comprensión

         Al eliminar el espacio de hipótesis, habrá más eliminaciones de acuerdo con el número 1 en el conjunto de datos, ya que es para encontrar las características que pueden describir el buen melón. Mientras el contenido en el número 1 desee entrar en conflicto, se eliminará. Vea algunas publicaciones a continuación preguntando "por qué ¿Supongamos que el buen melón en el conjunto de datos se elimina del espacio? "Creo que esto está buscando una característica que pueda describir el buen melón, y el buen melón en el conjunto de datos en el espacio de hipótesis solo puede describir un valor en el conjunto de datos, pero es diferente del otro Conflictos de valor, así que bórralo

Finalmente, pon una foto:

Para la hipótesis "rectangular" en el espacio bidimensional (arriba), el signo más verde representa muestras positivas y el pequeño círculo rojo representa muestras negativas. GB es la frontera de hipótesis positiva máxima general, SB es la frontera de hipótesis positiva máxima específica. El rectángulo en el área encerrada por GB y SB es la hipótesis en el espacio de versión, Es decir, el área encerrada por GB y SB es el espacio de versión, es decir, el espacio formado por la línea verde en el medio.

17 artículos originales publicados · elogiados 0 · visitas 3231

Supongo que te gusta

Origin blog.csdn.net/qq_31874075/article/details/88744197
Recomendado
Clasificación