En el primer capítulo, la introducción arroja un montón de conceptos, y al ver que el espacio hipotético y el espacio muestral son un poco confusos, solo lo sé después de verificar cierta información y registrarlo.
1. Conceptos básicos
Espacio de hipótesis: el espacio formado por posibles funciones en el aprendizaje automático se denomina "espacio de hipótesis". (El concepto de Enciclopedia Baidu)
Entiendo: para un determinado problema, un conjunto de todas las condiciones posibles, como el problema de la sandía en el libro, hay tres características de sandía, color, raíz, golpe, estas tres características se pueden usar para describir una sandía, Entre las características conocidas, hay dos tipos de color, tres tipos de raíces y tres tipos de golpes. Según el arreglo y la combinación, hay 18 tipos de situaciones, pero otras sandías pueden no estar limitadas a estos 18 tipos de situaciones. Las características de los melones pueden ser tan buenas como el sonido de las raíces y el color, sin importar cuáles sean las raíces y los colores, pueden ser buenos melones o puede que no haya buenos melones. Las tres características están vacías.
Espacio de versión: es un subconjunto de todas las hipótesis que son consistentes con el conjunto de datos conocido en el aprendizaje de conceptos. Se supone que el espacio considera todos los casos, pero algunos de ellos son inconsistentes con el conjunto de datos conocido. Por ejemplo, en el conjunto de datos conocido, existe el concepto de buenos melones, por lo que se supone que Ø en el espacio pertenece al espacio de versión.
Segundo, el problema de la sandía.
Según el problema de la sandía, se supone que el espacio debe ser el siguiente:
1 color = *, Genty = *, Knock = *
2 colores = verde-verde, raíz = **, golpe = *
3 colores = ébano, genty = *, golpe = *
4 colores = *, raíz = acurrucado, golpe = *
5 colores = *, genty = rígido, golpe = *
6 Color = *, Genty = ligeramente rizado, golpear = *
7 Color = *, Genty = *, Golpe = Silencio
8 colores = *, genty = *, golpe = claro
9 Color = *, Genty = *, Golpe = aburrido
10 Color = verde-verde, pedestal raíz = rizo, golpe = *
11 Color = verde, pedículo radicular = rígido, golpe = *
12 Color = verde-verde, enraizado = ligeramente rizado, golpe = *
13 Color = negro, enraizado = acurrucado, golpe = =
14 Color = Ébano, Genty = Rígido, Golpe = *
15 Color = Ébano, Genty = Ligeramente rizado, Golpe = *
16 Color = verde-verde, enraizado = *, golpe = turbio
17 Color = verde-verde, arraigado = *, golpe = claro
18 Color = verde-verde, pedestal raíz = *, golpe = opacidad
19 color = ébano, genty = *, golpe = mareado
20 color = negro, genty = *, golpe = claro
21 color = ébano, genty = *, golpe = aburrido
22 Color = *, pedículo de la raíz = acurrucado, golpeando = fangoso
23 Color = *, pedículo raíz = acurrucado, golpe = crujiente
24 Color = *, raíz = acurrucado, golpe = opaco
25 color = *, pedículo radicular = rígido, golpeando = fangoso
26 Color = *, Genty = Fuerte, Golpe = Claro
27 color = *, genty = rígido, golpe = aburrido
28 Color = *, pedículo radicular = ligeramente rizado, golpeando = fangoso
29 Color = *, pedículo radicular = ligeramente rizado, golpeando = crujiente
30 Color = *, pedículo de la raíz = ligeramente rizado, golpe = opaco
31 Color = verde, pedículo radicular = acurrucado, golpeando = fangoso
32 Color = verde, pedículo raíz = acurrucado, golpe = crujiente
33 Color = verde, pedículo de la raíz = acurrucado, golpe = opaco
34 Color = verde, pedículo radicular = rígido, golpeando = fangoso
35 Color = verde, pedículo de la raíz = rígido, golpe = crujiente
36 Color = verde-verde, enraizado = rígido, golpe = opaco
37 Color = verde-verde, pedículo radicular = ligeramente curvado, sonido de golpe = sonido turbio
38 Color = verde-verde, pedículo de la raíz = ligeramente rizado, golpeando = claro
39 Color = verde, pedículo radicular = ligeramente curvado, golpeado = opaco
40 Color = negro, pedículo radicular = acurrucado, golpeando = fangoso
41 Color = negro, enraizado = acurrucado, golpe = crujiente
42 Color = negro, arraigado = acurrucado, golpe = opaco
43 Color = ébano, genty = rígido, golpe = mareado
44 Color = Ébano, Genty = Fuerte, Golpe = Claro
45 color = ébano, genty = rígido, golpe = aburrido
46 Color = Ébano, Genty = Ligeramente rizado, Golpe = Mareado
47 Color = negro, enraizado = ligeramente rizado, golpeando = crujiente
48 Color = Ébano, Genty = Ligeramente rizado, Golpe = Sin brillo
49 Ø
Los 49 casos anteriores son el espacio hipotético del 'buen melón'
Según conjuntos de datos conocidos:
Numero | Color | Genti | Golpe | Buen melon |
1 | Verdure | Acurrucarse | Fangoso | Si |
2 | Ébano | Acurrucarse | Fangoso | Si |
3 | Verdure | Rígido | Crujiente | No |
4 4 | Ébano | Ligeramente rizado | Aburrido | No |
De acuerdo con la situación del número 1 en el conjunto de datos, se pueden eliminar 3, 5, 6, 8, 9, 11-15, 17-21, 23-30, 32-49 en el espacio muestral, contradiciéndose entre sí.
Según el número 2 en el conjunto de datos, se pueden eliminar 2, 10, 16, 31 en el espacio de muestra restante.
Según el número 3 en el conjunto de datos, se puede eliminar 1 en el espacio de muestra restante.
Según el número 4 en el conjunto de datos, no hay nada que eliminar.
Entonces, el espacio de la versión después del aprendizaje es
4 colores = *, raíz = acurrucado, golpe = *
7 Color = *, Genty = *, Golpe = Silencio
22 Color = *, pedículo de la raíz = acurrucado, golpeando = fangoso
Ese es el contenido de la Figura 1.2 en el libro.
3. Alguna comprensión
Al eliminar el espacio de hipótesis, habrá más eliminaciones de acuerdo con el número 1 en el conjunto de datos, ya que es para encontrar las características que pueden describir el buen melón. Mientras el contenido en el número 1 desee entrar en conflicto, se eliminará. Vea algunas publicaciones a continuación preguntando "por qué ¿Supongamos que el buen melón en el conjunto de datos se elimina del espacio? "Creo que esto está buscando una característica que pueda describir el buen melón, y el buen melón en el conjunto de datos en el espacio de hipótesis solo puede describir un valor en el conjunto de datos, pero es diferente del otro Conflictos de valor, así que bórralo
Finalmente, pon una foto:
Para la hipótesis "rectangular" en el espacio bidimensional (arriba), el signo más verde representa muestras positivas y el pequeño círculo rojo representa muestras negativas. GB es la frontera de hipótesis positiva máxima general, SB es la frontera de hipótesis positiva máxima específica. El rectángulo en el área encerrada por GB y SB es la hipótesis en el espacio de versión, Es decir, el área encerrada por GB y SB es el espacio de versión, es decir, el espacio formado por la línea verde en el medio.