Notas de estudo de conceito para o estudo individual

Aprendizagem de conceitos:

A compreensão dos seguintes pontos nos ajudará a entender melhor o conceito de aprendizagem

A relação de ordem parcial em matemática discreta é a chave para uma melhor compreensão do algoritmo FIND_S e do algoritmo de eliminação de candidatos.
Para entender da perspectiva dos problemas de pesquisa
O aprendizado do conceito tem baixo desempenho quando o conjunto de treinamento contém dados ruidosos

Terminologia e representação simbólica

O conceito alvo c: é uma função booleana h: X → {0,1}
Valor do conceito alvo: c (x)
Exemplo positivo: c (x) = 1
Exemplo de contador: c (x) = 0
Exemplo de treinamento: <x, c (x)>
Coleta de amostra de treinamento: D
Todas as hipóteses possíveis: H
Hipótese única: h, é uma função booleana h: X → {0, 1}

Find-S: Encontre a hipótese extrema especial

Nossa hipótese aqui é conjuntiva

Breve descrição : Comece com a hipótese mais específica em H e generalize-a quando a hipótese falhar em cobrir o exemplo positivo.

A hipótese mais específica:<Ø,Ø,Ø,Ø,Ø,Ø>

Descrição do algoritmo (processo de treinamento)

For each positive training instance x
For each attribute constraint ai ∈ h
If        the constraint ai ∈ h is satisfied by x
then    do nothing
else     replace ai ∈ h by the next more general constraint 
               that is satisfied by x
Output hypothesis

Partindo da hipótese mais específica, Find-S garante que a saída é a hipótese mais específica consistente com o exemplo positivo em H

Algoritmo de eliminação de candidatos

A saída do algoritmo de eliminação do candidato é um conjunto de todas as hipóteses consistentes com o exemplo de treinamento e Find-S é apenas uma delas.
Por causa da relação de ordenação parcial, o algoritmo de eliminação do candidato não precisa enumerar explicitamente todos os seus membros ao descrever o conjunto de treinamento.
Mas, da mesma forma que Find-S, o desempenho é ruim quando há dados ruidosos.

Espaço variante

Limite geral G

Limite especial S

初始化：G <- {<?,?,?,?,?,?>}
       S <- {<,,,,,>}
遍历训练集 d = < x, c (x) >
If d 是个正例
	对G：移出G中与d不一致(即假设得到的概念与样本真实概念取值不符)的所有假设
	对S：移出S中与d不一致的所有假设；如果一个假设h与d一致且G中有比h更一般的假设，那么将该假设加入S
If d 是个负例
	对S：移出S中与d不一致(即假设得到的概念与样本真实概念取值不符)的所有假设
	对G：移出G中与d不一致的所有假设；如果一个假设h与d一致且S中有比h更具体的假设，那么将该假设加入

Algumas explicações e explicações

E se os dados de treinamento contiverem erros

Irá remover o conceito de alvo correto
Dados de treinamento suficientes, os limites S e G convergem para um espaço variante vazio

Aprendiz imparcial

Para garantir que o conceito de destino esteja no espaço de hipótese, precisamos de um espaço de hipótese que possa expressar todos os conceitos ensináveis . Em outras palavras, ele pode expressar todos os subconjuntos possíveis do conjunto de instâncias X. E chamamos o conjunto de todos os subconjuntos do conjunto X de conjunto de potência de X (conjunto de potência)

Essa é uma hipótese não apenas conjuntiva, e não há necessidade de se preocupar em não conseguir expressar o conceito-alvo. No entanto, o algoritmo de aprendizado de conceito não será generalizado a partir dos exemplos de treinamento! ! !
S torna-se a disjunção do exemplo positivo, e G torna-se a negação da disjunção do exemplo negativo

Inutilidade de aprendizagem imparcial

Com a introdução acima, não é difícil compreender a inutilidade da aprendizagem imparcial.
Mas também ilustra uma propriedade básica do raciocínio indutivo : se o aluno não faz uma pré-presunção sobre a forma do conceito alvo, ele não pode classificar exemplos invisíveis de forma alguma.
Visto que a aprendizagem indutiva requer uma certa forma de pressuposto, também chamada de indução de polarização , podemos usar a indução de polarização para descrever as características de diferentes métodos de aprendizagem.