Notas de estudo de conceito para o estudo individual
Aprendizagem de conceitos:
A compreensão dos seguintes pontos nos ajudará a entender melhor o conceito de aprendizagem
-
A relação de ordem parcial em matemática discreta é a chave para uma melhor compreensão do algoritmo FIND_S e do algoritmo de eliminação de candidatos.
-
Para entender da perspectiva dos problemas de pesquisa
-
O aprendizado do conceito tem baixo desempenho quando o conjunto de treinamento contém dados ruidosos
Terminologia e representação simbólica
-
O conceito alvo c: é uma função booleana h: X → {0,1}
-
Valor do conceito alvo: c (x)
-
Exemplo positivo: c (x) = 1
-
Exemplo de contador: c (x) = 0
-
Exemplo de treinamento: <x, c (x)>
-
Coleta de amostra de treinamento: D
-
Todas as hipóteses possíveis: H
-
Hipótese única: h, é uma função booleana h: X → {0, 1}
Find-S: Encontre a hipótese extrema especial
Nossa hipótese aqui é conjuntiva
Breve descrição : Comece com a hipótese mais específica em H e generalize-a quando a hipótese falhar em cobrir o exemplo positivo.
A hipótese mais específica:<Ø,Ø,Ø,Ø,Ø,Ø>
Descrição do algoritmo (processo de treinamento)
For each positive training instance x
For each attribute constraint ai ∈ h
If the constraint ai ∈ h is satisfied by x
then do nothing
else replace ai ∈ h by the next more general constraint
that is satisfied by x
Output hypothesis
Partindo da hipótese mais específica, Find-S garante que a saída é a hipótese mais específica consistente com o exemplo positivo em H
Algoritmo de eliminação de candidatos
- A saída do algoritmo de eliminação do candidato é um conjunto de todas as hipóteses consistentes com o exemplo de treinamento e Find-S é apenas uma delas.
- Por causa da relação de ordenação parcial, o algoritmo de eliminação do candidato não precisa enumerar explicitamente todos os seus membros ao descrever o conjunto de treinamento.
- Mas, da mesma forma que Find-S, o desempenho é ruim quando há dados ruidosos.
Espaço variante
-
Limite geral G
-
Limite especial S
初始化:G <- {<?,?,?,?,?,?>} S <- {<,,,,,>} 遍历训练集 d = < x, c (x) > If d 是个正例 对G:移出G中与d不一致(即假设得到的概念与样本真实概念取值不符)的所有假设 对S:移出S中与d不一致的所有假设;如果一个假设h与d一致且G中有比h更一般的假设,那么将该假设加入S If d 是个负例 对S:移出S中与d不一致(即假设得到的概念与样本真实概念取值不符)的所有假设 对G:移出G中与d不一致的所有假设;如果一个假设h与d一致且S中有比h更具体的假设,那么将该假设加入
Algumas explicações e explicações
E se os dados de treinamento contiverem erros
- Irá remover o conceito de alvo correto
- Dados de treinamento suficientes, os limites S e G convergem para um espaço variante vazio
Aprendiz imparcial
Para garantir que o conceito de destino esteja no espaço de hipótese, precisamos de um espaço de hipótese que possa expressar todos os conceitos ensináveis . Em outras palavras, ele pode expressar todos os subconjuntos possíveis do conjunto de instâncias X. E chamamos o conjunto de todos os subconjuntos do conjunto X de conjunto de potência de X (conjunto de potência)
- Essa é uma hipótese não apenas conjuntiva, e não há necessidade de se preocupar em não conseguir expressar o conceito-alvo. No entanto, o algoritmo de aprendizado de conceito não será generalizado a partir dos exemplos de treinamento! ! !
- S torna-se a disjunção do exemplo positivo, e G torna-se a negação da disjunção do exemplo negativo
Inutilidade de aprendizagem imparcial
-
Com a introdução acima, não é difícil compreender a inutilidade da aprendizagem imparcial.
-
Mas também ilustra uma propriedade básica do raciocínio indutivo : se o aluno não faz uma pré-presunção sobre a forma do conceito alvo, ele não pode classificar exemplos invisíveis de forma alguma.
-
Visto que a aprendizagem indutiva requer uma certa forma de pressuposto, também chamada de indução de polarização , podemos usar a indução de polarização para descrever as características de diferentes métodos de aprendizagem.