Imports System.IO
Public Class Form1
Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click
TextBox3.Text = ""
TextBox2.Text = ""
'属性个数
Dim xmcount As Integer = 0
Dim mysr As StreamReader
Dim strline As String
'是否正例
Dim iszl As Boolean
Dim mystr As String()
'标题名称
Dim xmname() As String
'变型空间
Dim bxkj As New ArrayList()
Dim tempsuppose As String()
'一般假设
Dim common_suppose As New ArrayList()
'特殊假设
Dim specific_suppose As String()
'读取样本文件
mysr = New StreamReader("e:\mydata.txt", System.Text.Encoding.Default)
'第一行是标题
strline = mysr.ReadLine()
TextBox1.Clear()
mystr = strline.Split(New Char() {",", ","})
'取属性个数
xmcount = mystr.GetUpperBound(0)
ReDim xmname(xmcount)
'初始化假设数组
ReDim specific_suppose(xmcount)
ReDim tempsuppose(xmcount)
For my_i As Integer = 0 To xmcount
specific_suppose(my_i) = Nothing
Next
For my_i As Integer = 0 To xmcount
tempsuppose(my_i) = "?"
Next
common_suppose.Add(tempsuppose)
'取得标题内容
xmname = mystr
Dim i As Integer = 0
For Each s As String In xmname
If s.Trim() <> "" Then
TextBox1.AppendText(s & Space(5))
End If
Next s
'分析样本每一行
While (Not mysr.EndOfStream)
strline = mysr.ReadLine()
If Trim(strline) = "" Then Exit While
TextBox1.AppendText(vbCrLf)
mystr = strline.Split(New Char() {",", ","})
'取样本性质
If Trim(mystr(xmcount + 1)) = "是" Then
iszl = True
Else
iszl = False
End If
TextBox1.AppendText(mystr(0) & Space(5))
'读取一行中的每个属性,最后一个属性指示了样本是正例还是反例,不能做为分析内容
For my_i As Integer = 1 To xmcount
TextBox1.AppendText(mystr(my_i) & Space(5))
If iszl Then
'正例
'设置特殊假设
If IsNothing(specific_suppose(my_i)) Then
'如果特殊假设的该属性未设定,则设定为样本的该属性值
specific_suppose(my_i) = mystr(my_i)
ElseIf specific_suppose(my_i) <> "?" And specific_suppose(my_i) <> mystr(my_i) Then
'如果特殊假设的该属性已设定,且不为当前样本值,则设定为?,可以接受任何值
specific_suppose(my_i) = "?"
End If
'设置一般假设
For my_ii As Integer = 0 To common_suppose.Count - 1
tempsuppose = TryCast(common_suppose.Item(my_ii), String())
If Not IsNothing(tempsuppose) Then
If tempsuppose(my_i) <> "?" And tempsuppose(my_i) <> mystr(my_i) Then
common_suppose.Item(my_ii) = Nothing
End If
End If
Next
Else
'反例
'设置一般假设
For my_ii As Integer = 0 To common_suppose.Count - 1
tempsuppose = TryCast(common_suppose.Item(my_ii), String())
If Not IsNothing(tempsuppose) Then
If mystr(my_i) = tempsuppose(my_i) Then
common_suppose.Item(my_ii) = Nothing
End If
End If
Next
tempsuppose = Nothing
ReDim tempsuppose(xmcount)
For my_iii As Integer = 1 To xmcount
If my_iii <> my_i Then
tempsuppose(my_iii) = "?"
Else
tempsuppose(my_iii) = specific_suppose(my_i)
End If
Next
'如果没有重复元素则增加
Dim iscf As Boolean
For my_ii As Integer = 0 To common_suppose.Count - 1
iscf = True
Dim mytempsuppose As String() = TryCast(common_suppose.Item(my_ii), String())
If Not IsNothing(mytempsuppose) Then
For mmm_i As Integer = 1 To xmcount
If Trim(tempsuppose(mmm_i)) <> Trim(mytempsuppose(mmm_i)) Then
iscf = False
End If
Next
End If
If iscf And (Not IsNothing(mytempsuppose)) Then
Exit For
End If
Next
If Not iscf Then
common_suppose.Add(tempsuppose)
End If
End If
Next my_i
TextBox1.AppendText(mystr(xmcount + 1) & Space(6))
If Not iszl Then
Dim isdel As Boolean
For my_ii As Integer = 0 To common_suppose.Count - 1
isdel = True
tempsuppose = TryCast(common_suppose.Item(my_ii), String())
If Not IsNothing(tempsuppose) Then
For mm_i As Integer = 1 To xmcount
If Trim(tempsuppose(mm_i)) <> "?" Then
isdel = False
End If
Next
End If
If isdel Then
common_suppose.Item(my_ii) = Nothing
End If
Next
End If
End While
For my_i As Integer = 1 To xmcount
TextBox2.Text &= specific_suppose(my_i) & Space(6)
Next
For my_iiii As Integer = 0 To common_suppose.Count - 1
If Not IsNothing(common_suppose.Item(my_iiii)) Then
tempsuppose = TryCast(common_suppose.Item(my_iiii), String())
For m_i As Integer = 1 To xmcount
TextBox3.Text &= tempsuppose(m_i) & Space(6)
Next
TextBox3.Text &= vbCrLf
End If
Next
MsgBox("变型空间在特殊假设和一般假设划分出来")
End Sub
End Class
e: \ mydata.txt sigue:
Nombre, forma, sabor, tipo, en general, comer, el tamaño de la
manzana, redondeada, la dulzura, la fruta, crudo, pequeña, una
sandía, redondeado, la dulzura, la fruta, crudo, mediano, es
amargo, alargada , la amargura, las verduras, los alimentos cocinados, de tamaño mediano, no hay
plátanos, alargado, dulce, fruta, crudo, pequeña, sin
calabaza, redondo, dulce, verduras, alimentos cocinados, de tamaño mediano, es
lichi, redondo, dulce sabor, fruta, crudo, pequeña, es
Los candidatos para características de eliminación de muestras recogidas y agrupadas, variaciones espaciales derivada, las muestras desconocidas pueden ser entonces método clasificado, en función de su análisis de la muestra sobre la base del resumen conjunto de atributos, el principio básico es:
1, el establecimiento de dos supuestos, uno generalmente se asume que una hipótesis especial a través del análisis de cada muestra, la expansión de hipótesis específicas, reduce suposiciones generales.
2, suponiendo que el valor de la propiedad se establece para cada muestra, y se puede ajustar a un valor fijo, se puede ajustar a un valor desconocido? Es decir, ¿qué valores son aceptables, si se ha ajustado a la nada, para representar cualquier valor de propiedad no aceptan
3, cada línea de análisis, las muestras se extraen cada atributo de cada línea
1) Para un ejemplo positivo:
que desea borrar general se supone que no hay casos positivos hipótesis coherentes con la
necesidad de ser hipótesis específicas eliminan y los pacientes positivos de atributos no cumplieron con el (es decir, a "?"), comenzaron especial Suponiendo que todo es nada, que no es aceptar cualquier valor de propiedad
2) para un contraejemplo
necesidad de eliminar los supuestos generales en línea con el contraejemplo hipótesis, a continuación, añadir el contraejemplo supone que contiene incompatibles con el valor de atributo, el otro valor de atributo de "?" en
3) la sustancia generalmente se asume que las características-contra descritos de la forma de realización, suponiendo que la especial características descritas n Ejemplo