Das Perzeptron ist ein lineares Klassifizierungsmodell für die Zwei-Klassen-Klassifizierung. Seine Eingabe ist der Merkmalsvektor der Instanz und die Ausgabe ist die Kategorie der Instanz, wobei die Binärwerte +1 und -1 angenommen werden. Das Perzeptron entspricht einer Trennungshyperebene, die Instanzen im Eingaberaum (Merkmalsraum) in positive und negative Kategorien unterteilt, und ist ein Diskriminanzmodell. Perceptron ist die Basis des neuronalen Netzwerks und der Support-Vektor-Maschine
Ziel des Perceptron-Lernens ist es, die Trennungshyperebene zu finden, die die Trainingsdaten linear teilt.
Ideen zum Perzeptron-Lernen:
1. Importieren Sie die Verlustfunktion basierend auf einer Fehlklassifizierung
2. Verwenden Sie die Gradientenabstiegsmethode, um die Verlustfunktion zu minimieren
3. Ersetzen Sie die Parameter, um das Perzeptronmodell zu erhalten.
Klassifizierung von Perzeptron-Lernalgorithmen:
Primitive Form, Dualform.
Algorithmus: Die ursprüngliche Form des Perzeptron-Lernalgorithmus
Eingabe: Trainingsdatensatz , wobei ; Lernrate ;
Ausgabe: ;Perceptron-Modell
1) Wählen Sie den Anfangswert ;
2) Daten im Trainingssatz auswählen ;
3) Wenn ,
4) Fahren Sie mit 2) fort, bis im Trainingssatz keine Fehlklassifizierungspunkte mehr vorhanden sind.
Der Algorithmus verwendet einen stochastischen Gradientenabstieg:
Wählen Sie zunächst willkürlich eine Hyperebene aus und verwenden Sie dann die Gradientenabstiegsmethode, um die Verlustfunktion zu minimieren. Der Minimierungsprozess besteht nicht darin, den Gradienten aller falsch klassifizierten Punkte auf einmal zu reduzieren, sondern jedes Mal zufällig einen falsch klassifizierten Punkt auszuwählen, um den Gradienten zu reduzieren.
Unter der Annahme, dass die Menge der falsch klassifizierten Punkte M fest ist, ist der Gradient der Verlustfunktion:
Für einen bestimmten Punkt ist der Gradient in zunehmender Richtung, sodass die Verlustfunktion abnimmt.
Algorithmusverständnis : Wenn ein Instanzpunkt falsch klassifiziert wird, werden die Werte von w und b angepasst, um die Klassifizierungshyperebene auf eine Seite des falsch klassifizierten Punkts zu verschieben und so den Abstand zwischen dem falsch klassifizierten Punkt und der Hyperebene zu verringern, bis die Hyperebene die falsch klassifizierten Punkte kreuzt damit sie richtig klassifiziert werden