Maschinelles Lernen (21): Gewichtsmethode zur Behandlung von Klassenungleichgewichten

Persönliche Notizen, kein Kauf erforderlich.

Dieser Artikel stellt das Konzept des Klassenungleichgewichts vor und vier Möglichkeiten, es zu lösen. Gleichzeitig implementiert dieser Artikel nur den Fall für die erste Methode: Klassengewicht.

1. Was ist ein Klassenungleichgewicht?

Das Klassenungleichgewicht bezieht sich auf ein Problem beim maschinellen Lernen, bei dem Klassen in den Daten nicht gleichmäßig vertreten sind. Wenn es beispielsweise 100 Datenpunkte gibt, von denen 90 zur Klasse A und 10 zur Klasse B gehören, dann sind die Klassen unausgeglichen. Klassenungleichgewicht kann Probleme beim Trainieren von Modellen für maschinelles Lernen verursachen, da das Modell möglicherweise auf häufigere Klassen ausgerichtet ist. Wenn es mehr Beispiele für eine Klasse als für eine andere gibt, ist es wahrscheinlicher, dass das Modell die Mehrheitsklasse lernt und vorhersagt. Dies kann ein Problem darstellen, da es zu ungenauen Ergebnissen führen kann, wenn das Modell auf ausgewogenere Daten angewendet wird. Es wurde festgestellt, dass es eines der häufigsten Probleme bei der Lösung von Klassifizierungsproblemen im Zusammenhang mit dem Gesundheitswesen, dem Bankwesen (Betrug) usw. ist. Wenn Sie beispielsweise ein Modell erstellen möchten, das Transaktionen als betrügerisch oder anderweitig klassifiziert, wird der Datensatz stark unausgeglichen sein, da nicht viele Fälle von betrügerischen Transaktionen entdeckt werden. Eine Herausforderung im Zusammenhang mit dem Erstellen von Modellen mit hoher Leistung besteht darin, stark verzerrte Datenklassenverteilungen zu lösen, was als Problem der unausgeglichenen Klassifizierung bekannt ist. Das Problem des Klassifizierungsungleichgewichts tritt auf, wenn die Klassen im Dataset eine sehr ungleiche Anzahl von Stichproben aufweisen. Das Klassenungleichgewicht ist ein häufiges Problem beim maschinellen Lernen und schwer zu überwinden.

2. Gemeinsame Lösungen

Methode 1: Verwenden von Klassengewichtungen Die
Verwendung von Klassengewichtungen ist ein gängiger Ansatz, um das Klassenungleichgewicht in Modellen für maschinelles Lernen zu beheben. Ein Klassenungleichgewicht tritt auf, wenn die Anzahl der Beobachtungen zwischen den Klassen unterschiedlich ist, was häufig dazu führt, dass eine Klasse im Vergleich zu einer anderen überrepräsentiert ist. Die Klassengewichte passen die Kostenfunktion des Modells so an, dass Beobachtungen der Minderheitsklasse stärker falsch klassifiziert werden als Beobachtungen der Mehrheitsklasse. Dieser Ansatz kann dazu beitragen, die Genauigkeit des Modells zu verbessern, indem die Klassenverteilung neu ausgeglichen wird. Es ist jedoch wichtig zu beachten, dass Klassengewichte keine neuen Datenpunkte erstellen und dies auch nicht tun

おすすめ

転載: blog.csdn.net/weixin_46211269/article/details/126409456