[Studiennotizen] Kapitel 2 des Xigua-Buches Maschinelles Lernen: Modellbewertung und -auswahl sowie Grundlagen des statistischen Hypothesentests - Code World

[Studiennotizen] Kapitel 2 des Xigua-Buches Maschinelles Lernen: Modellbewertung und -auswahl sowie Grundlagen des statistischen Hypothesentests

Enterprise 2023-09-18 23:34:44 views: null

1. Bewertungsmethode

Um den Generalisierungsfehler des Lernenden zu bewerten, muss ein Testsatz (nicht im Trainingssatz) verwendet werden, um die Fähigkeiten des Modells zu testen. Zu diesem Zeitpunkt werden wir den Datensatz D entsprechend verarbeiten und den Trainingssatz S und den Testsatz T von D erhalten. Darüber hinaus ist in D manchmal ein Validierungssatz (Validierung) erforderlich, um die Ergebnisse verschiedener Modelle zu vergleichen.

1.1 Zurückhalten

Konkret ist der Datensatz in zwei sich gegenseitig ausschließende Sätze unterteilt. Beispielsweise ist der Datensatz in 37 Punkte unterteilt, 7 Punkte als Trainingssatz und 3 Punkte als Testsatz. Im Allgemeinen werden mehrere Zufallsteilungen verwendet, die experimentelle Auswertung wiederholt und der Durchschnittswert als Ergebnis der Hold-out-Methode verwendet. Es ist wichtig, das Teilungsverhältnis zu beachten, weil:

Zu viele S-----Zu wenige T------Die Bewertungsergebnisse sind möglicherweise nicht genau genug.
Zu wenige S-----Zu viele T------Die Lücke zwischen dem realen Modell und Das reale Modell ist zu groß.

1.2 Kreuzvalidierung

Teilen Sie den Datensatz D in K sich gegenseitig ausschließende Teilmengen gleicher Größe auf. Jedes Mal werden die K-1-Teilmengen als Trainingssatz und die verbleibende Teilmenge als Testsatz verwendet. Auf diese Weise können K Sätze von Trainingssätzen und Testsätzen erhalten werden, sodass k Training und Tests durchgeführt werden können und die endgültige Rendite auch der Mittelwert der k Sätze von Testergebnissen ist.

Wenn insgesamt m Stichproben vorhanden sind, k = m, wird die in diesem speziellen Fall erhaltene Kreuzvalidierungsmethode als Leave-One-Out bezeichnet. Der Vorteil der Leave-One-Out-Methode besteht darin, dass das tatsächlich bewertete Modell dem sehr nahe kommt das erwartete bewertete Modell. Ähnlichkeit. Der Nachteil besteht darin, dass der Rechenaufwand zu hoch ist.

1.3 Bootstrapping

Die beiden oben genannten Methoden haben einen Nachteil: Der Trainingssatz ist kleiner als der tatsächliche Datensatz D, und wir wollen das von D trainierte Modell. Daher löst die Bootstrap-Methode dieses Problem sehr gut. Im Datensatz D von jeweils m Stichproben

Acho que você gosta

Origin blog.csdn.net/weixin_52589734/article/details/112372864

[Studiennotizen] Kapitel 2 des Xigua-Buches Maschinelles Lernen: Modellbewertung und -auswahl sowie Grundlagen des statistischen Hypothesentests

[Studiennotizen] Kapitel 2 des Xigua-Buches Maschinelles Lernen: Modellbewertung und -auswahl sowie Grundlagen des statistischen Hypothesentests

[Studiennotizen] Kapitel 2 des Xigua-Buches Maschinelles Lernen: Modellbewertung und -auswahl sowie Grundlagen des statistischen Hypothesentests

[Studiennotizen] Kapitel 2 des Xigua-Buches Maschinelles Lernen: Modellbewertung und -auswahl sowie Grundlagen des statistischen Hypothesentests

[Studiennotizen] Einführung in Kapitel 1 des Xigua-Buches Maschinelles Lernen

[Studiennotizen] Einführung in Kapitel 1 des Xigua-Buches Maschinelles Lernen

[Maschinelles Lernen] Zuverlässigkeitskurve und Kalibrierung des probabilistischen Modells

Wie trainiert maschinelles Lernen Modelle? Trainingsprozess und Vorsichtsmaßnahmen für das Modell des maschinellen Lernens

Maschinelles Lernen und Kryptographie

Ableitung des Gradientenalgorithmus (maschinelles Lernen muss 02 lauten)

Auswahl der statistischen Methode

„Formelableitung und Codeimplementierung für maschinelles Lernen“, Kapitel 11-GBDT

„Formelableitung und Codeimplementierung für maschinelles Lernen“, Kapitel 12-XGBoost

Grundlagen des maschinellen Lernens und Prinzipien des Reinforcement Learning

Maschinelles Lernen: Ein wichtiger Motor zur Eröffnung des intelligenten Zeitalters

Fragen zur Abschlussprüfung für maschinelles Lernen im Herbst 2022, Hauptsitz des Harbin Institute of Technology

[Handschriftliche Datenbank toadb] Die Gesamtarchitektur des Datenbankplaners sowie der Entwurfs- und Implementierungsprozess des logischen Abfragebaums

Maschinelles Lernen – LDA (Lineare Diskriminanzanalyse) und Gesichtserkennung

Lernen und Teilen (Phase 2): Betrachtung des speichersparenden Designs von Redis auf Quellcodeebene

Grundlagen des Bildtensors

Grundlagen des Sammlungsinterviews

[Grundlagen der Computerkomposition] Lesenotizen Ausgabe 2: Verwendung des Winkelgedächtnisses

PyTorch-Studiennotizen (18) – das Skript zur Aufteilung des Trainingssatzes und des Testsatzes

Eingebettete Studiennotizen (12) Kompilieren des Startcodes zum Einrichten des Stapels und Aufrufen der C-Sprache

Einschränkungen bei der Auswahl des Uniapp-Applet-Zeitraums (Startzeit und Endzeit sind gegenseitig begrenzt)

Maschinelles Lernen und Deep Learning – Stochastischer Gradientenabstiegsalgorithmus (und seine Optimierung)

Maschinelles Lernen, Über- und Unteranpassung, Regularisierung und Kreuzvalidierung

03_Lernen und Anwendung des Selenium-Moduls / Phasenzusammenfassung

Auswahl des Zeitbereichs der Element-UI

Klassifikation und Algorithmen für maschinelles Lernen (Zusammenfassung)

Recomendado

Clasificación

Diario

Más

2024-06-16(0)

2024-06-15(0)

2024-06-14(0)

2024-06-13(0)

2024-06-12(0)

2024-06-11(0)

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)