Hinweis: Dies ist einmaschinelles Lernprojekt (wird mit Daten + Code + Dokumentation + geliefert). Video-Erklärung), wenn SieDaten + Code + Dokumentation + Video-Erklärung benötigen, können Sie direkt zum Ende gehen des Artikels, um ihn zu bekommen.
1.Elementhintergrund
Der Fire-Fly-Algorithmus (FA) wurde 2009 von Yang von der Universität Cambridge vorgeschlagen. Als einer der neuesten Algorithmen zur Optimierung der Schwarmintelligenz bietet dieser Algorithmus die Vorteile einer besseren Konvergenzgeschwindigkeit und Konvergenzgenauigkeit und ist in der Technik einfach zu implementieren.
Dieses Projekt verwendet den FA-Firefly-Optimierungsalgorithmus, um optimale Parameterwerte zur Optimierung des LightGBM-Regressionsmodells zu finden.
2.Nummernerfassung
Die Modellierungsdaten für diesen Zeitraum stammen aus dem Internet (zusammengestellt vom Autor dieses Projekts). Die Statistiken der Datenelemente lauten wie folgt:
Seriennummer |
Variablennamen |
beschreiben |
1 |
x1 |
|
2 |
x2 |
|
3 |
x3 |
|
4 |
x4 |
|
5 |
x5 |
|
6 |
x6 |
|
7 |
x7 |
|
8 |
x8 |
|
9 |
x9 |
|
10 |
x10 |
|
11 |
Und |
abhängige Variable |
Die Datendetails lauten wie folgt (teilweise angezeigt):
3.Datenvorverarbeitung
3.1 用PundasTools
Verwenden Sie die head()-Methode des Pandas-Tools, um die ersten fünf Datenzeilen anzuzeigen:
Schlüsselcode:
3.2 Ansicht mit fehlenden Daten
Verwenden Sie die info()-Methode des Pandas-Tools, um Dateninformationen anzuzeigen:
Wie Sie dem Bild oben entnehmen können, gibt es insgesamt 11 Variablen, keine fehlenden Werte in den Daten und insgesamt 2.000 Daten.
Schlüsselcode:
3.3Berechnung der Zahlenvorschrift
Verwenden Sie die Methode discover() des Pandas-Tools, um den Mittelwert, die Standardabweichung, den Minimalwert, das Quantil und den Maximalwert der Daten anzuzeigen.
Der Schlüsselcode lautet wie folgt:
4.Explorative Datenanalyse
4.1y quadratisches Bild ändern
Verwenden Sie die hist()-Methode des Matplotlib-Tools, um ein Histogramm zu zeichnen:
Wie Sie dem Bild oben entnehmen können, konzentriert sich die y-Variable hauptsächlich zwischen -400 und 400.
4.2 Korrelationsanalyse
Wie aus der obigen Abbildung ersichtlich ist, ist die Korrelation umso stärker, je größer der Wert ist. Positive Werte sind positive Korrelationen und negative Werte sind negative Korrelationen.
5.Spezieller Expeditionsprozess
5.1 Feature-Daten und Beschriftungsdaten erstellen
Der Schlüsselcode lautet wie folgt:
5.2 Datensatzaufteilung
Die Methode train_test_split () wird verwendet, um 80 % des Trainingssatzes und 20 % des Testsatzes zu teilen. Der Schlüsselcode lautet wie folgt:
6. Erstellen Sie einen FA-Firefly-Optimierungsalgorithmus zur OptimierungLightGBMRegressionsmodell
Der FA Firefly-Optimierungsalgorithmus wird hauptsächlich zur Optimierung des LightGBM-Regressionsalgorithmus für die Zielregression verwendet.
6.1 Die vom FA Firefly-Optimierungsalgorithmus gefundenen optimalen Parameter
Optimale Parameter:
6.2 Modell mit optimalen Parameterwerten erstellen
Seriennummer |
Modellname |
Parameter |
1 |
LightGBM-Regressionsmodell |
n_estimators=best_n_estimators |
2 |
learning_rate=best_learning_rate |
7.Modelleinführung
7.1 Bewertungsindikatoren und Ergebnisse
Zu den Bewertungsindikatoren gehören hauptsächlich der erklärbare Varianzwert, der mittlere absolute Fehler, der mittlere quadratische Fehler, der R-Quadrat-Wert usw.
Modellname |
Indikatorname |
Indexwert |
Testsatz |
||
LightGBM-Regressionsmodell |
R Quadrat |
0,9529 |
mittlerer quadratischer Fehler |
1540.5081 |
|
erklärte Varianz |
0,953 |
|
mittlerer absoluter Fehler |
30.1685 |
Wie aus der obigen Tabelle ersichtlich ist, beträgt das R-Quadrat 0,9529, was darauf hinweist, dass das Modell effektiv ist.
Der Schlüsselcode lautet wie folgt:
7.2 Vergleichstabelle zwischen wahrem Wert und vorhergesagtem Wert
Aus der obigen Abbildung ist ersichtlich, dass die Schwankungen des realen Werts und des vorhergesagten Werts grundsätzlich konsistent sind und der Modellanpassungseffekt gut ist.
8.Ausblick zum Fazit
Zusammenfassend lässt sich sagen, dass dieser Artikel den FA-Firefly-Optimierungsalgorithmus verwendet, um die optimalen Parameterwerte des LightGBM-Regressionsalgorithmus zu finden und ein Regressionsmodell zu erstellen, was letztendlich beweist, dass das von uns vorgeschlagene Modell gut funktioniert. Dieses Modell kann für Vorhersagen von Alltagsprodukten verwendet werden.
# 本次机器学习项目实战所需的资料,项目资源如下:
# 项目说明:
链接:https://pan.baidu.com/s/1kEVSoOYkQJtF_PA6r5trDQ
提取码:aepv
Weitere praktische Projekte finden Sie in der Liste praktischer Machine-Learning-Projekte: