Da ich das Programm auf Colab ausführe,
Ich werde nicht im Detail zeigen, wie dieses Autogluon-Paket installiert wird.
Im Internet gibt es Unterlagen zum Unterrichten
Die Stärke von Autogluon liegt in seiner eigenen Merkmalsextraktion
Sparen Sie viel Zeit für die manuelle Vorverarbeitung
Ich habe persönlich die Normalisierung des int-Typs und der Dummy-Variablen des str-Typs nach der Verarbeitung getestet
Der Effekt des Laufens ist der gleiche wie der unbehandelte
Dieses Tutorial ist nur für Klassifizierungsaufgaben gedacht. Andere Typen müssen in der offiziellen Website-Dokumentation nachgelesen werden
import pandas as pd
from autogluon.tabular import TabularDataset,TabularPredictor
train_data = TabularDataset('train.csv')
test_data = TabularDataset('test.csv')
id,label = 'user_id', 'Label'
predictor = TabularPredictor(label=label).fit(train_data.drop(columns=[id]))
preds = predictor.predict(test_data.drop(columns=[id]))
submission = pd.DataFrame({
id:test_data[id],label:preds})
submission.to_csv('submission.csv',index=False)
Um bessere Ergebnisse zu erzielen
Die Quelldaten können ordnungsgemäß vorverarbeitet werden.
Wenn beispielsweise einige numerische Werte relativ groß sind, können Sie sie protokollieren
import numpy as np
large_val_col = ['A','C','S','G','K']
for i in large_val_col:
train[c] = np.log(train[c] + 1)
Schreiben Sie einfach zuerst so viel und aktualisieren Sie es weiter, wenn Sie neues Wissen haben