Feinabstimmung von Llama 2 für die Vorhersage von Nachrichtenkategorien: Eine umfassende Schritt-für-Schritt-Anleitung zur Feinabstimmung jedes LLM (Teil 1)

Eine umfassende Schritt-für-Schritt-Anleitung zur Feinabstimmung aller LL.M.-Studiengänge.

In diesem Blog führe ich Sie durch den Prozess der Feinabstimmung des Llama 2 7B-Modells von Meta für die Klassifizierung von Nachrichtenartikeln in 18 verschiedene Kategorien. Ich werde einen Datensatz mit Nachrichtenklassifizierungsanweisungen verwenden, der zuvor mit GPT 3.5 erstellt wurde.

Der Zweck dieses Notizbuchs besteht darin, eine umfassende Schritt-für-Schritt-Anleitung für die Feinabstimmung jedes LLM (Large Language Model) bereitzustellen. Im Gegensatz zu vielen verfügbaren Tutorials werde ich jeden Schritt im Detail erklären und dabei alle verwendeten Klassen, Funktionen und Parameter abdecken.

Dieser Leitfaden ist in zwei Teile gegliedert:

Teil 1: Einrichtung und Vorbereitung für die Feinabstimmung [dieser Blog]

Erforderliche Module installieren und laden.
Schritte zum Erhalt der Genehmigung für die Modelle der Llama 2-Serie von Meta.
Hugging Face CLI und Benutzerauthentifizierung einrichten.
Vorab trainierte Modelle und die zugehörigen Tokenizer laden.
Trainingsdatensätze laden
. Trainingsdatensätze für die Feinabstimmung des Modells vorverarbeiten

Teil 2: Feinabstimmung und Open Source

Konfigurieren Sie die PEFT-Methode (Parameter Efficient Fine-Tuning) QLoRA für eine effiziente Feinabstimmung.
Feinabstimmung des vorab trainierten Modells.
Speichern Sie das feinabgestimmte Modell und den zugehörigen Tokenizer.
Verschieben Sie das feinabgestimmte Modell auf Hugging Face Hub, damit es öffentlich
genutzt werden kann. Wenn Sie es auf Google Colab ausführen, gehen Sie zu Laufzeiten > Laufzeittyp ändern. Ändern Sie den Hardwarebeschleuniger auf GPU. Ändern Sie den GPU-Typ auf T4. Ändern Sie die Laufzeitform auf hohen RAM.

Lasst uns beginnen!

Installieren Sie die erforderlichen Bibliotheken

Zuerst installieren wir einige erforderliche Bibliotheken.

!pip install -q accelerate==0.21.0 --progress-bar off
!pip install -q peft==0.4

おすすめ

転載: blog.csdn.net/iCloudEnd/article/details/132635128