herunterladen
Link: https://pan.baidu.com/s/1cb24WW2dihtRpMz4giMxyw
Extraktionscode: k3xu
Dekomprimierungspasswort: Navigator Weiniao
Quellcode des Projekts: https://github.com/Plachtaa/VITS-fast-fine-tuning/tree/main
verwenden
Nach dem Entpacken legen Sie die vorbereitete Stimme in einem Ordner in diesem Verzeichnis ab. Sie muss im WAV-Format vorliegen und die Dauer beträgt normalerweise eine Stunde.
Lassen Sie mich Ihnen sagen, wie ich es gemacht habe. Ich habe es direkt im Clipping-WAV-Format exportiert und es dann mit einem Schneidewerkzeug ausgeschnitten.
Link: https://pan.baidu.com/s/1ArPPTDmZpq75eHZsyaEnjA
Extraktionscode: 08zf
Dekomprimierungspasswort: cuijiahua.com
Gehen Sie zum Audiosegmentierungsverzeichnis und klicken Sie, um das Skript auszuführen
Gehen Sie zur Benutzeroberfläche, geben Sie den Audiodateipfad und den geteilten Ausgabepfad ein. Berühren Sie nichts anderes, klicken Sie einfach auf Start!
Legen Sie dann die segmentierten Daten an der zuvor genannten Stelle ab
Klicken Sie auf Vorverarbeitung,
[ ]
Geben Sie einfach die Anweisung ein, y stimmt zu, ge Name, 0 verwendet keine Hilfsdaten
Warten Sie anschließend, bis die Verarbeitung abgeschlossen ist. Nachdem die Verarbeitung abgeschlossen ist, wird sie angezeigt. Drücken Sie eine beliebige Taste, um fortzufahren. Verlassen Sie das Terminal einfach mit x, klicken Sie auf „Training starten“ und geben Sie die Anzahl der Trainingsrunden ein. Sie können eingeben Zuerst 200. Wenn der Effekt nicht gut ist, können Sie mit dem Training fortfahren. Klicken Sie nicht auf „Start“. Beim Training wird die Gewichtsdatei gelöscht und das Training durch Eingabe von 300 fortgesetzt, was bedeutet, dass 100 Epochen lang trainiert werden, basierend auf den ursprünglichen 200.
Klicken Sie, um mit der Argumentation zu beginnen, geben Sie Chinesisch ein, klicken Sie auf „Generieren“ und laden Sie es herunter, wenn Sie der Meinung sind, dass es in Ordnung ist.
Grundsätzlich abgeschlossen:
Referenz: Navigator Weiniao