Das leistungsstärkste Text-to-Speech-Tool

Bild

herunterladen

Link: https://pan.baidu.com/s/1cb24WW2dihtRpMz4giMxyw
Extraktionscode: k3xu
Dekomprimierungspasswort: Navigator Weiniao

Quellcode des Projekts: https://github.com/Plachtaa/VITS-fast-fine-tuning/tree/main

verwenden

Nach dem Entpacken legen Sie die vorbereitete Stimme in einem Ordner in diesem Verzeichnis ab. Sie muss im WAV-Format vorliegen und die Dauer beträgt normalerweise eine Stunde.

Bild

Lassen Sie mich Ihnen sagen, wie ich es gemacht habe. Ich habe es direkt im Clipping-WAV-Format exportiert und es dann mit einem Schneidewerkzeug ausgeschnitten.

Link: https://pan.baidu.com/s/1ArPPTDmZpq75eHZsyaEnjA
Extraktionscode: 08zf
Dekomprimierungspasswort: cuijiahua.com

Gehen Sie zum Audiosegmentierungsverzeichnis und klicken Sie, um das Skript auszuführen

Bild

Gehen Sie zur Benutzeroberfläche, geben Sie den Audiodateipfad und den geteilten Ausgabepfad ein. Berühren Sie nichts anderes, klicken Sie einfach auf Start!

Bild

Legen Sie dann die segmentierten Daten an der zuvor genannten Stelle ab

Bild

Klicken Sie auf Vorverarbeitung,

[ Bild]Fügen Sie hier eine Bildbeschreibung ein

Geben Sie einfach die Anweisung ein, y stimmt zu, ge Name, 0 verwendet keine Hilfsdaten

Warten Sie anschließend, bis die Verarbeitung abgeschlossen ist. Nachdem die Verarbeitung abgeschlossen ist, wird sie angezeigt. Drücken Sie eine beliebige Taste, um fortzufahren. Verlassen Sie das Terminal einfach mit x, klicken Sie auf „Training starten“ und geben Sie die Anzahl der Trainingsrunden ein. Sie können eingeben Zuerst 200. Wenn der Effekt nicht gut ist, können Sie mit dem Training fortfahren. Klicken Sie nicht auf „Start“. Beim Training wird die Gewichtsdatei gelöscht und das Training durch Eingabe von 300 fortgesetzt, was bedeutet, dass 100 Epochen lang trainiert werden, basierend auf den ursprünglichen 200.

Bild

Klicken Sie, um mit der Argumentation zu beginnen, geben Sie Chinesisch ein, klicken Sie auf „Generieren“ und laden Sie es herunter, wenn Sie der Meinung sind, dass es in Ordnung ist.

Bild

Grundsätzlich abgeschlossen:

Referenz: Navigator Weiniao

Supongo que te gusta

Origin blog.csdn.net/weixin_62403633/article/details/132527993
Recomendado
Clasificación