Wenn ein Gelehrter Daten haben möchte, wie kann er es dann Diebstahl nennen? Wenn Sie es Borrow nennen möchten, können Sie es auch Self-Instruct nennen.

Das zweite Kapitel von Borrowing the East Wind

Kapitel 1 Portal: Ich kann mir nicht vorstellen, wie cool es wäre, Trainingsdaten automatisch zu kennzeichnen (qq.com)

      Im vorherigen Artikel wurde hauptsächlich Auto Label vorgestellt, bei dem es sich um eine euphemistischere Ausleihe und umständliche Ausleihe handelt. Darüber hinaus konzentriert sich Auto Label bei den ausgeliehenen Daten immer noch auf das traditionelle NLP-Aufgabentraining wie Klassifizierung, Standard-QA usw. Wie wir alle wissen, heißt es jetzt GenAI. Wenn Sie dies nicht tun, werden Sie den Leuten nicht gerne Hallo sagen. Können wir also die Trainingsdaten von GenAI direkt verleihen?

       Die Antwort lautet eindeutig: Ja, wir müssen nicht nur „leihen“, sondern auch kräftig „leihen“!

      Heute werde ich eine Methode zum „Ausleihen“ von Daten vorstellen. Es ist natürlich nicht die einzige, aber ich denke, sie ist relativ einfach und hat sich in der Praxis bewährt. Diese Methode ist Self-Instruct.

       Papieradresse:

       2212.10560.pdf (arxiv.org)

      Wenn Sie die relevanten Artikel gelesen haben, müssen Sie wissen, dass dies die Methode von Alpaca ist, Daten zu erhalten. Hier, für diejenigen, die es nicht gelesen haben, lasst uns bekannt machen, was Alpaca ist&

Acho que você gosta

Origin blog.csdn.net/kingsoftcloud/article/details/134995174
Recomendado
Clasificación