Chaîne de pensée de cohérence (L'AUTO-COHÉRENCE AMÉLIORE LE RAISONNEMENT DE LA CHAÎNE DE PENSÉE DANS LES MODÈLES DE LANGAGE)

aperçu

La chaîne de pensée a obtenu des résultats très significatifs sur de nombreuses tâches. Cet article propose un algorithme d'auto-cohérence pour remplacer l'algorithme de décodage glouton. Cette méthode échantillonne plusieurs ensembles de chaînes de pensée, puis une fois le modèle LLM généré, la réponse la plus cohérente est sélectionnée comme résultat final. La chaîne de pensée cohérente estime que les problèmes de raisonnement complexes nécessitent différentes façons de penser pour être résolus, afin d'obtenir la réponse finale et unique. Après vérification expérimentale, la chaîne de pensée cohérente a obtenu des améliorations significatives.

méthode

Insérer la description de l'image ici
L'idée d'une chaîne de pensée cohérente est très classique. Nous utilisons d'abord la méthode de la chaîne de pensée pour inciter le modèle, puis pour les réponses générées, nous n'utilisons pas de décodage glouton, mais laissons le modèle générer un processus de raisonnement et des réponses diversifiés, puis votez pour sélectionner la réponse cohérente. Le résultat le plus sexuel. La chaîne de pensée cohérente est très similaire à la pensée humaine : s'il existe plusieurs façons de penser qui peuvent obtenir la même réponse, alors la réponse a la plus grande probabilité d'être correcte. La chaîne de pensée cohérente résout le problème de la répétitivité et de la localité de la chaîne de pensée, et résout également dans une certaine mesure le problème du caractère aléatoire de la chaîne de pensée.
La chaîne de pensée cohérente a obtenu des résultats très significatifs sur la plupart des problèmes de raisonnement.

Je suppose que tu aimes

Origine blog.csdn.net/WitsMakeMen/article/details/133128793
conseillé
Classement