SolidUI社区-提示词自我一致性

背景

随着文本生成图像的语言模型兴起,SolidUI想帮人们快速构建可视化工具,可视化内容包括2D,3D,3D场景,从而快速构三维数据演示场景。SolidUI 是一个创新的项目,旨在将自然语言处理(NLP)与计算机图形学相结合,实现文生图功能。通过构建自研的文生图语言模型,SolidUI 利用 RLHF (Reinforcement Learning Human Feedback) 流程实现从文本描述到图形生成的过程。

项目地址: https://github.com/CloudOrc/SolidUI

项目镜像地址: https://gitee.com/CloudOrc/SolidUI

社区官网: https://website.solidui.top

官网项目地址:https://github.com/CloudOrc/SolidUI-Website

自我一致性介绍

自我一致性是提示工程中的一种更高级的技术,由Wang等人在2022年提出。它旨在改进链式思维提示中使用的贪婪解码方法,生成更加一致和准确的结果。

https://arxiv.org/pdf/2203.11171.pdf

工作原理

自我一致性的工作原理是通过少样本链式思维采样多个不同的推理路径,然后比较所有生成的答案,选择最一致的一个作为最终结果。具体来说,它会针对一个推理任务,使用链式思维生成多个候选答案。然后选择出现频率最高、最符合逻辑的答案,而不是简单依据第一个生成的答案。

示例

我们可以看一个算术推理的例子。“当我6岁时,妹妹一半年龄,现在我70岁,妹妹多大?” 使用简单链式思维可能会推出35岁,但这是错误的。自我一致性会采样类似的算术推理示例,链路多种可能的推理路径。最后发现67岁这个答案出现最多,因此选择67岁作为最终结果。

## 输入
小明有5个苹果,他把两个苹果给了妈妈,请问小明还剩下多少个苹果?
当我6岁时,妹妹一半年龄,现在我70岁,妹妹多大?

## 输出
好的,让我来思考一下:
小明有5个苹果,给了妈妈2个,所以小明还剩下5 - 2 = 3个苹果。

对于第二个问题:
我现在70岁,当我6岁时,妹妹一半年龄,也就是3岁。
那么我每长1岁,妹妹也长1岁。
我从6岁到70岁,一共长了70 - 6 = 64岁。
那么妹妹也从3岁长到3 + 64 = 67岁。

所以答案是:
小明还剩3个苹果。
我妹妹现在67岁。

直接输入第二问题,妹妹多大,计算失败,找个简单的例子小明苹果问题,让模型学会这种思维方式,根据链路,解决完第一个问题后,再计算第二问题,自我一致性,保证推理结果。

结语

自我一致性能够纠正链式思维的错误,通过采样多个推理路径,选择最一致的答案,来生成更加准确可靠的输出。这是提示工程中较高级的技术之一。

如果成为贡献者

  • 官方文档贡献。发现文档的不足、优化文档,持续更新文档等方式参与社区贡献。通过文档贡献,让开发者熟悉如何提交PR和真正参与到社区的建设。参考攻略:https://github.com/CloudOrc/SolidUI/discussions/54
  • 代码贡献。我们梳理了社区中简单并且容易入门的的任务,非常适合新人做代码贡献。请查阅新手任务列表:https://github.com/CloudOrc/SolidUI/issues/12
  • 内容贡献:发布SolidUI开源组件相关的内容,包括但不限于安装部署教程、使用经验、案例实践等,形式不限,请投稿给小助手。例如:https://github.com/CloudOrc/SolidUI/issues/10
  • 社区答疑:积极在社区中进行答疑、分享技术、帮助开发者解决问题等;
    其他:积极参与社区活动、成为社区志愿者、帮助社区宣传、为社区发展提供有效建议等;

猜你喜欢

转载自blog.csdn.net/qq_19968255/article/details/132219525
今日推荐