当前位置: 首页 > news >正文

网站开发软件启动搜索引擎关键词优化技巧

网站开发软件启动,搜索引擎关键词优化技巧,博罗营销网站制作,网站网站开发者犯法吗Contents IntroductionMethodExperimentsReferences Introduction CoT 推理可以有效提升 LLM 推理能力,但 few-shot prompting 无法发挥 CoT 的全部潜力,训练能够生成中间推理步骤 (i.e., rationale) 的 LLM 又需要大量人工标注 rationale,为…

Contents

  • Introduction
  • Method
  • Experiments
  • References

Introduction

  • CoT 推理可以有效提升 LLM 推理能力,但 few-shot prompting 无法发挥 CoT 的全部潜力,训练能够生成中间推理步骤 (i.e., rationale) 的 LLM 又需要大量人工标注 rationale,为此作者提出 STaR (Self-Taught Reasoner),可以仅利用少量含有 rationale 的标注数据和大量不含 rationale 的标注数据,迭代式地生成大量含有 rationale 的数据集并基于此训练能够生成 rationale 的 LLM,有效提升 LLM 的复杂推理能力

Method

在这里插入图片描述

  • Rationale Generation Bootstrapping (STaR Without Rationalization). 给定预训练 LLM M M M 和 small prompt set P = { ( x i p , r i p , y i p ) } i = 1 P \mathcal{P}=\{(x_{i}^{p},r_{i}^{p},y_{i}^{p})\}_{i=1}^{P} P={(xip,rip,yip)}i=1P (e.g. P = 10 P = 10 P=10),其中 x x x 为问题, r r r 为中间推理步骤, y y y 为问题回答,可以利用 few-shot prompting 为一个更大的数据集 D = { ( x i , y i ) } i = 1 D \mathcal D=\{(x_i,y_i)\}_{i=1}^D D={(xi,yi)}i=1D 生成中间推理步骤 r ^ i \hat r_i r^i 和答案 y ^ i \hat y_i y^i,这样就得到了含有中间推理步骤的大规模数据集。此外,作者只保留其中 y ^ i = y i \hat y_i=y_i y^i=yi 的样本,因为这些样本对应的中间推理步骤质量总体来说会更高一些,由此得到 filtered dataset,在此数据集上微调 M M M 得到可以直接生成中间推理步骤的 LLM. 上述步骤为 1 个循环,STaR 会重复上述循环多次,每次都用上一轮循环中得到的最新的生成中间推理步骤的 LLM M n − 1 M_{n-1} Mn1 D \mathcal D D 生成中间推理步骤得到 filtered dataset,然后在该数据集上基于预训练 LLM M M M 重新训练得到新的生成中间推理步骤的 LLM M n M_n Mn;上述优化过程可以被近似看作 policy gradient,其中 J ( M , X , Y ) J(M,X,Y) J(M,X,Y) 为 total expected reward across the dataset
    在这里插入图片描述
  • Rationalization. 上述步骤还有一个缺点,就是如果 D \mathcal D D 中某些难样本始终无法生成正确答案,那么这些样本将永远无法加入 filtered dataset,无法被有效学习;为此,作者给生成错误答案的样本 prompt 中加入提示正确答案的 hint 来引导模型生成中间推理步骤和最终答案
    在这里插入图片描述
  • STaR.
    在这里插入图片描述

Experiments

  • Symbolic Reasoning: Results on Arithmetic.
    在这里插入图片描述在这里插入图片描述
  • Natural Language Reasoning: Commonsense Question Answering.
    在这里插入图片描述
  • Mathematical Reasoning in Language: Grade School Math.
    在这里插入图片描述

References

  • Zelikman, Eric, et al. “Star: Bootstrapping reasoning with reasoning.” Advances in Neural Information Processing Systems 35 (2022): 15476-15488.
http://www.yayakq.cn/news/299873/

相关文章:

  • 网站后台软件可以自己做吗手机网站开发看什么书
  • 建设部网站水利造价师贵阳市做网站的公司有哪些
  • thinkphp 网站下载wordpress 绑定二级域名
  • access做调查表网站wordpress h1 h2
  • 餐饮行业网站建设风格聊城网站建设:推广聊城博达
  • 自己做网站处理图片用什么软件下载10元备案域名购买
  • 星月网络公司做的网站东莞城乡住建局
  • 怎么建立网站赚钱网站开发公司 深圳
  • 做音乐头像网站泰达建设集团网站
  • 网站开发及设计演讲海报深圳比较好的公司
  • 什么是建设型的网站二级网站建设管理制度
  • 广州站到广州南站地铁要多久用织梦同时做两个网站
  • 汉语网站建设心得东莞市有多少个镇
  • 潍坊网站建设套餐网站中的滑动栏怎么做的
  • 制作网页的模板的网站wordpress后台地址
  • 重庆企业网站备案要多久时间住房和建设局官网
  • .net 网站优化新郑网站开发
  • 当今弹幕网站建设情况猪八戒包装设计
  • 优化好的网站做企业网站网站是通过超链接
  • 永久免费白嫖云服务器南昌做seo的公司有哪些
  • 公司网站兰州建设需要多少钱国外做多媒体展览的网站
  • 网站建设类合同范本网站上的支付链接该怎么做
  • 毕业设计做网站怎样做特别一点深圳市住房和建设局工程交易平台
  • 郑州建设工程协会网站网站建设公司多少钱
  • 可以挣钱的网站淘客做网站有必要吗
  • 郑州网站建设铁哥们怎么免费创建一个网站
  • 做电影网站用什么软件叫什么名字吗odoo与wordpress
  • 做下载网站用阿里云的什么产品外国网站后台
  • 母婴网站模板dede百度搜索推广怎么做
  • 产品网站定制网站建站