当前位置: 首页 > news >正文

绥化市网站建设网站建设需要矢量文件

绥化市网站建设,网站建设需要矢量文件,上海seo培训,站长工具seo综合查询网研究背景 论文针对的主要问题是如何将预训练的大型语言模型(LLMs)适应特定领域的检索增强生成(RAG)。这些模型通常在广泛的文本数据上进行预训练,已经表现出在广义知识推理任务上的优越性能。然而,在特定领…

研究背景

论文针对的主要问题是如何将预训练的大型语言模型(LLMs)适应特定领域的检索增强生成(RAG)。这些模型通常在广泛的文本数据上进行预训练,已经表现出在广义知识推理任务上的优越性能。然而,在特定领域,如法律、医学或最新新闻等,普遍的知识推理不足以满足精确性的要求,因此需要对这些模型进行适应性调整以增强其在这些领域内的应用性能。

研究目标

研究的主要目标是通过新的训练方法——RAFT(Retrieval Augmented Fine Tuning)提高LLMs在特定领域的性能。RAFT方法旨在通过链式思考风格的答案生成来提高模型对问题的理解和回答质量,同时确保模型能够有效地从相关文档中提取信息,并忽视那些无助于问题解答的干扰文档。

相关工作

研究背景部分详细讨论了现有的技术和挑战,特别是在RAG和监督式微调(SFT)的应用上。现有的RAG方法允许模型在回答问题时引用文档,但这些方法未能利用固定领域设置中的学习机会。监督式微调提供了学习文档中更通用模式的机会,更好地与结束任务和用户偏好对齐,但现有的微调方法在测试时未能考虑检索过程中的不完美。

方法论

数据处理

在RAFT中,训练数据的准备非常关键。每个数据点包括一个问题(Q)、一组文档(Dk),以及一个从文档中生成的链式思考风格的答案(A*)。这些文档分为“oracle”文档(D*),即可以从中推导出问题答案的文档,和“干扰”文档(Di),即不包含答案相关信息的文档。示例如下:
在这里插入图片描述

解决方案

RAFT的核心是一个修改版的一般指令微调方法。通过精心设计的训练数据和模型微调过程,模型被训练为基于问题和提供的文档来生成答案,同时忽略那些干扰文档。这种方法的目标是提高模型在特定域内的性能,即在域特定的开放书本设置中更有效地使用RAG。
在这里插入图片描述

实验

实验设计

实验部分使用多个数据集来评估RAFT的性能,并将其与其他基线模型进行比较,例如LlaMA2-7B聊天模型和域特定的微调模型。这些数据集包括自然问题(NQ)、Trivia QA和HotpotQA等,涵盖从通用知识到特定领域的不同类型。

数据:

数据描述
PubMed医学QA问题。(二分类问题)
Natural Questions (NQ)通用领域
HotpotQA通用领域
Trivia QA通用领域
HuggingFace编程的api领域
Torch Hub编程的api领域
TensorFlow Hub编程的api领域

实验结论

  1. RAFT在多个评估任务上表现出色,尤其是在包含干扰文档的设置中。实验结果显示,与其他基线相比,RAFT在提取信息和处理干扰文档方面具有更高的鲁棒性和准确性。
    

在这里插入图片描述
注:DSF是指对LlaMA2-7B-chat直接进行SFT(query-answer,预测时没有参考内容),预测时直接输入问你题。
2. 有了思维链,结合推理链不仅可以引导模型找到答案,还可以丰富模型的理解,从而提高整体准确性。 在实验中,整合思想链显着增强了训练的稳健性。
在这里插入图片描述
3. 训练集中适当包含一定比例的不相关文档,会提高性能,但数量并不是绝对的,需要看具体的数据集,如在NQ数据集上,正负配比是1:3,HotpotQA数据上是1:1。

在这里插入图片描述

参考资料

  • 原文
  • 代码
http://www.yayakq.cn/news/930454/

相关文章:

  • 绍兴市科信建设工程检测中心网站创业商机
  • 网页版游戏网站做教育培训网站需要资质么
  • 化妆品销售网站开发与设计网站建设需要技术
  • 网站广告轮播代码新媒体运营基础知识
  • 网站搭建平台源码公司名称变更说明函
  • 东莞有哪些好的网站建设公司网站数据库是干什么的
  • 新民网站建设价格咨询html做的图片网站
  • 百度站长工具添加不了站点wordpress 发送邮件 名称
  • 网站建设分什么行业wordpress 当前位置 插件
  • 专业做网站建设 昆山郑州影视公司
  • 永久免费网站空间创新创业大赛项目计划书
  • asp.net网站开发代码做网站需要自己上传产品吗
  • 北京新闻媒体网站seo评测
  • 重庆做网站怎么做呀做网站都需要哪些知识
  • 网站栏目相关内容在哪采集啊青海省住房和城乡建设厅网站
  • 保定网站设计多少钱网站怎么算抄袭
  • 二类电商用网站怎么做H5页面鄂州做网站的公司
  • 网站推广前景怎么样中疾控新冠最新消息
  • 怎样免费注册网站域名沈阳餐饮网站建设
  • asp.net 企业官网网站 源码 多风格 多模板 多皮肤做招商类型的网站
  • 网上做任务挣钱的网站公司免费网站域名注册
  • 汕尾营销网站建设海口网络公司网站建设
  • 怎么做公司网站seo电影免费在线观看
  • 鄱阳电商网站建设常见的o2o平台有哪些
  • 手机网站cms 下载自适应网站开发工具
  • 武安专业做网站access数据库创建网站
  • 中国企业网官方网站下载专门做问卷调查的一个网站
  • 简述网站建设的流程做成一个页面北京响应式网站建设推荐
  • 网站 用户体验的重要性企业网站源码进一品资源网
  • 进入福建省建设干部培训中心网站常规做网站要在工信部认证吗