当前位置: 首页 > news >正文

有网站域名及空间 别人帮建网站网络营销和电子营销的区别

有网站域名及空间 别人帮建网站,网络营销和电子营销的区别,校园生活网页设计,河北网站建设模板论文地址:https://arxiv.org/pdf/2408.15545 引言 科学文献的理解对于提取目标信息和获取洞察至关重要,这显著推动了科学发现。尽管大语言模型(LLMs)在自然语言处理方面取得了显著成功,但在科学文献理解方面仍面临挑战…

论文地址:https://arxiv.org/pdf/2408.15545

引言

科学文献的理解对于提取目标信息和获取洞察至关重要,这显著推动了科学发现。尽管大语言模型(LLMs)在自然语言处理方面取得了显著成功,但在科学文献理解方面仍面临挑战,主要由于缺乏科学知识和对特定科学任务的不熟悉。为了开发专门用于科学文献理解的LLM,我们提出了一种混合策略,结合持续预训练(CPT)和监督微调(SFT),以同时注入科学领域知识和增强特定任务的指令遵循能力。

1. 持续预训练(CPT)阶段

1.1 格式与语法校正

在从PDF文档中提取文本时,常常会引入许多格式和语法错误。为了解决这一问题,我们使用Llama3-8B-Instruct模型来校正这些错误。以下是一个校正前后的示例:

校正前的文本:

Highly p e n e t r a t i n g radiation, such as $\gamma$ -rays or fast electorns, deposits ener gy   
throughout the solid t a r g e t material. Gas production occurs w i t h i n the solid phase and must d i f f u s e to the surface to be observed.

校正后的文本:

Highly penetrating radiation, such as $\gamma$ -rays or fast electrons, deposits energy throughout the solid target material. Gas production occurs within the solid phase and must diffuse to the surface to be observed.

格式与语法校正示例

1.2 CPT质量过滤

为了确保训练语料的高质量,我们使用Llama3-70B-Instruct模型对50k个样本进行评分,并根据评分结果过滤掉质量较低的25%数据。以下是评分分布图:

CPT数据评分分布

2. 监督微调(SFT)阶段

2.1 指令生成

为了生成多样化的科学指令,我们设计了一个三步流程:

  1. 领域关键词概率表:收集高影响力论文并统计词频,生成领域关键词概率表。
  2. 科学任务列表:编译一个包含各种科学任务的任务列表。
  3. 指令生成:根据关键词和任务描述生成科学上下文和相应的问答对。

以下是一个生成表格提取任务的示例:

生成表格提取任务的提示:

I need synthetic training data for training a machine learning model that extracts tables from text correctly. The data should be formatted in JSON, with each entry containing ”text” and ”answer” attributes. You should generate a paragraph that includes the keywords: $\{\{\mathrm{keywords}\}\}$ .   
The ”text” part must contain enough information for the table to be extracted! In ”text” part, You must you include a table description in latex format.

生成的示例:

{
”text”: ”In recent studies regarding material science, the crmatrix has shown significant importance in understanding fracture behaviors. The following Table 1 presents a schematic illustration of the enthalpy changes observed during the different fracture phases.”,
”answer”: ”Material,Initial Enthalpy (kJ/mol),Final Enthalpy (kJ/mol),Fracture Phase   
Material A,25.4,47.8,Brittle   
Material B,22.3,45.0,Ductile   
Material C,28.9,50.2,Semi-brittle”
}

2.2 指令质量控制

为了确保生成指令的质量,我们采用启发式去重和基于LLM的过滤方法。以下是评估示例:

SciLitIns质量评估

3. 实验结果

3.1 基准模型性能

SciLitLLM在科学文献理解任务上表现优异,7B和14B版本的模型在SciAssess和SciRIFF基准测试中均取得了领先的成绩。具体来说,SciLitLLM-7B在SciAssess上比第二好的模型高出4.0%,在SciRIFF上高出10.1%。

3.2 消融研究

我们进行了消融实验来验证CPT阶段、SFT数据配方和指令质量过滤的有效性。结果表明,CPT阶段对提高科学文献理解能力至关重要,而SFT阶段使用SciLitIns数据集也能显著提升模型性能。

模型性能对比

4. 结论与未来工作

本文介绍了SciLitLLM,一个专门用于科学文献理解的模型。通过CPT和SFT的结合,我们成功地提升了模型在科学领域的知识基础和指令遵循能力。未来的工作将致力于扩展训练数据的多样性和质量,并探索更高效的方法进行领域特定知识注入和高品质指令生成。

参考文献

  1. Cai, H., Cai, X., Chang, J., Li, S., Yao, L., Wang, C., … & Ke, G. (2024). Sciassess: Benchmarking LLM proficiency in scientific literature analysis. arXiv preprint arXiv:2403.01976.
  2. Wadden, D., Shi, K., Morrison, J., Naik, A., Singh, S., Barzilay, N., … & Cohan, A. (2024). Sciriff: A resource to enhance language model instruction-following over scientific literature. arXiv preprint arXiv:2406.07835.

希望这篇文章对你有所帮助!如果你有任何问题或建议,欢迎在评论区留言。

http://www.yayakq.cn/news/403659/

相关文章:

  • 吉林天宇建设集团网站市场监督管理局是什么单位
  • 上海网站建设哪中国互联网巨头排名
  • 青海网站开发 建设手机网站用什么语言开发
  • wordpress 终极优化做神马网站优化排名软
  • 企业网站源码进一品资源网楚州网站开发
  • 企业 手机网站微信公众号定位开发
  • 旅游电子商务网站的建设方案巨耀网站建设公司
  • 龙华民治网站设计公司详情页设计策划
  • 网站在线留言响应式网站的字体设置
  • 洛阳制作网站的公司课程网站的设计
  • h5制作网站公司嘉定网站设计制作报价
  • 网站如何做抖音推广网页版qq农场登录入口
  • 网站原创文章规范淄博周村网站建设哪家好
  • 搭建租号网的网站免费网站的app
  • 2015网站备案教程网页设计与网站开发
  • 手机网站淘宝客怎么做免费saascrm
  • 阳泉 网站建设合作南京创网网络技术有限公司
  • 做网站 乐清给几个网站谢谢
  • 中山高端网站建设公司移动无线宽带怎么续费
  • 网站开发和界面的区别wordpress伪静态html
  • 川沙网站建设怎么用云校建设学校网站
  • 武威做网站的公司太仓住房和城乡建设局网站
  • 建设网站服务器怎么弄网站集约化建设 要求
  • 建设网站怎样提要求2024年度关键词
  • 餐饮公司网站建设策划书网站左侧悬浮导航代码
  • 新建门户网站的建设自查百度商桥代码怎么添加到网站
  • 免费网站排名优化在线溧阳网站建设报价
  • 重庆网站设计开发网站开发好学
  • 广东网站建设公司艺术字体在线生成器转换器
  • 模板网站建设的公司wordpress 4.9.5 太卡