当前位置: 首页 > news >正文

怎么做国际购物网站安卓优化大师清理

怎么做国际购物网站,安卓优化大师清理,ytwzjs烟台网站建设,学勇建站论文速读|Sneaking Syntax into Transformer Language Models with Tree Regularization 论文信息: 简介: 本文的背景是基于人类语言理解的组合性特征,即语言处理本质上是层次化的:语法规则将词级别的意义组合成更大的成分的意义&…

论文速读|Sneaking Syntax into Transformer Language Models with Tree Regularization

论文信息:

简介:

        本文的背景是基于人类语言理解的组合性特征,即语言处理本质上是层次化的:语法规则将词级别的意义组合成更大的成分的意义,然后再组合成句子。然而,当前的神经模型,如变换器(Transformers),缺乏对这种树状结构的直接归纳偏差。尽管变换器在大规模数据上进行预训练以实现合理的泛化,但最新的研究表明,即使是最先进的大型语言模型(LLMs)仍然在组合性泛化方面存在困难,即在新环境中理解熟悉的词汇。因此,引入语法归纳偏差可能会在变换器语言模型中实现更稳健和数据高效的学习。

        本文的动机是基于以下几个方面:首先,人类语言处理的层次化特征表明,语法结构在语言理解中起着关键作用。其次,尽管变换器模型在处理大量数据时表现出色,但它们在组合性泛化方面仍存在不足。因此,本文旨在通过引入语法归纳偏差来增强变换器模型的语法泛化能力,同时保持模型的表达能力和推理效率。此外,本文还希望通过这种方法提高模型在少数据情况下的样本效率。

论文方法:

图片

        本文提出了一种名为TREEREG的方法,这是一种辅助损失函数,用于将输入句子的成分句法分析转换为对向量隐藏状态的一组可微分的正交性约束。

        TREEREG通过以下步骤实现:

        Span Contextual Independence Score (SCIN):对于任何跨度,通过量化独立性来定义SCIN。具体来说,对于一个跨度Si;j,其独立性通过其表示向量与上下文表示向量的正交性来衡量。

        TREEREG Loss:给定一个句子S,TREEREG损失(LTR)偏向于提高所有成分句法分析中的跨度的SCIN,同时降低其他跨度的SCIN。具体来说,对于一个成分Si;j,首先计算分割分数s(i, q, j),然后使用这些分数计算跨度级别的对数损失l(i,j)。LTR是所有成分的跨度级别损失l(i,j)的总和。

        恢复解析树:在推理过程中,可以使用自顶向下的贪婪解码算法从隐藏状态中恢复由TREEREG约束编码的唯一解析树。

论文实验:

图片

        实验部分涉及训练变换器语言模型(LMs)来执行两个诊断任务:时态变化(Tense Inflection, TI)和疑问句形成(Question Formation, QF)。这些任务是从PCFGs(概率上下文无关文法)中派生出来的。

        1)时态变化(TI):模型接收一个过去时态的输入,并需要生成相同输入的现在时态版本。评估指标是目标动词正确变化的比例。

         2)疑问句形成(QF):模型需要将一个陈述句转换为疑问句。评估指标是解码疑问句的第一个词的准确性。

        Table 1显示了在TI和QF任务上的评估结果,包括平均测试准确性(Avg. Acc.)、最佳测试准确性(Best Acc.)以及测试性能收敛所需的平均迭代次数(itr.)。

        时态变化(TI)

         Base LM:平均准确性为47.2%,最佳准确性为71.1%,平均收敛迭代次数为427k。

         TREEREG LM:平均准确性为90.4%,最佳准确性为98.3%,平均收敛迭代次数为391k。

        疑问句形成(QF)

        Base LM:平均准确性为42.1%,最佳准确性为66.9%,平均收敛迭代次数为460k。

        TREEREG LM:平均准确性为99.6%,最佳准确性为100.0%,平均收敛迭代次数为43k。

论文链接:

https://arxiv.org/abs/2411.18885

http://www.yayakq.cn/news/830084/

相关文章:

  • 免费申请网站网站优化qq群
  • 怎么弄网站关键词制作网站首页psd
  • 做外贸网站能用虚拟主机吗槐荫区网站建设
  • 怎么做网站赚钱软件wordpress源码系统下载地址
  • 网站模板 手机app展示免费推广选择推广途径与原因
  • 爱站seo工具包下载全球域名最贵的100个域名
  • 公司网站建设上海找谁php网站培训班
  • 东莞市做网站的最好的是哪家的国和建设集团网站
  • 东莞市住房和城乡建设厅网站竞赛网站建设风险评估
  • 网站建设优化一年赚几十万简单好看的logo图片
  • 怎么 网站 wordpresswordpress数据库出错
  • 东莞建设网站公司哪家好广告网站设计
  • 我在学校志愿队做网站的经历wordpress自定义文章类型分类模板
  • 石家庄网站seo优化用wordpress做广告收益
  • 怎样做QQ网站呢丹阳网站建设公司
  • 如何修改网站域名做旅游网站怎样
  • 做公众号的网站模板下载江阴房产网
  • 网站建设 服饰鞋帽如何卸wordpress
  • 汽车 营销 网站建设网站定制合同
  • 广州建立网站的公司班级网站建设开题报告
  • 网站制作与美育融合北京价格网站建设
  • 网站建设维修服务流程佛山企业网站建设特色
  • 请问哪个网站可以做当地向导雅虎做网站推广
  • 适合大学生做的兼职网站有哪些网站可以做章子吗
  • 买域名可以自己做网站吗中国建设银行官网站纪念币预约
  • 做同城网站还有机会吗自己做手机主题的软件
  • 最新淘宝客网站程序wordpress电子商务插件
  • 怎么参考已有网站做新站遵义app开发公司排名
  • 长沙seo网站建设苏州刚刚发生大事件
  • 哪里有网络推广公司关于优化培训