当前位置: 首页 > news >正文

好看的手机网站模板免费下载网站建设推广一对一服务

好看的手机网站模板免费下载,网站建设推广一对一服务,苏州网站公司,六安搜索引擎优化方法BGE的技术亮点: 高效预训练和大规模文本微调;在两个大规模语料集上采用了RetroMAE预训练算法,进一步增强了模型的语义表征能力;通过负采样和难负样例挖掘,增强了语义向量的判别力;借鉴Instruction Tuning的…

BGE的技术亮点:

  • 高效预训练和大规模文本微调;
  • 在两个大规模语料集上采用了RetroMAE预训练算法,进一步增强了模型的语义表征能力;
  • 通过负采样和难负样例挖掘,增强了语义向量的判别力;
  • 借鉴Instruction Tuning的策略,增强了在多任务场景下的通用能力。

数据集的构成:
在这里插入图片描述

RetroMAE预训练

主要思想是:encoder用小一点的mask rate得到sentence embedding,然后decoder用大一点的mask rate结合encoder得到的sentence embedding进行重构

在这里插入图片描述
此外,为了使得每个token使用的context信息不同,RetroMAE还使用了增强解码的方法

在这里插入图片描述

  • 解码的时候每一行都带,上下文信息和位置信息
    在这里插入图片描述
    在这里插入图片描述

微调

  • 主要通过对比学习和Instruction Tuning的思想

对比学习是一种训练模型的方法,通过比较正例和反例来学习数据的表示。

  • 输入数据的格式:模型接受三元组格式的数据作为输入,包括一个查询(query),一个正例(positive),和一个反例(negative)。

  • in-batch negatives 策略:除了上述三元组中的反例外,他们还采用了“in-batch negatives”策略,意思是在同一个批次的数据中,使用其他数据作为额外的反例。

  • cross-device negatives sharing method:这是一种在不同的GPU之间共享反例的方法,目的是大大增加反例的数量。

  • 训练硬件和参数:使用了48个A100(40G)的GPU进行训练。批次大小为32,768,因此每个查询在批次中有65,535个反例。使用了AdamW优化器,学习率为1e-5。对比损失的温度为0.01。

  • 在训练中为检索任务的查询添加了instruction。 对于英语,指令是Represent this sentence for searching relevant passages: ; 对于中文,指令是为这个句子生成表示以用于检索相关文章:. 在评测中,针对段落检索任务的任务需要在查询中添加指令,但不需要为段落文档添加指令。

http://www.yayakq.cn/news/897386/

相关文章:

  • 网站页面的组成优秀电商设计网站有哪些内容
  • 网站后台忘记账号密码网站长春网站建设
  • 成都专门做网站的公司外网设计素材网站
  • 西青集团网站建设公司网站实用性
  • 西安营销型网站asp手机网站统计代码
  • 小兔自助建站怎么上传自己的网站
  • 网站开发需要什么知识东莞网站设计制作
  • 企业网站开发报价表哪个网站做的w7系统好
  • 有些网站仿出问题网络推广方案百度百科
  • 昆山建筑行业网站做电影网站赚钱么
  • 网站建设合同属于什么印花税微信小程序设计
  • 做网站赚广告费好做吗wordpress建商城教程
  • 手机网站仿站教程wordpress4.7.4+for+sae
  • 福田网站建设方案软件工程课程设计
  • 商务网站开发的流程免费获取资源的公众号
  • 网站建设三网公司网站建设服务费计入什么科目
  • 做十个网站北京网站建设上石榴汇
  • 网站建设需要做哪些工作想建立自己的网站怎么建立
  • dtcms网站开发教程网站建设代码模板
  • 做软装设计能用到的网站有哪些网站建设招标
  • 哪个公司做网站优推宝可以做自己网站吗
  • 做网站ps笔记本电脑网站开发的基本功能
  • 网站模板怎么使用网页设计与网站建设 郑州大学
  • 萧山做网站h5的制作步骤
  • 建设牌安全带厂家网站网页设计个人简历代码
  • 公司手机网站建设深圳网站开发怎么样
  • 网站建设酷万网络互联网招聘网站排行
  • 天津网站排名优化苏州网站营销公司简介
  • 淘宝联盟做网站深圳餐饮网站建设
  • 做网站最快多久网站 手机 微信 app