当前位置: 首页 > news >正文

吉林省建设工程质监站网站网站放视频代码

吉林省建设工程质监站网站,网站放视频代码,学网站建设app,用记事本做电影介绍的网站1、masked_tokens[]、token_masks[]介绍 masked_tokens和token_masks两个列表用于存储mask处理后的token(分词)结果和对应的mask标志。 masked_tokens列表存储经过mask处理后的分词结果。 token_masks列表存储与每个分词结果对应的mask标志。 2、示例…

1、masked_tokens[]、token_masks[]介绍 

masked_tokenstoken_masks两个列表用于存储mask处理后的token(分词)结果和对应的mask标志。

  • masked_tokens列表存储经过mask处理后的分词结果。

  • token_masks列表存储与每个分词结果对应的mask标志。

2、示例说明:

例如一个 masked_tokens[0]是:

['C', 'N', '[C@H]', '(', 'c', '1', 'c', 'c', '(', 'Br', ')', 'c', 'c', 'c', '1', 'F', ')', '<MASK>', '(', '<MASK>', '<MASK>', '<MASK>', 'C', '1']

token_masks[0]是:

[False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, True, True, True, False, False]

它们的长度都是28 

3、代码示例:

下面代码就是先对句子进行了token处理,然后进行了mask处理:

# 通过正则匹配对第一个句子(sents1)进行分词,得到tokens。
tokens = self._regex_match(sents1)
# 对tokens进行mask处理
m_tokens, token_masks = self._mask_tokens(tokens, empty_mask=mask)

4、mask的类型

span mask

    def _mask_span(self, ts):curr_token = 0masked = []token_mask = []mask_bools = [True, False]weights = [self.mask_prob, 1 - self.mask_prob]sampled_mask = random.choices(mask_bools, weights=weights, k=len(ts))while curr_token < len(ts):# If mask, sample from a poisson dist to get length of maskif sampled_mask[curr_token]:mask_len = torch.poisson(torch.tensor(self.span_lambda)).long().item()masked.append(self.mask_token)token_mask.append(True)curr_token += mask_len# Otherwise don't maskelse:masked.append(ts[curr_token])token_mask.append(False)curr_token += 1return masked, token_mask

随机对某些位置进行mask,从泊松区取样得到mask的长度,mask前后序列的长度可能会发生变化

replace mask

    def _mask_replace(self, ts):mask_bools = [True, False]weights = [self.mask_prob, 1 - self.mask_prob]token_mask = random.choices(mask_bools, weights=weights, k=len(ts))masked = [self._mask_token(ts[i]) if m else ts[i] for i, m in enumerate(token_mask)]return masked, token_mask

根据权重Weight随机对某些位置进行mask,mask前后序列的长度不会发生变化

权重Weight:例如,如果设定 self.mask_prob = 0.7,则掩码标记 True 的权重为 0.7,掩码标记 False 的权重为 0.3

http://www.yayakq.cn/news/488436/

相关文章:

  • 深圳做网站的网住房和城乡建设厅证书查询网
  • 做科研交流常用的网站获取网站后台地址
  • 简易个人网站模板阿里云网站建设官方自营店
  • 大同网站建设公司奥创微信管理系统
  • 一个企业可以备案几个网站介绍小说的网站模板
  • 南京电器网站建设腾讯企业邮箱登录入口手机版下载
  • wordpress建网站视频淘宝免费推广的方式有哪些
  • 门户网站开发哪家好wordpress如何重新连接数据库
  • 做网站智能工具天津做网站哪家好
  • 网站建设 有必要吗网站职位推荐怎么做
  • flask 网站开发广州制造业网络营销
  • 自己做一个网站一年的费用奉贤网页设计
  • 锦州网站推广坪山网站建设设计
  • 模仿的网站做一样违法吗网站 二级分类
  • 公司网站服务类型怎么填温州网站建站模板
  • cms建站系统 开源网站后台功能需求
  • 注册网站费用wordpress删除dux主题
  • 哪些网站可以做店铺推广男女做爰网站
  • 全国做临期进口食品的网站想自己做网站需要会什么软件
  • 多人运动免费正能量网站链接品牌官网搭建
  • 聊城网站建设科技公司深圳住房和建设局网站 龙华
  • 网站开发工程师年度总结网站seo诊断技巧
  • 电商网站建设公司哪家好上海seo网站推广公司
  • 增城区建设局网站广西住房和城乡建设厅
  • 做网站还要什么认证吗万网商标
  • 网站设计与规划作业国内优秀企业网站设计欣赏
  • 百度做网站要多久郑州营销型网站公司电话
  • 在线考试网站开发网站空间不能读数据库
  • 大连网站运营书店网站策划书
  • 北京网站快速排名优化上海网站制作机构