当前位置: 首页 > news >正文

界面好看的网站网站开发工作怎么样

界面好看的网站,网站开发工作怎么样,做中考试卷的网站,网站申请一.论文 1.1 P-tuning 区别于之前的工作,这篇工作认为promote可以在句子中的任意位置起到作用,可以将它们插入上下文或目标中 上图中,左图是不使用任何操作,右图是选择在居首和目标前插入promote的embedding,插入pro…

一.论文

1.1 P-tuning

区别于之前的工作,这篇工作认为promote可以在句子中的任意位置起到作用,可以将它们插入上下文或目标中

上图中,左图是不使用任何操作,右图是选择在居首和目标前插入promote的embedding,插入promote的过程可以表示为

其中x代表一系列离散的输入令牌,y代表目标(可以理解为希望模型想要给你的回答),e()表示对应的embedding,其实就是将其参数化映射成为伪tokens,即

通过最小化这些参数

1.2 promote生成

嵌入的promote实际上可以理解为不一定离散不相互关联的,而实际上的promote其实应该是高度离散的且具有关联性的,因此作者选择使用双向长短期记忆网络(LSTM),激活函数和MLP来建模这种关系

在推理中,我们只需要输出嵌入h,并且可以丢弃LSTM头

二.代码

本质上是使用一个PromptEncoder来生成伪的embedding添加到原先的embedding中

2.1 训练

训练过程只更新promote_encoder中的参数

 2.1.1 PromptEncoder

在PTuneForLAMA中实例化了PromptEncoder

 PromptEncoder本质上是一个(嵌入 + LSTM + MLP)

import torch
import torch.nn as nnclass PromptEncoder(torch.nn.Module):def __init__(self, template, hidden_size, tokenizer, device, args):super().__init__()self.device = deviceself.spell_length = sum(template)self.hidden_size = hidden_sizeself.tokenizer = tokenizerself.args = args# ent embeddingself.cloze_length = templateself.cloze_mask = [[1] * self.cloze_length[0]  # first cloze+ [1] * self.cloze_length[1]  # second cloze+ [1] * self.cloze_length[2]  # third cloze]self.cloze_mask = torch.LongTensor(self.cloze_mask).bool().to(self.device)self.seq_indices = torch.LongTensor(list(range(len(self.cloze_mask[0])))).to(self.device)# embeddingself.embedding = torch.nn.Embedding(len(self.cloze_mask[0]), self.hidden_size).to(self.device)# LSTMself.lstm_head = torch.nn.LSTM(input_size=self.hidden_size,hidden_size=self.hidden_size // 2,num_layers=2,dropout=self.args.lstm_dropout,bidirectional=True,batch_first=True)self.mlp_head = nn.Sequential(nn.Linear(self.hidden_size, self.hidden_size),nn.ReLU(),nn.Linear(self.hidden_size, self.hidden_size))print("init prompt encoder...")def forward(self):input_embeds = self.embedding(self.seq_indices).unsqueeze(0)output_embeds = self.mlp_head(self.lstm_head(input_embeds)[0]).squeeze()return output_embeds

2.1.2 调用

在PTuneForLAMA的forward函数中调用了embed_input来实现

http://www.yayakq.cn/news/994842/

相关文章:

  • 电子商务网站建设投资预算理财网站建设方案书
  • 谷歌云做网站东莞seo外包推广
  • 做ppt软件怎么下载网站金融网站html5模板
  • 沈阳网站建设方案服务公司对网站排名如何做绩效
  • 北京网站优化公司 卓立海创网站宣传标语
  • 泰州网站建设公司哪家好中国招标投标服务平台官网
  • 手机网站推广怎么做网站设计协议
  • 河北保定网站建设我认为的网络营销是什么
  • html网站地图在线生成360网站提交入口地址
  • 什么叫域名访问网站大数据网站
  • 模板演示网站oa办公系统管理软件
  • p2p网站建设要点怎么做网络平台
  • 湘潭网站建设 沟通磐石网络郑州新闻联播
  • 怎样建设淘宝网站发优惠券网站怎么做
  • 钦州市建设网站怎么制作网页里面的内容
  • 女朋友做网站asp网站转wap网站
  • 织梦电子行业网站模板企业咨询公司名称大全
  • 做外贸密封件的网站app营销十大成功案例
  • 房地产企业网站开发用Off做网站
  • 旅游电子商务网站的建设apmserv访问本地网站
  • 郑州大型网站制作wordpress 组织架构
  • 网站建设需要注意什么 知乎软件开发具体工作内容
  • 网站专题制作原则工作招聘58同城
  • 网站建设联盟wordpress 删除 分类存档
  • 石家庄制作网站软件做网站内容
  • 昆明建设招聘信息网站项目设计说明书模板
  • 网站开发基础课程抖音seo关键词优化怎么做
  • 普兰店网站建设公司广告行业怎么找客户
  • 阜城县网站建设公司网站空间500m是什么
  • 做淘宝推广开网站合适seo优化与sem推广有什么关系