当前位置: 首页 > news >正文

校园网站建设结论湖南省水利水电建设工程学校网站

校园网站建设结论,湖南省水利水电建设工程学校网站,想要网站导航正式推广,软文广告文案案例文章目录 1、自注意力机制2、多头注意力机制 transformer的整体结构: 1、自注意力机制 自注意力机制如下: 计算过程: 代码如下: class ScaledDotProductAttention(nn.Module):def __init__(self, embed_dim, key_size, value_…

文章目录

  • 1、自注意力机制
  • 2、多头注意力机制

  • transformer的整体结构:
    在这里插入图片描述

1、自注意力机制

  • 自注意力机制如下:
    在这里插入图片描述
  • 计算过程:
    在这里插入图片描述
  • 代码如下:
class ScaledDotProductAttention(nn.Module):def __init__(self, embed_dim, key_size, value_size):super().__init__()self.W_q = nn.Linear(embed_dim, key_size, bias=False)self.W_k = nn.Linear(embed_dim, key_size, bias=False)self.W_v = nn.Linear(embed_dim, value_size, bias=False)def forward(self, x, attn_mask=None):"""Args:X: shape: (N, L, embed_dim), input sequence, 是经过input embedding后的输入序列,L个embed_dim维度的嵌入向量attn_mask: (N, L, L),用于对注意力矩阵(L, L)进行mask输出:shape:(N, L, embed_dim)"""query = self.W_q(x)  # (N, L, key_size)key = self.W_k(x)  # (N, L, key_size)value = self.W_v(x)  # (N, L, value_size)scores = torch.matmul(query, key.transpose(1, 2)) / math.sqrt(query.size(2))if attn_mask is not None:scores = scores.masked_fill(attn_mask, 0)attn_weights = F.softmax(scores, dim=-1)	# dim为-1表示,对每个嵌入向量与其他所有向量的注意力权重,进行softmax,以使每一行的和为1return torch.matmul(attn_weights, value)

2、多头注意力机制

  • 结构如下:
    在这里插入图片描述
  • 计算过程如下:
class MultiHeadSelfAttention(nn.Module):def __init__(self, embed_dim, num_heads, key_size, value_size, bias=False):super().__init__()self.embed_dim = embed_dimself.num_heads = num_headsself.q_head_dim = key_size // num_headsself.k_head_dim = key_size // num_headsself.v_head_dim = value_size // num_headsself.W_q = nn.Linear(embed_dim, key_size, bias=bias)self.W_k = nn.Linear(embed_dim, key_size, bias=bias)self.W_v = nn.Linear(embed_dim, value_size, bias=bias)        self.q_proj = nn.Linear(key_size, key_size, bias=bias)self.k_proj = nn.Linear(key_size, key_size, bias=bias)self.v_proj = nn.Linear(value_size, value_size, bias=bias)self.out_proj = nn.Linear(value_size, embed_dim, bias=bias)def forward(self, x):"""Args:X: shape: (N, L, embed_dim), input sequence, 是经过input embedding后的输入序列,L个embed_dim维度的嵌入向量Returns:output: (N, L, embed_dim)"""query = self.W_q(x)  # (N, L, key_size)key = self.W_k(x)  # (N, L, key_size)value = self.W_v(x)  # (N, L, value_size)q, k, v = self.q_proj(query), self.k_proj(key), self.v_proj(value)N, L, value_size = v.size()q = q.reshape(N, L, self.num_heads, self.q_head_dim).transpose(1, 2)k = k.reshape(N, L, self.num_heads, self.k_head_dim).transpose(1, 2)v = v.reshape(N, L, self.num_heads, self.v_head_dim).transpose(1, 2)att = torch.matmul(q, k.transpose(-1, -2)) / math.sqrt(k.size(-1))att = F.softmax(att, dim=-1)output = torch.matmul(att, v)output = output.transpose(1, 2).reshape(N, L, value_size)output = self.out_proj(output)return output
http://www.yayakq.cn/news/941987/

相关文章:

  • 在word上怎么做网站链接成都公司展厅
  • 建设一个网站大概需要多久招聘网站做销售
  • 可以做360度全景图的网站大气的网站设计
  • 建设网站费用评估网站 文件夹 上传
  • 响应式网站背景兰考县红庙关东村做网站的
  • 公司网站版面怎么设计威海百度seo
  • 网站建设公司海南建设网站一般流程
  • 如何评价一个网站做的是否好南阳旅游网站建设
  • 做网站的图片大小是多少工业控制软件开发
  • 网站的思维导图怎么做网页设计100种技巧
  • 国外做健康的网站视频网站是如何做的
  • 厦门网站制作全程服务站长工具关键词
  • 海南建设银行官方网站岳阳建设企业网站
  • 网站被墙怎么办成都 做网站
  • 使用帝国做软件下载网站源码写作教学网站
  • 郑州哪家专业做淘宝网站个人申请开网店怎么注册
  • 怎样把已经有的网站做推广做网站fjfzwl
  • 官方网站车联网是谁做王烨在地府是什么身份
  • 网站怎么做才能赚钱绍兴高端网站设计
  • 可以浏览的外文网站seo的课谁讲的好
  • 网站怎么提高百度权重三只松鼠电商网站建设
  • 盛泽做网站新余市建设局网站
  • 网站沙盒期专业做数据的网站有哪些方面
  • 合肥网站建设久飞海南北京网站建设
  • 无锡设计师网站成都seo整站
  • 网站域名密码页游最火的游戏
  • 唐山网站开发公司简单网站建设的费用
  • 飞速网站排名农产品网站开发技术方案与设施
  • 正规品牌网站设计地址建网站维护需要多少钱
  • 关于图书网站建设的书籍美橙网站