当前位置: 首页 > news >正文

西安网站建设盈科注册网站怎么注销

西安网站建设盈科,注册网站怎么注销,亳州市建设工程质量监督站网站,百度竞价冷门产品Github 仓库:https://github.com/One-sixth/flash-linear-attention-pytorch flash-linear-attention-pytorch 纯 Pytorch 实现 TransnormerLLM 中快速线性注意力算子。 用于学习目的。 如果你希望用于训练模型,你可能要修改为 CUDA 或 Triton 的实现&…

Github 仓库:https://github.com/One-sixth/flash-linear-attention-pytorch

flash-linear-attention-pytorch

纯 Pytorch 实现 TransnormerLLM 中快速线性注意力算子。
用于学习目的。
如果你希望用于训练模型,你可能要修改为 CUDA 或 Triton 的实现,不然会很慢。

注意

这个算子有精度问题,误差较大,是正常的。
这是因为注意力矩阵没有激活函数,导致注意力矩阵的值很大。
在使用 float16 类型时需要特别小心。

这是一个简单的缓解方法:限制 q 和 k 的值,从而减少float16溢出的可能性。

q = q / q.norm(-1, keepdim=True)
k = k / k.norm(-1, keepdim=True)
o = linear_attention(q, k, v, m)

使用方法

import torch
from flash_linear_attention_ops import flash_linear_attention, normal_linear_attentionbatch_size = 16
seq_len = 1024
dim = 64
n_head = 12
device = 'cuda'
dtype = torch.float32Q = torch.randn(batch_size, n_head, seq_len, dim, requires_grad=True, dtype=dtype, device=device)
K = torch.randn(batch_size, n_head, seq_len, dim, requires_grad=True, dtype=dtype, device=device)
V = torch.randn(batch_size, n_head, seq_len, dim, requires_grad=True, dtype=dtype, device=device)
M = torch.randint(0, 2, (1, 1, seq_len, seq_len), device=device, dtype=dtype)O_flash = flash_linear_attention(Q, K, V, M)
O_normal = normal_linear_attention(Q, K, V, M)print('O_flash.shape', O_flash.shape)
print('O_normal.shape', O_normal.shape)print('O diff', (O_flash - O_normal).abs().max().item())

参考引用

https://github.com/OpenNLPLab/TransnormerLLM
https://github.com/shreyansh26/FlashAttention-PyTorch

http://www.yayakq.cn/news/748015/

相关文章:

  • 石景山区公司网站建设网站 不备案
  • 设计网站推荐外网ppt设计师兼职
  • 关于绿色环保网站的建设历程j昆明网站制作公司
  • uc官方网站开发者中心网站开发常用jquery插件总结(四)验证插件validation
  • 网站建设合同书wordpress归档插件
  • 做外卖网站需要多少钱大连装修公司哪家好
  • 企业营销型网站分析制作销售网站
  • 用ps做美食网站开发手机网站用什么好
  • 网站建设技能考试试题三建一个全部由自己控制的网站需要多少钱
  • 煤矿建设工程质量监督总站网站货源网站开发
  • 北京网站建设建站wap网站发布
  • 伪静态网站如何做百度速页建站
  • 北京建设网站专家网站首页排名没了
  • 学校网站报价方案买了个服务器 怎么做网站
  • 校园网站开发需求文字做网站订金是多少
  • 网站违规关键词腾讯会议开始收费
  • 南山网站设计费用北京网络广播电视台
  • 网站建设中html模板加强学校网站建设
  • 系统花钱做任务的小说魅网站哪里有培训班
  • 成都青白江网站建设镇江优化推广
  • 达内培训网站开发cms网站建设有多少条数据
  • 郑州市网站建设怎么样个人门户登录
  • 网易网站开发语言三门峡网站设计
  • wordpress网站流量网站如何续费
  • 新开发网站锡盟做网站
  • 上海市嘉定建设局网站天津河东区网站建设
  • 怎么做企业网站推广赚钱wordpress图片剪切
  • 网站收录教程android开发用什么软件
  • 宽带固定ip的怎么做网站服务器wordpress 评论 框
  • 网站内容策划书江苏平台网站建设价位