当前位置: 首页 > news >正文

js代码下载网站做互联网一个月挣多少钱

js代码下载网站,做互联网一个月挣多少钱,百度一下免费下载,泡泡网67 自注意力【动手学深度学习v2】 深度学习学习笔记 学习视频:https://www.bilibili.com/video/BV19o4y1m7mo/?spm_id_fromautoNext&vd_source75dce036dc8244310435eaf03de4e330 给定长为n 的序列,每个xi为长为d的向量,自注意力将xi 既当…

67 自注意力【动手学深度学习v2】

深度学习学习笔记
学习视频:https://www.bilibili.com/video/BV19o4y1m7mo/?spm_id_from=autoNext&vd_source=75dce036dc8244310435eaf03de4e330

给定长为n 的序列,每个xi为长为d的向量,自注意力将xi 既当key又当value又当query,这样对每个序列抽取特征得到y1-yn。
yi对应xi抽取的特征,xi是query , key-value是x1~xn。
给定一个序列,对序列中的每个元素输出,有点像RNN,不需要额外的key’-value,query都是一个东西,都是self就不要decode encode。
在这里插入图片描述

跟CNN,RNN对比
CNN 计算复杂度O(knd^2) K 是看的窗口大小(每次看K大小)。并行度是每个输出可以做并行计算。最长路径是假设有个信息要传递到很后的地方,最长序列传过去是n/k。
RNN计算复杂度O(nd^2) 每次矩阵乘法是d^2,并且要做n次。并行度O(1) 也就是很糟糕,必须等上一个时刻做完才能做下一个。最长路径是 x1的信息要一直传递到xn,要经过O(n)的序列。 RNN强时序的模型对序列的记忆比较好,特别擅长记忆一下序列。
自注意力机制(self attention) O(n^2d) 算output时query要和所有的input的做乘法,input长度是d,所有自注意力在序列比较长时,计算量比较大。并行度O(n)每次算yi 时不影响,可以继续算别的。 最长路径O(1)到任何的信息到任何一个输出直接就过去了,不需要再绕,即使在很远的地方也立即抓取过来。
于是自注意力机制比较适合长的序列,是因为设计使得它可以看得比较宽,最长路径是O(1)。
TPU是巨大的矩阵乘法做运算,非常适合attention /transformer这样的架构。
在这里插入图片描述
位置编码
和CNN/RNN相比,自注意力没有记录位置信息。加入位置信息的办法是位置编码,不改变注意力机制本身,将位置编码信息放到输入里面。假设有n个输入序列,每个序列d 个特征(n*d),位置编码矩阵也是同样大小的P,包含很多位置信息,将P+X再作为自编码的输入。
奇数列是个sin函数,偶数列是一个cos函数。
在这里插入图片描述
x坐标是行数(对应每个样本),曲线分别对应第6-9维。每次加进去一点点信息。
在这里插入图片描述
用sin,cos的好处是编码的是相对的位置信息,位置编码i+q可以线性的投影到i的位置信息,投影矩阵和序列中位置i是不相关的 ,这样在一个序列中假设一个词在序列中后两个位置相对应的时候,他们 不论出现在序列的哪个位置,对于位置信息,他们可以通过同样的线性变换w找出来。这样编码,用线性w 建模会比较好找这些句子的相对位置。
在这里插入图片描述

自注意力池化层将 xi 既当key,value又当query来抽取对应的yi 作为特征,自注意力池化层就可以给一个序列就能输出它的元素。可以完全并行,最长序列为1,也就说可以看到整个序列的信息。
计算复杂度比较高。
没有位置信息,在输入里面加入位置编码,这样在处理时是有时序信息的。编码用的sin,cos函数,使得序列在哪里相对位置都没有变。
在这里插入图片描述

QA:

  1. 给一篇文章,给几个问题,在文章中找到答案,类似于nlp中的问答。做一些推理会比较困难(chatGPT?)
  2. 自注意力机制可以理解为一个网络层,就像CNN或RNN的一层理解,他就是一个layer
http://www.yayakq.cn/news/806077/

相关文章:

  • apache多网站配置网站绑定公众号
  • 网站进入特效ps插件国外网站
  • 祁连网站建设公司网站设计公司域名服务器建设
  • 企业网站建设服务电话婚礼摄影网站源码
  • 徐州模板建站哪家好网站流程图软件
  • 石景山企业网站建设有什么网站可以做设计兼职
  • 山东网站备案 论坛营销策划公司经营范围包括哪些
  • 泗阳网站设计湖南东方红建设集团有限公司网站
  • ip地址访问不了网站创建企业
  • 什么都不会怎么做网站网站需不需要备案
  • 网站建设泉州重庆招标建设信息网站
  • 做移门配件的网站商城网站建设视频教程
  • 无锡网站建设哪家好网站建设中页面
  • 承接网站怎么做wordpress-5.0.2
  • 嘉兴网站备案网站建设需要提供哪些资料
  • 企业网站建设的费用舟山建设信息港网站
  • 网站后期维护管理暖色调 网站
  • 杭州建设信用网网站下载 asp网站
  • 泰安房产网租房互联网优化
  • 东莞哪里能学建设网站中国品牌网是什么网站
  • 装修公司网站模版成都哪家做网站建设比较好
  • 阿里做网站怎么做爱链接购买链接
  • 品牌网站设计地址典型网站开发的流程
  • 如何建立一个私人网站网站 新媒体建设情况
  • 苏州知名网站制作外链建设对网站的影响
  • vivo官网网站服务seo搜索引擎优化薪资
  • 临沂经开区建设局网站应该知道的网站
  • saas 平台架构做网站青岛网站设计哪家公司
  • 网站建网站建设企业互联网运营是什么工作
  • 建设银行网站上不去了网络平台怎么做