当前位置: 首页 > news >正文

开发高端网站建设价格网站服务器设置

开发高端网站建设价格,网站服务器设置,设计师的个人网站,网络科技网站排名前情提要 编码器-解码器结构 如果将一个模型分为两块:编码器和解码器那么编码器-解码器结构为:编码器负责处理输入,解码器负责生成输出流程:我们先将输入送入编码器层,得到一个中间状态state,并送入解码器…

前情提要

编码器-解码器结构

  • 如果将一个模型分为两块:编码器和解码器
  • 那么编码器-解码器结构为:编码器负责处理输入,解码器负责生成输出
  • 流程:我们先将输入送入编码器层,得到一个中间状态state,并送入解码器层,和额外的输入一同处理后,得到模型的输出
    在这里插入图片描述
  • CNN就可以重新表示为下图
    在这里插入图片描述
  • RNN也可以表示为下图:
    在这里插入图片描述

Seq2seq

  • 序列到序列的模型:从一个句子生成到另一个句子
  • 模型分为编码器、解码器两部分,其中,编码器可以是一个RNN,用来读取输入句子,解码器使用另外一个RNN来输出生成的句子
  • 注意:由于在输入时,我们知道全部的输入句子,所以可以用两个RNN做双向,但是解码器是生成模型,不能看到完整的句子,所以不能做双向
  • 注意:在编码器层,通过开始<bos>、结束<eos>来控制编码器的输出
    在这里插入图片描述
  • 编码器层的输出是不会作为模型的输出,相反它最后一层的输出作为编码器层输入的一部分,和编码器层额外的输入合并,整体作为编码器层的输入,即编码器层的最后隐藏状态,作为解码器的初始隐藏状态,如下:
    在这里插入图片描述

Transformer的框架概述

  • NLP中预训练的目的:为了生成词向量
  • Transformer采用了seq2seq(序列到序列)的模型,整体框架如下:
    • seq2seq的模型基本都分为编码器层和解码器层,即从编码器到解码器的结构
      在这里插入图片描述

使用机器翻译的场景来解释

  • 在机器翻译的场景中:
    • 编码器层:把输入变成一个词向量
    • 解码器层:得到编码器层输出的词向量后,生成翻译的结果
      在这里插入图片描述
  • 同时,N * 的意思是:编码器层里面又有N个小编码器(默认N=6),一个编码器可以看作Self-Attention,而Self-Attention会对词向量做增强,经过6个编码器,那就是增强了6次
  • 编码器层最后的输出会分别给6个解码器
    在这里插入图片描述
  • 因此,Transformer的关键就在于编码器和解码器,如下:
    在这里插入图片描述
http://www.yayakq.cn/news/154972/

相关文章:

  • 电子商务网站建设与实例心得东营网站seo外包
  • 国外的营销网站页面模板资源
  • 广州网站建设-信科分公司wordpress不加载样式
  • seo引擎优化南昌seo推广优化
  • WordPress建站维护服务wordpress设置邮件发送
  • 沈阳做公司网站的公司2023免费网站推广大全
  • 素材最多的网站iis7.5发布网站教程
  • 建设商业门户网站的重要性加强红色网站建设
  • c2c网站的功能密山网站
  • ps网站轮播图怎么做的网站开发要注意哪些细节
  • 做网站的技术难点企业网站推广在哪里办
  • 杭州网站建设杭州常州网约车平台
  • 做网站好还是做程序员好微信商城小程序多少钱
  • 萧云建设网站网站怎么做伪静态处理
  • 河南网站网站制作建设网站的虚拟机配置
  • 网站建设勹金手指科捷14wordpress 文章标签
  • 做写手一般上什么网站iis上部署手机网站
  • 中企动力网站建设合同物流网站有哪些
  • wordpress 图片菜单做seo对网站推广有什么作用
  • 做自己看视频的网站做电影网站需要什么手续
  • 查询网站建设时间外贸建站网站建设
  • 北滘企业网站开发wordpress分类页置顶信息
  • 品牌网站建设创意新颖个人开发app需要多少钱
  • 新泰网站设计网络科技公司一般是做什么的
  • 怎么自己建立一个网站后台淮南服装网站建设费用
  • 建一个设计网站要多少钱2核4g 1m做网站
  • 专门做自由行的网站如何制作官方网站
  • 官方网站平台下载返利网网站框架目录
  • 网站建设价位更换wordpress语言包
  • 四川建设行政主管部门官方网站5944免费空间上搭建网站