当前位置: 首页 > news >正文

龙岩市住房和城乡建设厅网站首页公众号建网站

龙岩市住房和城乡建设厅网站首页,公众号建网站,百度怎么收录网站,移动网站建站系统评估简单循环神经网络的缺点。 描述门控循环单元(Gated Recurrent Unit,GRU)的架构。 使用GRU进行情绪分析。 将GRU应用于文本生成。 基本RNN通常由输入层、输出层和几个互连的隐藏层组成。最简单的RNN有一个缺点,那就是它们不…

·评估简单循环神经网络的缺点。

·描述门控循环单元(Gated Recurrent Unit,GRU)的架构。

·使用GRU进行情绪分析。

·将GRU应用于文本生成。

基本RNN通常由输入层、输出层和几个互连的隐藏层组成。最简单的RNN有一个缺点,那就是它们不能在序列中保持长期关系。为了纠正这个缺陷,需要在简单RNN网络中添加一个特殊的层,称为门控循环单元。

 

梯度爆炸

梯度不仅会消失,而且还会爆炸。也就是说,前面的层会学习得太快,每次训练迭代之间的值会有很大的偏差,而后面的层的梯度变化不会很快。这是怎么发生的呢?重新审视我们的方程,如果单个项的值远大于1,乘法效应会导致梯度变大,从而造成梯度不稳定,并引起学习问题。

梯度爆炸问题有一个强大的解决方案:裁剪。裁剪仅仅是指阻止梯度的值增长至超过预定义的值。如果该值未被裁剪,由于计算机的典型溢出,你将开始看到网络梯度和权重的NaS(非数字)。设定值上限将有助于避免这一问题。注意,裁剪仅限制梯度的大小,而不限制其方向。

门控循环单元

更新门

在时间步 t,我们首先需要使用以下公式计算更新门 z_t:

 

 其中 x_t 为第 t 个时间步的输入向量,即输入序列 X 的第 t 个分量,它会经过一个线性变换(与权重矩阵 W(z) 相乘)。h_(t-1) 保存的是前一个时间步 t-1 的信息,它同样也会经过一个线性变换。更新门将这两部分信息相加并投入到 Sigmoid 激活函数中,因此将激活结果压缩到 0 到 1 之间。

更新门帮助模型决定到底要将多少过去的信息传递到未来,或到底前一时间步和当前时间步的信息有多少是需要继续传递的。这一点非常强大,因为模型能决定从过去复制所有的信息以减少梯度消失的风险。我们随后会讨论更新门的使用方法,现在只需要记住 z_t 的计算公式就行。

重置门

本质上来说,重置门主要决定了到底有多少过去的信息需要遗忘,我们可以使用以下表达式计算:

 使用维度(n_h,n_x)将时间步长t的输入乘以权重W_r。然后,用维度(n_h,n_h)将前一个时间步长的激活函数(h[t-1])乘以另一组新的权重U_r。注意这里的乘法是矩阵乘法。然后将这两个项相加,并通过sigmoid函数将输出r[t]压缩到[0,1]的范围内。r[t]输出与激活函数具有相同的维度,即(n_h,1)。W_r和U_r参数也需要使用BPTT来学习。

http://www.yayakq.cn/news/973122/

相关文章:

  • 一个人做电商网站难吗淘宝客购物网站源码
  • 做招聘网站需要什么人员软件开发的职业规划1000
  • 医疗方面的网站建设深圳制作网站培训学校
  • 成都水高新区建设局官方网站网站内容的设计与实现
  • 多个域名绑定同一网站吗株洲网站优化哪家强
  • 郑州快速网站优化公司首选网站轮播动态图如何做
  • 网站设计需要什么wordpress图片分离
  • 站酷设计师网站好看wordpress主题
  • 焦作做网站优化源码网站git
  • 苏州网站制作方法头条网站怎么做的
  • 免费开源代码网站软件开发工具的基本功能
  • 营销型网站网站设计韩国风格网站
  • 在猪八戒做网站有保障吗网站推销话术
  • 明星网页网站制作wordpress把文章转语音
  • 网站建设的售后服务怎么写网站开发宣传
  • 海口专业网站制作策划wordpress博客软件
  • 招标代理网站建设怎么搜索整个网站内容
  • 有哪些做任务的网站网站 二级域名
  • 餐饮业网站建设网站搭建技术有哪些
  • 网站死链接淘宝商家版登录入口
  • 项城市住房和城乡建设局网站网站备案时网站没有内容可以
  • 通信工程建设网站怎么设计页面
  • 网站建设与运营方案微网站功能列表
  • 怎么将自己做的网站放到网上企业网站如何提高
  • 网站描述是什么2345网站入口
  • 目前网站开发主要有哪些工具济南网站建设系统
  • dedecms 调用网站内部搜索软件开发入门先学什么
  • 北京出名的室内设计公司企业官网网站优化公司
  • 杭州婚恋网站建设十大最好玩网页游戏
  • 《网页设计与网站建设》A卷答案菜鸟教程网官网入口