当前位置: 首页 > news >正文

东莞模板网站网站都是h5响应式

东莞模板网站,网站都是h5响应式,淮北市矿业工程建设公司网站,景区网站建设案例注:本文为《动手学深度学习》开源内容,仅为个人学习记录,无抄袭搬运意图 3.10 多层感知机的简洁实现 下面我们使用PyTorch来实现上一节中的多层感知机。首先导入所需的包或模块。 import torch from torch import nn from torch.nn import …

注:本文为《动手学深度学习》开源内容,仅为个人学习记录,无抄袭搬运意图

3.10 多层感知机的简洁实现

下面我们使用PyTorch来实现上一节中的多层感知机。首先导入所需的包或模块。

import torch
from torch import nn
from torch.nn import init
import numpy as np
import sys
sys.path.append("..") 
import d2lzh_pytorch as d2l

3.10.1 定义模型

和softmax回归唯一的不同在于,我们多加了一个全连接层作为隐藏层。它的隐藏单元个数为256,并使用ReLU函数作为激活函数。

num_inputs, num_outputs, num_hiddens = 784, 10, 256#定义了神经网络的结构    
net = nn.Sequential(d2l.FlattenLayer(), #即把多维的输入一维化,常用在从卷积层到全连接层的过渡nn.Linear(num_inputs, num_hiddens), #这是一个全连接层(也叫线性层或密集层),它接受 num_inputs 个输入,并输出 num_hiddens 个结果。nn.ReLU(),  #这是一个激活函数层,它使用 ReLU(Rectified Linear Unit)函数作为激活函数。ReLU 函数将所有负值置为 0,而正值则保持不变。这有助于网络学习非线性关系。nn.Linear(num_hiddens, num_outputs),  #这是另一个全连接层,它接受 num_hiddens 个输入(即上一个隐藏层的输出),并输出 num_outputs 个结果。这个输出层通常不包含激活函数,因为最后的输出将被解释为每个类别的概率(通过 softmax 函数)。)#初始化网络中所有参数的值
for params in net.parameters():init.normal_(params, mean=0, std=0.01)

net.parameters() 返回一个包含网络中所有参数(权重和偏置)的迭代器。

init.normal_ 是一个就地(in-place)操作,它会直接修改传入的参数张量(params),而不是创建一个新的张量。

mean=0, std=0.01 指定了正态分布(高斯分布)的均值和标准差,用于生成初始化值。这里使用了较小的标准差(0.01),意味着初始化值将接近于 0,但会有一定的随机性。这种初始化方法有助于网络更快地收敛,但也可能导致训练过程中的一些不稳定性。

3.10.2 读取数据并训练模型

我们使用与3.7节中训练softmax回归几乎相同的步骤来读取数据并训练模型。

注:由于这里使用的是PyTorch的SGD而不是d2lzh_pytorch里面的sgd,所以就不存在3.9节那样学习率看起来很大的问题了。

batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)
loss = torch.nn.CrossEntropyLoss()optimizer = torch.optim.SGD(net.parameters(), lr=0.5)num_epochs = 5
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None, optimizer)

输出:

epoch 1, loss 0.0030, train acc 0.712, test acc 0.744
epoch 2, loss 0.0019, train acc 0.823, test acc 0.821
epoch 3, loss 0.0017, train acc 0.844, test acc 0.842
epoch 4, loss 0.0015, train acc 0.856, test acc 0.842
epoch 5, loss 0.0014, train acc 0.864, test acc 0.818

小结

  • 通过PyTorch可以更简洁地实现多层感知机。

注:本节除了代码之外与原书基本相同,原书传送门

http://www.yayakq.cn/news/149218/

相关文章:

  • h5微信网站开发基础建设包括哪些内容
  • 广州微信网站建设咨询网站优化seo网站架构优化
  • o2o网站建设公司排名舆情监测工作要怎么做
  • 网站建设商务合同范本以应用为导向的高职高专数学课程改革与建设 教学成果奖申报网站
  • 怎么样通过做网站赚钱吗如何加强英文网站建设
  • 网站商城建站杭州住房和城乡建设局官网
  • 微网站 小程序 区别做科技公司的网站公司
  • 新乡中企网站建设衡水网站建设03181688
  • 网上做平面设计兼职不错的网站网站设计分析
  • 网站开发英语wordpress开发sns
  • 动画网站源码网络营销成功的案例分析
  • 服装网站设计怎么做网站呢
  • 做一家拍卖网站需要什么资质微信营销的方式有哪些
  • 网站备案周期怎么制作一个app应用
  • 网站优化与SEO区别企业站群cms
  • 海关总署2018年海关网站建设提升学历的正规平台
  • 做网站要会编程么wordpress 折800模板
  • 青岛网站建设青岛博采网络网站建设的对比分析
  • 做网站去哪里做好设计师图库网站
  • 个人网站设计的参考文献wordpress 编辑器 修改
  • 网站建设版面分几页合适一起做网站欧洲站
  • 外贸网站建设哪里做得好北京感染峰值已过
  • 网站建设税率多少什么网站做新闻更好
  • 做一借款撮合网站怎么用服务器做局域网网站
  • 手机移动端网站建设宣传创意网页设计论文
  • 免费的在线学习网站上海网站开发平台
  • 卢松松博客主题 wordpress烟台网站建设seo
  • 做网站彩票网站吗东莞黄页电话
  • 设计一个企业网站主页404page wordpress
  • 前端做商城网站需要多久建设一个微商的网站