当前位置: 首页 > news >正文

东圃手机网站建设wordpress 分页导航

东圃手机网站建设,wordpress 分页导航,腾讯公告最新官方消息,中小型网站有哪些pytorch中使用nn.CrossEntropyLoss()创建出来的交叉熵损失函数计算损失默认是求平均值的,即多个样本输入后获取的是一个均值标量,而不是样本大小的向量。 net nn.Linear(4, 2) loss nn.CrossEntropyLoss() X torch.rand(10, 4) y torch.ones(10, dt…

pytorch中使用nn.CrossEntropyLoss()创建出来的交叉熵损失函数计算损失默认是求平均值的,即多个样本输入后获取的是一个均值标量,而不是样本大小的向量。

net = nn.Linear(4, 2)
loss = nn.CrossEntropyLoss()
X = torch.rand(10, 4)
y = torch.ones(10, dtype=torch.long)
y_hat = net(X)
l = loss(y_hat, y)
print(l)

打印的结果:tensor(0.7075, grad_fn=<NllLossBackward0>)

以上是对10个样本做的均值的标量

net = nn.Linear(4, 2)
loss = nn.CrossEntropyLoss(reduction='none')
X = torch.rand(10, 4)
y = torch.ones(10, dtype=torch.long)
y_hat = net(X)
l = loss(y_hat, y)
print(l)

在构造CrossEntropyLoss时候加入 reduction='none',就把默认求平均取消掉了

打印结果:

tensor([0.6459, 0.7372, 0.6373, 0.6843, 0.6251, 0.6555, 0.5510, 0.7016, 0.6975,0.6849], grad_fn=<NllLossBackward0>)

以上是10个样本各自的loss值

上图是pytorch的CrossEntropyLoss的构造方法,默认是 reduction='mean'

此外,使用反向传播计算梯度也会发生变化,loss值调用backward()要求loss值是一个tensor标量,如果是reduction='none',loss值得到的是tensor向量,会报错。 loss值需要求和或者求平均得到标量再进行backward()的计算

l = loss(y_hat, y)
l.sum().backward()

至于为什么求和或者求平均都可以,首先要看下更新梯度的计算公式

 求和学习率就调整的大一点,求均值的话学习率就可以小一点,总之就是除以样本数这个操作可以放到调整学习率中

http://www.yayakq.cn/news/25901/

相关文章:

  • 做的网站没有注册公司网站制作机构
  • 51个人网站产品软文是什么意思
  • 单位门户网站是什么8网站建设做网站
  • 现在房地产的最新情况西安seo托管
  • 做网站 域名是怎么回事石岩做网站的公司
  • 北京怎么做网站网站建设和优化
  • 深圳好客站seo湖北网站排名优化
  • 网站页面设计网页说明做高端品牌网站建设
  • 网站设计预算旅游网站信息门户建设方案
  • 郑州网站改版升级做环评需要关注哪些网站
  • 高端视觉网站uc官方网站开发中心
  • 北京网站优化指导做网站的销售工作好吗
  • 网站定制公司哪家最权威wordpress 安全密钥
  • 宁波网站推广优化公司90设计首页官网
  • dede网站仿站经典工具wordpress考试模板
  • 婚庆大气网站源码广州网站建设懂你所需
  • 阜城网站建设代理购物系统
  • 餐饮品牌设计网站建设wordpress访问人数
  • 寺庙网站开发策划书企业qq出售平台
  • c2c网站都有哪些长春建立一个网站需要多少钱?
  • 无锡高端网站建设郑州商城网站建设
  • 影楼做网站公司网站更换域名流程
  • 寻找网站优化公司老板让我做网站负责人
  • 南京专业网站设计公司价格施工企业平台
  • 招聘网站排行榜2021wordpress自然志下载
  • 做网站方案山东网站营销seo哪家好
  • 什么是开放式的网站企业建网站一般要多少钱
  • 南京网站开发南京乐识权威自学it怎么入门
  • 娄底市建设局网站lamp做网站的论文
  • 网站页面设计 8种常见的网站版面布局形式制作公司网站设计手绘