当前位置: 首页 > news >正文

呼伦贝尔网站建设公司iis wordpress固定链接404

呼伦贝尔网站建设公司,iis wordpress固定链接404,.net asp可以外链其它网站吗,dw网页设计模板网站前言 使用google-bert/bert-base-chinese模型进行中文文本分类任务,使用THUCNews中文数据集进行训练,训练完成后,可以导出模型,进行预测。 项目详细介绍和数据下载 数据集下载地址 Github完整代码 现记录训练过程中的一些感悟…

前言

使用google-bert/bert-base-chinese模型进行中文文本分类任务,使用THUCNews中文数据集进行训练,训练完成后,可以导出模型,进行预测。

项目详细介绍和数据下载

数据集下载地址

Github完整代码

现记录训练过程中的一些感悟

1、训练时遇到的两个核心参数warmup_stepsweight_decay

代码片段如下
在这里插入图片描述

需要弄明白一些基础概念

epoch:指模型在训练过程中遍历完整个训练数据集一次。

step:指模型在训练过程中处理完一个batch的数据并完成一次梯度更新。

batch_size: 指在一次step中模型用于训练的数据量。

假设 训练数据集有 n 个样本,每个epoch的step计算方式
s t e p = n b a t c h _ s i z e step = \frac{n}{batch\_size} step=batch_sizen
训练过程的总步数为
s t e p s = s t e p × n u m _ t r a i n _ e p o c h s steps = step \times num\_train\_epochs steps=step×num_train_epochs

warmup_steps:主要目的是为了平稳地提升学习率,让模型在训练初期不会因为太高的学习率而跳过或远离全局最优解。

常见做法是将其设置为总训练步数的5%到10%的值。

此训练过程中warmup steps下限的计算方式如下,训练数据18w
w a r m u p _ s t e p s = 180000 32 × 5 × 5 % = 1406 warmup\_steps = \frac{180000}{32} \times 5 \times 5\% = 1406 warmup_steps=32180000×5×5%=1406

减少 warmup_steps 可能会导致模型更快地达到较高的学习率,从而错过或远离全局最优解。

weight_decay:是用于正则化模型权重的,实际上是 L2 正则化的一种形式

weight_decay的作用是在损失函数中添加一个惩罚项,该惩罚项与权重的平方成正比,这有助于抑制权重的大小,从而防止模型过拟合

weight_decay设置得过低,可能不足以防止过拟合;设置得过高,则可能导致模型欠拟合,即模型过于简单,无法很好地捕捉数据中的模式

2、通过tensorboard --logdir=./logs可视化训练过程

训练过程截图如下:

2.1、训练阶段

可以明显的看到训练时的学习率先逐渐上升之后在下降,这是我们想要的趋势。训练的损失值逐步下降,这也是我们希望的。但是当我们在分析评估数据数据集的损失时,我们会发现此时模型应该是过拟合了。

在这里插入图片描述

2.2、推理阶段

随着训练过程的增加,模型在评估数据集上的损失也是逐步减少,当在step=11250时,评估数据集上的损失开始逐渐增加,而训练数据的损失还在减少,那么可以肯定模型已经过拟合了。

模型已经充分的挖掘训练数据集中的语义特征,过分的学习到数据中的一些细枝末节。从而在新数据集上的表现越来越差。这种在训练数据集上表现优秀,在评估或测试数据集上表现较差现象,即模型出现了过拟合。

在这里插入图片描述

3、模型混淆矩阵的分析

混淆矩阵结果如下
在这里插入图片描述
指标如下

Accuracy0.9434
Precision0.9438
Recall0.9434

具体多分类任务指标和混淆矩阵分析参考这里非常详细。

4、如何解决模型过拟合的现象

【待更新】疯狂参数调节优化中…

http://www.yayakq.cn/news/741136/

相关文章:

  • 域名注册网站 不认证杭州app开发公司老铁帮
  • 律所网站建设管理制度找别人做网站要注意什么软件
  • 如何用asp做网站wordpress lampp建站
  • 网站开发厂商外贸网站建站赚钱
  • 做亚马逊一年赚了60万张家界seo网站优化
  • 南通网站建设seowordpress 同步 博客
  • 网站建设 零基础个人一般注册什么类型的公司
  • 外发加工单表格模板seo发展前景怎么样啊
  • 南阳公司网站制作做站群网站会被k吗
  • 网站忘了怎么办啊如何攻克网站
  • 厦门+外贸公司做网站为企业提供网站建设服务
  • 网站建设公司企业网站管理系统页面设计是什么意思
  • 论坛网站制作费用百度竞价排名多少钱
  • 陕西营销型手机网站建设网站案例英文
  • 网站设计素材seo是免费的吗
  • 网站分析怎么做如何用dw做网站地图
  • 煤矿网站建设桔子seo网
  • 济宁网站建设top云建设平台
  • 郑州百度网站建设做旅行攻略的网站好
  • wordpress+vps建站龙华区住房和建设局网站官网
  • 河南省住房城乡和建设厅网站首页wordpress网盘插件
  • 怎么做网站的api常用网站设计缩略图
  • 做导航网站犯法吗山东建设科技产品推广网站
  • 中国做水产的有什么网站旅游包车网站最新模板
  • 国内建站平台有哪些网站 mip
  • 建设用地规划许可证在哪个网站查询有哪些好的模板网站
  • 热门专业单页网站seo优化
  • 钢材销售网站建设用KEGG网站做KEGG富集分析
  • 手机建立网站山东专业网站建设
  • 广州自助网站搭建制作公司网站建设的经费预算