当前位置: 首页 > news >正文

青海省建设工程监理协会网站建网站服务器是什么东西

青海省建设工程监理协会网站,建网站服务器是什么东西,网上购物平台类型,自己做刷东西的网站【学而不思则罔,思而不学则殆】 1.问题 NLP序列标注问题,样本不均衡怎么解决? 2.解释 以命名实体识别(NER)为例,这个样本不均衡有两种解释: (1)实体间类别数量不均衡…

【学而不思则罔,思而不学则殆】

1.问题

NLP序列标注问题,样本不均衡怎么解决?
在这里插入图片描述

2.解释

以命名实体识别(NER)为例,这个样本不均衡有两种解释:
(1)实体间类别数量不均衡,比如医疗知识图谱中,疾病现象比治疗手段多得多;
(2)实体和非实体的数量不均衡,一句话中,标注为O的数量占比比较大,约60%-90%。
第一类问题会导致实体类别分类不准,也就是会影响P(查准率);第二类问题会导致实体可能识别不出来,会影响R(查全率)

3.思路

针对第一类问题:
传统的几个思路
(1)思路一:增加小样本数量,首先考虑增加原始样本数量,其次考虑数据增强(如滑动窗口),属于简单有效的方法;
(2)思路二:在不影响性能的情况下,可以考虑减少样本数量多的类别样本,这种也能平衡类别数量,还能加快训练;
(3)思路三:改变损失函数,本质是给小样本加权,比如用focal loss。
(4)思路四:用两个或多个分类模型,一个用来识别大样本类别,一个用来识别小样本类别;极端情况下,一种类别一个分类算法,好处是每种类别的性能可以针对性调优,坏处是模型太多,训练和预测更耗时。
就像问题中的图大样本和小样本比较极端,就可以考虑用两个分类模型。

针对第二类问题:
(1)思路一:剔除掉纯O的句子
(1)思路二:减少一句话中O的数量
如:

  • 建立原句的语法分析树,只取需要的部分。
    在这里插入图片描述

参考:
知乎中有类似的问题:
https://www.zhihu.com/question/340333687

http://www.yayakq.cn/news/958103/

相关文章:

  • 网站页面头部设计说明佛山网站搭建公司哪家好
  • 滕州网站建设培训微信扫二维码网页空白
  • 家具技术支持东莞网站建设苏州沧浪区做网站的
  • 域名做网站名什么是竞价推广
  • 备案期间网站能用吗电子政务网站系统
  • 南宁网站建设博信重庆市哪个区最繁华
  • 网站怎么备份没有rss源的网站如何做rss订阅
  • 枣庄三合一网站开发在手机上怎么建造网站
  • 如何做产品网站建设卖东西专业网站网上
  • 深圳网站备案青岛大学网站建设
  • 数字营销网站建设网站开发记入什么会计科目
  • 广西智能网站建设报价东莞24小时推广首页
  • 做网站蓝色和什么颜色搭配好看国外有名的网站
  • 洛阳网站建设制作多少钱亚马逊的网络营销方式
  • 北京市建设工程造价管理协会网站tinypng图片压缩网站
  • 绍兴专业做网站公司酒类网站建设方案案
  • 怎样建外贸网站网站开发工程师和软件工程
  • 金华网站推广什么是域名系统 网站建设教程
  • 大同建设局网站携程网站建设的优缺点
  • 公司网站开发题目来源wordpress设置导航栏
  • 桂林网站优化公司网站cms是什么
  • 成都科盛兴网站建设有限公司只做男生穿搭的网站
  • 网站备案的时候可以做网站吗怎样做网站后台
  • wordpress 视频站模板全屏产品网站
  • 网站gif横幅广告怎么做ip安装wordpress
  • 常州网站建设大全沧州网站群
  • 沈阳免费建网站wordpress 前端修改
  • 安徽安能建设集团网站金蝶财务软件
  • 网上商城平台运营方案太原seo排名优化公司
  • 备案的网站名与公司名称界面设计网站