当前位置: 首页 > news >正文

网站地址验证失败空壳网站清理

网站地址验证失败,空壳网站清理,淄博品牌策划公司,一般给公司做网站用什么软件划分依据 基尼系数基尼系数的应用信息熵信息增益信息增益的使用信息增益准则的局限性 最近在学习项目的时候经常用到随机森林,所以对决策树进行探索学习。 基尼系数 基尼系数用来判断不确定性或不纯度,数值范围在0~0.5之间,数值越低&#x…

划分依据

    • 基尼系数
    • 基尼系数的应用
    • 信息熵
    • 信息增益
    • 信息增益的使用
    • 信息增益准则的局限性

最近在学习项目的时候经常用到随机森林,所以对决策树进行探索学习。

基尼系数

基尼系数用来判断不确定性或不纯度,数值范围在0~0.5之间,数值越低,数据集越纯。
基尼系数的计算:
假设数据集有K个类别,类别K在数据集中出现的概率为Pk,则基尼系数为:
在这里插入图片描述
上式是用来求某个节点的基尼系数,要求某个属性的基尼系数用下面的公式:
在这里插入图片描述
最后选择基尼系数最小的属性进行划分即可。

基尼系数的应用

在决策树中,假如某个节点的基尼系数就是0,此时被分类到这个节点的数据集是纯的,意思就是按照此叶节点的父节点的分类方法来说,此叶节点都是同一个类别的,不需要再次分裂决策。

信息熵

信息熵和基尼系数作用相同,都是用来度量样本集合纯度的指标。
计算方法:
在这里插入图片描述
Pk是当前样本集合中第k类样本所占比例,Ent(D)(信息熵)越小,集合D的纯度越高。

这里约定当Pk为0时Ent(D)=0;

信息增益

计算公式:在这里插入图片描述
假设现在对集合D使用属性a来进行划分,属性a有v个取值,也就是有v个节点,上式中Dv是第v个节点就是取值为v的样本个数。

信息增益的使用

信息增益越大,说明使用属性a来划分所获得的纯度提升越大,决策树越好。

信息增益准则的局限性

从上面的公式可以看出,信息增益偏好可取值数目较多的属性,假如某个属性可取值达到了n,也就是每个样本都不一样,比如“编号”属性,那可以计算出这个属性的信息增益接近1,选择这样的属性来划分很可能不具有泛化能力。
改进:
使用增益率在这里插入图片描述
对于这个公式,当属性a的可取值越多时,则IV(a)会越大,增益率变小,进行了平衡。同样的,增益率准则也有局限,它对可取值较少的属性又有所偏好。

最终:先找出信息增益高于平均水平的属性,再从中选择增益率最高的即可。

http://www.yayakq.cn/news/727401/

相关文章:

  • 重庆网网站建设公司友情链接交换网址大全
  • 网站群系统机械网站建设多少钱
  • 四维码制作网站网站手机版怎么做的
  • 1000M双线网站空间用dw做的网站怎么发到网上
  • 做英文网站哪个网站比较好深圳最好的品牌设计公司
  • 安庆网站开发电子商务网站建设 ppt
  • 昆山高端网站建设公司昆山做网站多少钱
  • 个人备案后做淘客网站东莞阿里巴巴代运营公司
  • 做自己的卡盟网站自动优化网站建设咨询
  • 网站的例子网站怎么做直通车
  • 古镇中小企业网站建设wordpress 谷歌广告
  • 作文网站排行榜前十名怎么制作个人求职网站
  • 安徽网站建设大全江西省建设工程安全质量监督管理局网站
  • 如何写网站文案没有网站可以做淘宝客
  • 阿里小说网站模板网红营销的特点
  • 做网站推广那家好文件下载网站源码
  • 用网站做赌彩广告wordpress建表
  • 个人网站制作成品广告公司简介宣传册
  • 做童装在哪个网站做广告网站如何建设目录结构
  • 实时网站制作东莞网站SEO优化托管
  • 网站建设定价湖南移动官网网站建设
  • 做机械配件的网站wordpress adsense integrator
  • 网站点击换图片的效果怎么做做游戏模型参考的网站
  • 做网站被骗网站搜索排名怎么做
  • 保险网站建设平台商城网站开发企业
  • 哪里有做网站服务商淇县网站建设
  • 搭建一个网站教程毕业设计网站开发的中期报告
  • 二手网站建设论文答辩wordpress图片编辑插件
  • 建网站 域名北京顺义做网站
  • 怎么更改网站域名wordpress自动采集发布插件