当前位置: 首页 > news >正文

仿网站收费苏州网站推

仿网站收费,苏州网站推,怎么看网站关键词排名,建设网站需要下载神呢软件吗我们已经知道通过 L1 正则化和 SBS 算法可以用来做特征选择。 我们还可以通过随机森林从数据集中选择相关的特征。随机森林里面包含了多棵决策树,我们可以通过计算特征在每棵决策树决策过程中所产生的的信息增益平均值来衡量该特征的重要性。 你可能需要参考&…

我们已经知道通过 L1 正则化和 SBS 算法可以用来做特征选择。

我们还可以通过随机森林从数据集中选择相关的特征。随机森林里面包含了多棵决策树,我们可以通过计算特征在每棵决策树决策过程中所产生的的信息增益平均值来衡量该特征的重要性。

你可能需要参考:《机器学习系列06:决策树》

这种方法无需对特征做归一化或者标准化预处理,也不假设数据集是否线性可分。

以红酒数据集为例。我们可以直接通过 feature_importances_ 属性获取每个特征的重要性,所有特征重要性之和为 1.0。

图片

我们可以更直观地可视化观察一下。

图片

可以看到上面随机森林选出的前 3 个特征最重要的特征中有 2 也出现在了之前在
《机器学习系列12:减少过拟合——降维(特征选择)》中使用 SFS 算法选择的 3 个最重要的特征中。

图片

我们可以通过 scikit-learn 提供的 SelectFromModel 来通过 threshold 参数设定一个阈值 ,选择满足这个贡献度阈值的特征出来。

图片

可以看到选择了 5 个特征,现在我们就用这 5 个特征拟合一下 kNN 算法。

图片

可以对比一下在用 SFS 算法选择的 3 个特征拟合的 kNN 算法。

图片

选择 5 个特征时,模型在训练集和测试集上的表现和选择全部特征的表现相当!

http://www.yayakq.cn/news/254228/

相关文章:

  • 优秀国内个人网站城乡建设网站职业查询系统
  • 网站app免费生成软件网站开发参考书目
  • 餐饮网站网页设计代码个人养老保险怎么买最划算
  • 在网站文字上做笔记哪里有免费的网站域名
  • 沈阳网站设计制作公司张家港阿里网站建设
  • 深圳网站制作建设哪家专业程序小程序开发公司
  • 深圳做律师网站公司友汇网站建设一般多少钱
  • dw中旅游网站怎么做天津专业网站建设
  • 南宁网站建设制作定制wordpress 本地服务器
  • 建设银行的网站特点广州品牌网站设计公司
  • 平面设计软件网站备案用网站建设方案
  • 百度做网站价格110平米三室一厅简装图片
  • 增城做网站要多少钱网站的建设维护推广
  • 阳江建设网站wordpress可以上传网页吗
  • wordpress如何仿站我要下载中国建设网站
  • 网站设计师主要做什么的wordpress版权加密
  • 杭州建设网站网站网站海外seo
  • easyui做网站软件开发是什么意思
  • 大兴建站推广贵阳网站建设黔搜
  • idc销售网站源码公司网站设计模板
  • 资源优化排名网站商丘做网站优化
  • 为什么网站上传照片传不上去网站的整合
  • 网站建设 推广wordpress帮助中心模板
  • 笑话网站 wordpress外贸网站建设服务商
  • dw代码做网站网站主域名是什么
  • 黄山网站设计成都设计公司排行
  • 四川网站建设方案设计接单赚钱平台
  • 网站建设佰首选金手指七德米萨erp
  • wordpress 插件下载站成都科技网站建设找
  • 品牌网站建设 蝌蚪小8北京营销型网站建设哪家好