当前位置: 首页 > news >正文

宁波海曙网站开发公司电话微信网站建设方案ppt

宁波海曙网站开发公司电话,微信网站建设方案ppt,wordpress 媒体,上海畔游网络科技有限公司引言 集成学习:让机器学习效果更好,单个不行,群殴走起。 分类 1. Bagging:训练多个分类器取平均(m代表树的个数)。 2.Boosting(提升算法):从弱学习器开始加,通过加权来进行训练。…

引言

集成学习:让机器学习效果更好,单个不行,群殴走起。

分类

1. Bagging:训练多个分类器取平均(m代表树的个数)。

2.Boosting(提升算法):从弱学习器开始加,通过加权来进行训练。(它与上面的不同在于它不是随机几颗树取平均,而是加入一棵树要比原来强)

 3.Stacking:聚合多个分类或回归模型(可以分阶段来做)

介绍

Bagging全称(bootstrap aggregation)在其算法中训练每一棵树之间是没有影响的,说白了就是并行训练一堆分类器。

典型代表随机森林:随机代表数据采样随机,特征选择随机,为了避免重复,但算法已经固定为了增加多样性则就是数据的采样要随机。森林代表很多个决策树并行放在一起。

随机森林中分类和回归的做法:

 在做分类任务的时候两个类别被分为A一个被分为B,那么则选择少数服从多数最后类别为A。

在做回归任务的时候分别为100、200、300,则最终结果为(100+200+300)/3

随机森林的优点:

1.可解释性强,便于分析。(对于神经网络、深度学习都是黑盒子,我们只能得到输入和输出内部很复杂看不到。)

2.在训练结束,它能够给出特征重要型排序,如下图:

 3.并行化方法,速度快

软投票和硬投票

一、硬投票:直接用类别值,少数服从多数

(1)准备数据并且可视化

%matplotlib inline
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.datasets import make_moons
X,y=make_moons(n_samples=500,noise=0.30,random_state=42)
X_train,X_test,y_train,y_test=train_test_split(X,y,random_state=42)
plt.plot(X[:,0][y==0],X[:,1][y==0],'yo',alpha=0.6)#alpha 代表透明程度
plt.plot(X[:,0][y==0],X[:,1][y==1],'bs',alpha=0.6)

结果如图所示:

(2)硬投票

from sklearn.ensemble import RandomForestClassifier,VotingClassifier #随机森林和投票器
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
#进行实例化
log_clf=LogisticRegression()
rnd_clf=RandomForestClassifier()
svm_clf=SVC()
voting_clf=VotingClassifier(estimators=[('lr',log_clf),('rf',rnd_clf),('svc',svm_clf)],voting='hard')
voting_clf.fit(X_train,y_train)

(3)模型评价

from sklearn.metrics import accuracy_score
for clf in (log_clf,rnd_clf,svm_clf,voting_clf):clf.fit(X_train,y_train)y_pred=clf.predict(X_test)print(clf.__class__.__name__,accuracy_score(y_test,y_pred))

结果如下:

 二、软投票:各自分类器的概率值进行加权平均

数据不变,只需要将上面代码进行修改。代码如下:

from sklearn.ensemble import RandomForestClassifier,VotingClassifier #随机森林和投票器
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
#进行实例化
log_clf=LogisticRegression()
rnd_clf=RandomForestClassifier()
svm_clf=SVC(probability=True)
voting_clf=VotingClassifier(estimators=[('lr',log_clf),('rf',rnd_clf),('svc',svm_clf)],voting='soft')
voting_clf.fit(X_train,y_train)
from sklearn.metrics import accuracy_score
for clf in (log_clf,rnd_clf,svm_clf,voting_clf):clf.fit(X_train,y_train)y_pred=clf.predict(X_test)print(clf.__class__.__name__,accuracy_score(y_test,y_pred))

模型评价结果如图:

 明显比上一个效果好。

http://www.yayakq.cn/news/307483/

相关文章:

  • ecilpse做网站wordpress的模板文件下载
  • 网站建设专业性的评价php做网站界面代码
  • 桂林北站附近景点关键词制作软件
  • 移动网站建设服务商品牌推广营销
  • 无经验可以做网站编辑吗云优cms
  • 手机网站建设规划书挂网站需要什么服务器
  • 做网站销售水果p2p金融网站开发
  • 线上网站开发系统流程图网站开发的相关技能
  • 平台网站建设公司随州网络科技有限公司
  • 西宁网站建设价格低做网站的公司重庆
  • 闽侯福州网站建设深圳松岗 网站建设
  • 一般做海报的图片跟哪个网站下载wordpress comment
  • 婚介网站建设的策划天眼查企业查询在线官网
  • 网站建设最低要求长春网站建设推广优化
  • 网站页面一般做多大wordpress清理过期文件
  • 婺源网站建设网站开发接口文档模板
  • 西安网站建设项目武侯区网站建设
  • 微网站是自己做可以不江西南昌网站建设招标
  • 广州建设外贸网站凡科免费建站
  • 自己做直播网站玉树wap网站建设
  • 景宁县建设局网站市场调研报告范文3000字
  • 没有网站如何做SEO推广有用吗网叶制作
  • 密云广州网站建设学校品牌建设
  • dedecms 门户网站国际局势最新消息今天
  • 网站开发所需要的书籍在长沙做网站需要多少钱
  • 私人服装定制网站用wordpress教程视频
  • 深圳市网站开发坂田附近商品推广软文写作500字
  • 口碑好网站建设价格网站主题页
  • 本地环境如何安装wordpress湖南优化公司
  • 界面设计网站推荐手表回收网网站