当前位置: 首页 > news >正文

深圳网站建设三把火科技有关学校网站建设策划书

深圳网站建设三把火科技,有关学校网站建设策划书,个人网页首页模板,旅游网站的建设背景随机森林 1、集成学习方法 通过构造多个模型组合来解决单一的问题。它的原理是生成多个分类器/模型,各自独立的学习和做出预测。这些预测最后会结合成组合预测,因此优于任何一个单分类得到的预测。 2、什么是随机森林? 随机森林是一个包含…

随机森林

随机森林

1、集成学习方法

通过构造多个模型组合来解决单一的问题。它的原理是生成多个分类器/模型,各自独立的学习和做出预测。这些预测最后会结合成组合预测,因此优于任何一个单分类得到的预测。

2、什么是随机森林?

随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。
随机:设训练集有N个样本,M个特征
1)训练集随机 (采用bootstrap,即采用随机有放回抽样方法),从训练集里随机有放回的抽取N个样本
2)特征随机生成(从M个特征中随机抽取m个特征, M >> m)
森林:指由多棵决策树构成

3、API调用

在sklearn中,提供了随机森林的API,如下

sklearn.ensemble.RandomForestClassifier(n_estimator= 10, criterion='gini', max_depth=None, bootstrap = True,random_state =None, max_features='auto')
"""
n_estimator:预估器个数,即决策树数量
criterion:分割特征的测量方法,默认为基尼系数
max_depth:最大深度,即分类层数
bootstrap:默认为True,是否在构建树的时候有放回抽样
max_features:每个决策树的最大特征数量,如果设置为auto,则m=sqrt(M),M表示样本数量
"""

4、随机森林实例–预测泰坦尼克号生存乘客生存率

参数介绍:pclass表示客舱等级(间接反映乘客阶级),survived表示是否存活,后面依次表示姓名,年龄,乘客登船港口,家庭住址,房间号,船票1号码,boat表示是否登上救生艇,登上了则显示对应救生艇编号,空值表示没有登上,sex为性别

import pandas as pd
data = pd.read_csv(r'E:\Python_learning\py基础\machine_learning\titanic\titanic.csv')
# 筛选关键因素

data数据集前5行

# 选取特征列
features = data[['pclass','age','boat','sex']]
target = data['survived']
# 先查看有无缺失值
pd.isnull(features).any()   # 发现年龄、是否乘坐救生舱有空值

在这里插入图片描述

# 填补空缺值
features.fillna({'age':features['age'].mean()},inplace=True)
# 转换为字典
features = features.to_dict(orient='records')
# 使用字典特征抽取,转化成one-hot编码
from sklearn.feature_extraction import DictVectorizer
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(features,target)
transfer = DictVectorizer(sparse=False)
x_train = transfer.fit_transform(x_train)
x_test = transfer.transform(x_test)
from sklearn.ensemble import  RandomForestClassifier
from sklearn.model_selection import GridSearchCV
estimator = RandomForestClassifier()
para_dict={"n_estimators":[120,200,300,500,800,1200], 'max_depth':[5,8,15,25,30]}
estimator = GridSearchCV(estimator,  param_grid=para_dict, cv=4)
estimator.fit(x_train,y_train)
y_predict = estimator.predict(x_test)
print(f"模型准确率为:{estimator.score(x_test, y_test)}")
print("最佳参数为:", estimator.best_params_)
print("最佳准确率为:\n", estimator.best_score_)
print("最佳估计器为:\n", estimator.best_estimator_)
print("交叉验证结果:\n", estimator.cv_results_)

在这里插入图片描述

http://www.yayakq.cn/news/112369/

相关文章:

  • 网站怎么防采集微信公众号怎样做淘客网站
  • 网站推广对接网页修改和编辑的软件有哪些
  • 聊城做网站信息包头哪里做网站
  • 分析北师大教育学原理网站建设网站制作案例价格
  • 北京工程建设信息网站余姚网站定制
  • 重庆巴南区网站开发去哪儿网站排名怎么做
  • 织梦调用网站名称WordPress网易云插卡
  • 宿迁网站搭建单位网站建设开发公司
  • 合肥中小企业网站制作在哪建网站
  • 网站制作费用低商标设计网站排行
  • 做网站用什么配置的vpsWordpress有用么
  • 主页值得是网站的主要内容所在页建筑公司名字大全20000个
  • 静海县建设局网站长丰县建设局网站
  • 有没有做q版头像的网站东莞seo网站排名优化
  • 利用帝国cms网站建设网页游戏排行榜前十平台
  • 坤和建设 网站青岛建设公司网站
  • 天津公司建设网站wordpress 图灵机器人
  • 深圳专业做网站排名多少钱服装网站建设规划书范文
  • 免费的网站申请深圳建网站服务
  • 网站开发的合同范本直播网站建设需要多少钱
  • 图书馆门户网站建设的意义如何使用wordpress插件
  • 网站logo名词解释适合企业做外贸的几个网站
  • 万宁市住房和城乡建设厅网站饿了吗外卖网站怎么做
  • 南宁网站建设q.479185700強深圳品牌模板网站建设
  • h5网站做微信小程序励志响亮的建筑公司名
  • 多种语言网站制作手机app免费开发软件
  • 设计公司官方网站dnf怎么做盗号网站
  • 视觉营销网站建设规划分析河北石家庄网站建设
  • 免费网站建设企业使用net域名的大网站
  • 专业网站制作设计公司哪家好西安企业排名