当前位置: 首页 > news >正文

潍坊网站建设服务商做房地产策划需要关注的网站

潍坊网站建设服务商,做房地产策划需要关注的网站,wordpress如何上传产品,深圳房产 网站建设XGBoost模型预测的主要大致思路: 1. 数据准备 首先,需要准备数据。这包括数据的读取、预处理和分割。数据应该包括特征和目标变量。 步骤: 读取数据:从CSV文件或其他数据源读取数据。数据清理:处理缺失值、异常值等…

XGBoost模型预测的主要大致思路:

1. 数据准备

首先,需要准备数据。这包括数据的读取、预处理和分割。数据应该包括特征和目标变量。

步骤:
  • 读取数据:从CSV文件或其他数据源读取数据。
  • 数据清理:处理缺失值、异常值等。
  • 数据转换:将因变量转换为因子类型,特征变量转换为适合模型输入的格式。
  • 数据分割:将数据分为训练集和测试集,一般按照8:2的比例分割。

2. 特征工程

特征工程是提升模型性能的关键步骤。包括:

  • 特征选择:选择对预测目标最重要的特征。
  • 特征转换:将分类变量转换为数值变量(如独热编码)。
  • 特征缩放:标准化或归一化特征值。

3. 转换数据格式

XGBoost需要输入数据为矩阵格式。因此,需要将数据转换为稀疏矩阵格式。

4. 训练模型

训练模型是整个过程的核心步骤。需要设置模型的参数,并使用训练数据进行训练。

关键点:
  • 设置参数:包括树的深度、学习率、采样率等。
  • 交叉验证:使用交叉验证找到最佳的迭代次数。
  • 模型训练:使用最佳参数训练模型。

5. 模型调参

为了获得最佳模型性能,需要进行参数调优。常用的方法有网格搜索、随机搜索和贝叶斯优化。

6. 模型评估

使用测试集评估模型性能。常用的评估指标有准确率、精确率、召回率、F1分数等。

步骤:
  • 生成预测值:使用测试集生成预测值。
  • 计算评估指标:根据预测值和实际值计算模型性能指标。

7. 模型预测

使用训练好的模型对新数据进行预测。将新数据转换为与训练数据相同的格式,然后进行预测。

8. 模型保存和加载

训练好的模型可以保存到文件中,以便后续加载和使用。

步骤:
  • 保存模型:将模型保存到文件中。
  • 加载模型:从文件中加载模型,以便进行预测。

本文数据和代码案例

library(xgboost)
library(Metrics)
library(ggplot2)
library(readxl)
library(dplyr)# 读取数据
data <- read_excel("分析数据.xlsx")# 用每列的后一个值填充缺失值
data1 <- data %>%mutate(across(everything(), ~ ifelse(is.na(.), lead(.), .)))# 查看填充后的数据
head(data1)
# 分离特征和响应变量
X <- data1 %>% select(-ILI) # 移除ILI列
y <- data1$ILI
# 划分训练集和测试集
set.seed(123) # 确保可重复性
train_indices <- sample(1:nrow(data1), size = 0.7 * nrow(data1))
train_data <- X[train_indices, ]
train_label <- y[train_indices]
test_data <- X[-train_indices, ]
test_label <- y[-train_indices]
# 设置XGBoost参数
params <- list(booster = "gbtree",objective = "reg:squarederror",eta = 0.1
# 训练模型
model <- xgb.train(params, dtrain, nrounds = 150)# 预测
predictions <- predict(model, dtest)
# 输出评价指标
cat("R2:", R2, "\n")
cat("Adjusted R2:", adj_R2, "\n")
cat("RMSE:", RMSE, "\n")
cat("MSE:", MSE, "\n")

最终可视化评价指标

# 可视化
# 创建散点图和回归线
scatter_plot <- data.frame(Actual = test_label, Predicted = predictions) %>%ggplot(aes(x = Actual, y = Predicted)) +geom_point() +geom_smooth(method = "lm", col = "blue") +xlab("Actual ILI1") +ylab("Predicted ILI1") +ggtitle("Actual vs Predicted")# 设置标题居中
scatter_plot +theme(plot.title = element_text(hjust = 0.5))

思路主要是使用R语言进行XGBoost模型预测的流程包括数据准备、模型训练、参数调优、模型评估和预测。首先,加载数据并进行预处理,然后使用 xgb.cvxgb.train 函数进行模型训练和交叉验证。接着,通过调整参数优化模型性能,最后使用测试集评估模型,并使用训练好的模型进行预测新数据。 

数据和完整代码

创作不易,希望大家多多点赞收藏和评论!

http://www.yayakq.cn/news/361334/

相关文章:

  • 模板网站对排名的影响仿《快乐麻花》网站源码
  • 亚马逊网站怎么做公司部门简称
  • 电子书网站搭建教程建网站 陕西牛人网络科技
  • 网站建设中faqs的意思网建科技北京有限公司
  • 网站改用绝对地址的好处梅林网站建设公司
  • 网站怎么更改布局设置网站开场动画
  • 郑州市城乡建设规划网站2024新冠会再次封城吗现在
  • 如何评价小米的网站建设长春网站外包
  • 知知网站推荐免费网站开发公司
  • 网站开发 书永川网站建设熊掌号
  • 公司做的网站费用计入什么科目p2p提供网站建设违法
  • 做网站公众号canvas做的网站
  • 微信网站建设哪家好腾讯云做网站教程
  • 大连网络备案做网站模仿ios系统的html网站
  • h5网站作用百度云资源搜索
  • 软件网站怎么做的中国常州网官网
  • 安庆做网站的推广关键词优化公司
  • 公司网站建设项目目的wordpress主题滑动
  • 网站pr怎么提升青岛网站制作公司
  • 设计公司企业站西安 网站建设外包
  • 大学生做网站和做app网站策划ps
  • 手机网站建设wap网站建设相关知识博客
  • 网站开发学习培训wordpress免费采集
  • 门户网站建设投资服务网点网站建设
  • 惠州网站建设科技有限公司二级域名网站权重
  • 网站里自己怎么做推广做网站付款流程
  • 电子商务网站与建设课件北京网站建设的价格
  • 提供网站建设的各类服务专注南昌网站建设
  • wordpress网站前台打开慢如何设计网站布局
  • vs2105制作个人网站行业网站建设哪家好