当前位置: 首页 > news >正文

建设网站的运行费包括什么wordpress模板QQ评论

建设网站的运行费包括什么,wordpress模板QQ评论,园林景观设计效果图,如何建设好营销网站文章目录 sklearn学习(30) 模型选择与评估-验证曲线: 绘制分数以评估模型30.1. 验证曲线30.2. 学习曲线 sklearn学习(30) 模型选择与评估-验证曲线: 绘制分数以评估模型 文章参考网站: https://sklearn.apachecn.org/ 和 https://scikit-learn.org/stable/ 每种估…

文章目录

  • sklearn学习(30) 模型选择与评估-验证曲线: 绘制分数以评估模型
    • 30.1. 验证曲线
    • 30.2. 学习曲线

sklearn学习(30) 模型选择与评估-验证曲线: 绘制分数以评估模型

文章参考网站:
https://sklearn.apachecn.org/

https://scikit-learn.org/stable/

每种估计器都有其优势和缺陷。它的泛化误差可以用偏差、方差和噪声来分解。估计值的 偏差 是不同训练集的平均误差。估计值的 方差 用来表示它对训练集的变化有多敏感。噪声是数据的一个属性。

在下面的图中,我们可以看到一个函数 f ( x ) = cos ⁡ ( 3 2 π x ) f(x) = \cos (\frac{3}{2} \pi x) f(x)=cos(23πx) 和这个函数的一些噪声样本。 我们用三个不同的估计来拟合函数: 多项式特征为1,4和15的线性回归。我们看到,第一个估计最多只能为样本和真正的函数提供一个很差的拟合 ,因为它太简单了(高偏差),第二个估计几乎完全近似,最后一个估计完全接近训练数据, 但不能很好地拟合真实的函数,即对训练数据的变化(高方差)非常敏感。

http://sklearn.apachecn.org/cn/0.19.0/_images/sphx_glr_plot_underfitting_overfitting_0011.png

偏差和方差是估计所固有的属性,我们通常必须选择合适的学习算法和超参数,以使得偏差和 方差都尽可能的低(参见偏差-方差困境)。 另一种降低方差的方法是使用更多的训练数据。不论如何,如果真实函数过于复杂并且不能用一个方 差较小的估计值来近似,则只能去收集更多的训练数据。

在一个简单的一维问题中,我们可以很容易看出估计值是否存在偏差或方差。然而,在高维空间中, 模型可能变得非常难以具象化。 出于这种原因,使用以下工具通常是有帮助的。

示例:

  • Underfitting vs. Overfitting
  • Plotting Validation Curves
  • Plotting Learning Curves

30.1. 验证曲线

我们需要一个评分函数(参见模型评估:模型评估: 量化预测的质量)来验证一个模型, 例如分类器的准确性。 选择估计器的多个超参数的正确方法当然是网格搜索或类似方法 (参见调优估计的超参数 调整估计器的超参数 ),其选择一个或多个验证集上的分数最高的超参数。 请注意,如果我们基于验证分数优化了超参数,则验证分数就有偏差了,并且不再是一个良好的泛化估计。 为了得到正确的泛化估计,我们必须在另一个测试集上计算得分。

然而,绘制单个超参数对训练分数和验证分数的影响,有时有助于发现该估计是否因为某些超参数的值 而出现过拟合或欠拟合。

本例中,下面的方程 validation_curve 能起到如下作用:

>>> import numpy as np
>>> from sklearn.model_selection import validation_curve
>>> from sklearn.datasets import load_iris
>>> from sklearn.linear_model import Ridge>>> np.random.seed(0)
>>> iris = load_iris()
>>> X, y = iris.data, iris.target
>>> indices = np.arange(y.shape[0])
>>> np.random.shuffle(indices)
>>> X, y = X[indices], y[indices]>>> train_scores, valid_scores = validation_curve(Ridge(), X, y, "alpha",
...                                               np.logspace(-7, 3, 3),
...                                               cv=5)
>>> train_scores            
array([[0.93..., 0.94..., 0.92..., 0.91..., 0.92...],[0.93..., 0.94..., 0.92..., 0.91..., 0.92...],[0.51..., 0.52..., 0.49..., 0.47..., 0.49...]])
>>> valid_scores           
array([[0.90..., 0.84..., 0.94..., 0.96..., 0.93...],[0.90..., 0.84..., 0.94..., 0.96..., 0.93...],[0.46..., 0.25..., 0.50..., 0.49..., 0.52...]])

如果训练得分和验证得分都很低,则估计器是不合适的。如果训练得分高,验证得分低,则估计器过拟合, 否则估计会拟合得很好。通常不可能有较低的训练得分和较高的验证得分。所有三种情况都可以 在下面的图中找到,其中我们改变了数字数据集上 SVM 的参数 γ \gamma γ

http://sklearn.apachecn.org/cn/0.19.0/_images/sphx_glr_plot_validation_curve_0011.png

30.2. 学习曲线

学习曲线显示了对于不同数量的训练样本的估计器的验证和训练评分。它可以帮助我们发现从增加更多的训 练数据中能获益多少,以及估计是否受到更多来自方差误差或偏差误差的影响。如果在增加训练集大小时,验证分数和训练 分数都收敛到一个很低的值,那么我们将不会从更多的训练数据中获益。在下面的图中看到一个示例:朴素贝叶斯大致收敛到一个较低的分数。

http://sklearn.apachecn.org/cn/0.19.0/_images/sphx_glr_plot_learning_curve_0011.png

我们可能需要使用评估器或者一个当前评估器的参数化形式来学习更复杂概念(例如有一个较低的偏差)。 如果训练样本的最大时,训练分数比验证分数得分大得多,那么增加训练样本很可能会增加泛化能力。 在下面的图中,可以看到支持向量机(SVM)可以从更多的训练样本中获益。

http://sklearn.apachecn.org/cn/0.19.0/_images/sphx_glr_plot_learning_curve_0021.png

我们可以使用:learning_curve函数来绘制这样一个学习曲线所需的值(已使用的样本数量,训练集 上的平均分数和验证集上的平均分数):

>>> from sklearn.model_selection import learning_curve
>>> from sklearn.svm import SVC>>> train_sizes, train_scores, valid_scores = learning_curve(
...     SVC(kernel='linear'), X, y, train_sizes=[50, 80, 110], cv=5)
>>> train_sizes            
array([ 50, 80, 110])
>>> train_scores           
array([[0.98..., 0.98 , 0.98..., 0.98..., 0.98...],[0.98..., 1.   , 0.98..., 0.98..., 0.98...],[0.98..., 1.   , 0.98..., 0.98..., 0.99...]])
>>> valid_scores           
array([[1. ,  0.93...,  1. ,  1. ,  0.96...],[1. ,  0.96...,  1. ,  1. ,  0.96...],[1. ,  0.96...,  1. ,  1. ,  0.96...]])
http://www.yayakq.cn/news/485380/

相关文章:

  • 婚礼婚庆网站建设需求分析营销策划公司 品牌策划公司
  • 天津企业网站专业订制wordpress用户密码 破解
  • 贵州两学一做教育网站dede减肥网站模板
  • 芜湖企业做网站网页设计是做什么
  • 佛山高端网站开发公司wordpress 中文官网
  • 用凡科做的手机网站版高端网站建设推来客网络
  • jsp ajax网站开发典型实例 pdf百度图片识别在线识图
  • 新网站上线怎么做seo学编程的步骤
  • 长沙做一个网站要多少钱品牌建设的阶段和步骤是什么
  • 导航网址网站怎么做wordpress被改密码
  • 网站建设咋打开自己网站主页网址设计学校网站模板免费下载
  • 门户网站标题居中加大软件外包公司容易进吗
  • 备案时的网站名称国外网站建设平台
  • 男做女爱网站正规的营销型网站建设
  • 网站开发工具.晴天娃娃自己电脑做主机怎么做网站
  • 宁波网站建设官网素材网站 源码
  • 新钥匙建站网站域名好了下一步
  • 专门做毕设的网站apicloud手机版下载
  • 宁波建设银行管方网站辽阳百姓网免费发布信息网
  • 网站风格对比免费做h5的手机软件
  • 深圳平价的专业建站公司wordpress自动推送
  • 做购物车的网站成都 专业 网站建设
  • 中国风网站模板职业生涯规划大赛活动目的
  • 怎么做优化网站排名辽源市建设局网站
  • 聊城网站建设工作室上海网站维护
  • 鹤壁北京网站建设光明建网站的公司
  • 美容院网站制作青海西宁网站建设
  • 租用外国服务器网站网站建设如何做网站竞品分析
  • 营销型企业网站开发商丘河南网站建设
  • 网站建设经验心得济南高新区建设局网站