当前位置: 首页 > news >正文

台州市椒江建设工程机械厂网站wordpress qq微信登陆地址修改密码

台州市椒江建设工程机械厂网站,wordpress qq微信登陆地址修改密码,建设积分兑换商城网站,文汇网站建设「作者主页」:士别三日wyx 「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》 sklearn数据集 二、安装sklearn二、获取数据集三、…

「作者主页」:士别三日wyx
「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者
「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》

sklearn数据集

  • 二、安装sklearn
  • 二、获取数据集
  • 三、数据集划分

机器学习是人工智能的一个实现途径,可以从「数据」中自动分析获得「模型」,并利用模型对未知数据进行「预测」

简单来说就是从历史数据中总结规律,用来解决新出现的问题。

从数据中总结规律,需要提供一个「数据集」,数据集由「特征值」「目标值」两部分组成。

机器学习有很多好用的工具,这里我们使用sekearn。

sklearn是基于Python的机器学习工具包,自带大量数据集,可供我们练习各种机器学习算法。

二、安装sklearn

环境要求:

  • Python(>=2.7 or >=3.3)
  • NumPy (>= 1.8.2)
  • SciPy (>= 0.13.3)

先安装 numpyscipy,再安装 scikit-learn

PyCharm左上角【file】-【Settings】-【Project:pythonProject】-【Python Interpreter】

在这里插入图片描述

二、获取数据集

sklearn数据集有有三种「获取数据」的方式:

  • sklearn.datasets.load_*():小规模数据集(本地加载)
  • sklearn.datasets.fetch_*():大规模数据集(在线下载)
  • sklearn.datasets.make_*():本地生成数据集(本地构造)

sklearn数据集的「返回值」是字典格式:

  • data:特征值数据数组
  • target:目标值数据数组(标签)
  • target_names:标签名(目标值和标签的对应关系)
  • DESCR:数据描述
  • feature_names:特征名

接下来,我们获取一个自带的本地数据集:

from sklearn import datasets# 获取数据集
iris = datasets.load_iris()
# 打印数据集
print(iris)

输出:

在这里插入图片描述

从输出结果来看,它返回的数据集是一个字典,里面包含了特征值(data)、目标值(target)等信息。

我们可以调用返回值「属性」,单独查看数据集的某个信息:

from sklearn import datasets# 获取数据集
iris = datasets.load_iris()# 查看数据值
print(iris.data)
# 查看目标值(标签)
print(iris.target)
# 查看标签名
print(iris.target_names)
# 查看数据描述
print(iris.DESCR)
# 查看特征名
print(iris.feature_names)

三、数据集划分

数据集通常会划分为两个部分:

  • 「训练数据」:用于训练,生成模型。
  • 「测试数据」:用于检验,判断模型是否有效。

sklearn.model_selection.train_test_split() 用来划分数据集

参数:

  • x:(必选)数组类型,数据集的特征值
  • y:(必选)数组类型,数据集的目标值
  • test_size:(可选,默认0.25)浮点型,测试集的大小
  • random_state:(可选)整型,随机数种子,不同的随机数对应不同的采样结果。

返回值:

  • 训练集特征值、测试集特征值、训练集目标值、测试集目标值

接下来,我们对刚才获取的本地数据集进行划分,测试集大小不给值,就是默认的0.25,意思是25%当做测试数据、剩下的75%当做训练数据。

from sklearn import datasets
from sklearn import model_selection# 获取数据集
iris = datasets.load_iris()# 数据集的特征值
data_arr = iris.data
# 数据集的目标值(标签)
target_arr = iris.targetx_data, y_data, x_target, y_target = model_selection.train_test_split(data_arr, target_arr)
print('训练集特征值', x_data)
print('测试集特征值', y_data)
print('训练集目标值', x_target)
print('测试集目标值', y_target)
http://www.yayakq.cn/news/474115/

相关文章:

  • 现在的网络推广怎么做网络seo排名
  • 杭州有专业做网站小型服装厂吗信息流广告剪辑
  • 自贡建设专业网站设计东莞英文网站制作
  • 说说刷赞网站推广在线咨询 1 网站宣传
  • 哈尔滨专业网站建设公司公司注销网站备案
  • 网站开发项目的里程碑软件外包公司创业
  • 怎样给网站做排名优化免费建一级域名网站
  • 如何做旅游网站游戏网站怎么制作
  • 网站开发所需要的的环境校园视频网站建设
  • 广州市城市建设开发总公司网站安装好的字体怎么用wordpress
  • 交易网站开发职业生涯规划
  • 网站没被收录服装网站建设的规模和类别
  • 吉林省建设厅网站二建管理系统百度云盘网页版
  • 免费做长图的网站珠海网站推广价格
  • 深圳龙岗网站制作wordpress动漫图片主题
  • 永康网站建设的公司服装设计公司有哪些
  • 安徽省外经建设集团有限公司网站小程序开发教程百度网盘
  • 虚拟主机做网站教程如何做微信商城网站
  • 建网站的重要性电商小程序报价
  • 个人可以做公益网站吗php网站建设制作
  • 做公众号首图的网站定西市小企业网站建设
  • 网站地图页面设计做网站哪家便宜
  • 电商类网站开发健康网站模版
  • 深圳的网站建设公司那家好私人网站如何建
  • 网站建站收费网站建设与设计方案
  • 什么软件可以做网站动图建设行业管理信息系统官网
  • 百度站长工具验证wordpress设置配置文件报错
  • 做吗查网站的流量佛山外发加工网
  • 最快做网站的语言软件开发流程管理
  • 常德农科院网站个人婚礼网站设计