当前位置: 首页 > news >正文

重庆网站建设服务公司深圳品牌衣服店名称

重庆网站建设服务公司,深圳品牌衣服店名称,餐饮加盟网站制作,项目管理咨询公司[机器学习]Day 1~3 数据预处理第1步:导入库第2步:导入数据集第3步:处理丢失数据第4步:解析分类数据创建虚拟变量 第5步:拆分数据集为训练集合和测试集合第6步:特征量化 简单线性回归模型第一步:…

[机器学习]Day 1~3

  • 数据预处理
    • 第1步:导入库
    • 第2步:导入数据集
    • 第3步:处理丢失数据
    • 第4步:解析分类数据
      • 创建虚拟变量
    • 第5步:拆分数据集为训练集合和测试集合
    • 第6步:特征量化
  • 简单线性回归模型
  • 第一步:数据预处理
  • 第二步:训练集使用简单线性回归模型来训练
  • 第三步:预测结果
  • 第四步:可视化
    • 训练集结果可视化
    • 测试集结果可视化
  • 多元线性回归
    • 第1步: 数据预处理
      • 导入库
      • 导入数据集
      • 将类别数据数字化
      • 躲避虚拟变量陷阱
      • 拆分数据集为训练集和测试集
    • 第2步: 在训练集上训练多元线性回归模型
    • Step 3: 在测试集上预测结果

数据预处理

在这里插入图片描述

第1步:导入库

import numpy as np
import pandas as pd

第2步:导入数据集

//随后一列是label
dataset = pd.read_csv('Data.csv')//读取csv文件
X = dataset.iloc[ : , :-1].values//.iloc[行,列]
Y = dataset.iloc[ : , 3].values  // : 全部行 or 列;[a]第a行 or// [a,b,c]第 a,b,c 行 or

第3步:处理丢失数据

from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values = "NaN", strategy = "mean", axis = 0)
imputer = imputer.fit(X[ : , 1:3])
X[ : , 1:3] = imputer.transform(X[ : , 1:3])

第4步:解析分类数据

from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_X = LabelEncoder()
X[ : , 0] = labelencoder_X.fit_transform(X[ : , 0])

创建虚拟变量

onehotencoder = OneHotEncoder(categorical_features = [0])
X = onehotencoder.fit_transform(X).toarray()
labelencoder_Y = LabelEncoder()
Y =  labelencoder_Y.fit_transform(Y)

第5步:拆分数据集为训练集合和测试集合

#from sklearn.model_selection import train_test_split
from sklearn.cross_validation import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split( X , Y , test_size = 0.2, random_state = 0)

第6步:特征量化

from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_test = sc_X.transform(X_test)

简单线性回归模型

在这里插入图片描述

第一步:数据预处理

import pandas as pd
import numpy as np
import matplotlib.pyplot as pltdataset = pd.read_csv('studentscores.csv')
X = dataset.iloc[ : ,   : 1 ].values
Y = dataset.iloc[ : , 1 ].valuesfrom sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split( X, Y, test_size = 1/4, random_state = 0) 

第二步:训练集使用简单线性回归模型来训练

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor = regressor.fit(X_train, Y_train)

第三步:预测结果

Y_pred = regressor.predict(X_test)

第四步:可视化

训练集结果可视化

plt.scatter(X_train , Y_train, color = 'red')
plt.plot(X_train , regressor.predict(X_train), color ='blue')
plt.show()

测试集结果可视化

plt.scatter(X_test , Y_test, color = 'red')
plt.plot(X_test , regressor.predict(X_test), color ='blue')
plt.show()

多元线性回归

在这里插入图片描述

第1步: 数据预处理

导入库

import pandas as pd
import numpy as np

导入数据集

dataset = pd.read_csv('50_Startups.csv')
X = dataset.iloc[ : , :-1].values
Y = dataset.iloc[ : ,  4 ].values

将类别数据数字化

from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder = LabelEncoder()
X[: , 3] = labelencoder.fit_transform(X[ : , 3])
onehotencoder = OneHotEncoder(categorical_features = [3])
X = onehotencoder.fit_transform(X).toarray()

躲避虚拟变量陷阱

X = X[: , 1:]

拆分数据集为训练集和测试集

from sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.2, random_state = 0)

第2步: 在训练集上训练多元线性回归模型

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, Y_train)

Step 3: 在测试集上预测结果

y_pred = regressor.predict(X_test)
http://www.yayakq.cn/news/904019/

相关文章:

  • 精美网页源码网站抖音小程序怎么添加
  • 投票制作网站网页界面设计时颜色越多越好
  • 政务服务网站建设方案谷德设计网百度百科
  • 如何做Google外贸网站网站 内部搜索引擎
  • 太原做网站价格wordpress wp_register()
  • 如何做网站需求百度安全中心
  • 现在还有企业要建网站吗做网站程序员
  • 医疗网站前置审批北京网站建设公司完美湖南岚鸿首 选
  • 无锡网站建设报价网站的内容管理
  • 门户网站解决方案wordpress 功能 rss
  • 网站设计的建设目的seo口碑优化
  • 四川建设厅官方网站证件查询长沙推广优化公司
  • 网站建设蓝色工匠百度域名的ip
  • 无人一区二区区别是什么岳阳seo公司
  • 深圳建设网站需要多少钱h5响应式网站是什么意思
  • 网站建设免费网站哈尔滨网站小程序制作
  • asp手机网站源码建设微信网站制作
  • 南京免费发布信息网站海口制作网页公司
  • 沈阳制作网站cms网站建设教程
  • 做dw网站图片怎么下载地址网站设计公司网页设计
  • 温州微信网站定制wordpress 安装百度统计
  • 新网免费做网站网站开发到上线 多久
  • 河南公司网站建设关键词优化和seo
  • 企业网站服务器多少钱红酒网页设计图片
  • 怎样给网站做新闻稿子公众号网站开发
  • 软文是什么意思通俗点广东企业网站seo报价
  • 凉州区住房城乡建设局网站河北建设网官网首页
  • 塘沽网站优化霞浦网站建设
  • 局域网的网站建设网站建设与维护 计算机
  • 用网站做宣传的方案html网页设计思路