当前位置: 首页 > news >正文

企业网站内容模块筑巢网站建设

企业网站内容模块,筑巢网站建设,建设部官方网站有哪些,网站建设列表网乳腺癌良性恶性预测 1. 特征工程1.1 特征筛选1.2 特征降维 PCA1.3 SVD奇异值分解 2. 代码2.1 逻辑回归、二分类问题2.2 特征降维 PCA2.3 SVD奇异值分解 1. 特征工程 专业上:30个人特征来自于临床一线专家,每个特征和都有医学内涵;数据上&…

乳腺癌良性恶性预测

  • 1. 特征工程
    • 1.1 特征筛选
    • 1.2 特征降维 PCA
    • 1.3 SVD奇异值分解
  • 2. 代码
    • 2.1 逻辑回归、二分类问题
    • 2.2 特征降维 PCA
    • 2.3 SVD奇异值分解

1. 特征工程

  • 专业上:30个人特征来自于临床一线专家,每个特征和都有医学内涵;
  • 数据上:30个中可能有一些是冗余的。

1.1 特征筛选

  • 从30个选出重要的,踢掉不重要的。
  • 从数据的角度来讲,不建议进行特征筛选,做特征筛选可能只是为了解释性,给领导看看而已。因为再不重要的特征都有信息,筛选掉必然导致信息的丢失。
  • 线性回归的系数代表该项特征的重要性,系数就代表权重。
  • 使用协方差皮尔逊系数判断两列特征的相关性。

1.2 特征降维 PCA

  • 把原来30个特征中的核心信息中抽取出来,融合到新生成的几个特征中,新的特征不是原来的任何一个!
  • PCA(Principal Component Analysis,主成分分析)

1.3 SVD奇异值分解

  • SVD(奇异值分解)是一种在信号处理、统计学、机器学习等领域广泛应用的矩阵分解方法。
  • 它可以将一个矩阵分解为三个特定的矩阵的乘积,这三个矩阵分别是:一个正交矩阵、一个对角矩阵(其元素为奇异值,且按从大到小排列)以及另一个正交矩阵的转置。

2. 代码

2.1 逻辑回归、二分类问题

y = F ( X ) = s i g m o i d ( x 0 w 0 + x 1 w 1 + x 2 w 2 + . . . + x 12 w 12 ) y=F(X)=sigmoid(x_0w_0+x_1w_1+x_2w_2+...+x_{12}w_{12}) y=F(X)=sigmoid(x0w0+x1w1+x2w2+...+x12w12)

from sklearn.datasets import load_breast_cancer
X,y=load_breast_cancer(return_X_y=True)
print(X.shape,y.shape)  #:(569, 30) (569,)from sklearn.model_selection import train_test_split
X_train,X_test,y_train,y_test = train_test_split(X,y)
# 逻辑回归,实际是二分类,就是线性回归加了一个激活函数 sigmoid
from sklearn.linear_model import LogisticRegression
lr=LogisticRegression(max_iter=10000)
lr.fit(X_train,y_train)
pred=lr.predict(X_test)
acc=(pred==y_test).mean()
print(acc)

2.2 特征降维 PCA

# 特征降维 PCA(主成分分析)
from sklearn.decomposition import PCA
pca = PCA(n_components=20)
pca.fit(X_train)
X_train1 = pca.transform(X_train)
# 原始数据
lr = LogisticRegression(max_iter=10000)
lr.fit(X_train,y_train)
(lr.predict(X_test)==y_test).mean()  #:0.965034965034965
# 10个特征
lr1 = LogisticRegression(max_iter=10000)
# 特征降维
# 1. 构建
pca=PCA(n_components=10)
# 2. 拟合
pca.fit(X_train)
# 3. 转换
X_train1 = pca.transform(X_train)
X_test1 = pca.transform(X_test)lr1.fit(X_train1,y_train)
(lr1.predict(X_test1)==y_test).mean()  #:0.958041958041958

2.3 SVD奇异值分解

import numpy as np
from matplotlib import pyplot as plt
beauty = plt.imread(fname="beauty.jpg")
# [Height, Width, Channel]
print(beauty.shape)  #:(627, 481, 3)
r=beauty[:,:,0]
plt.imshow(r,cmap='gray')

在这里插入图片描述

U, S, V = np.linalg.svd(a=r, full_matrices=False)
print(U.shape,S.shape, V.shape)  #: (627, 481) (481,) (481, 481)
plt.plot(S)

在这里插入图片描述

"""降维之后的效果
"""
K = 20
restore = U[:,:K] @ np.diag(S[:K]) @ V[:K, :]
plt.imshow(X=restore, cmap="gray")

在这里插入图片描述

http://www.yayakq.cn/news/985889/

相关文章:

  • 代刷网站只做软件下载跨境电商平台有哪些股
  • 北京网站备案拍照地址鼓楼门户网站开发流程
  • 看电视剧的免费网站app下载湖州市交通建设管理局网站
  • 网站开发与设计课程时间哪个视频网站做视频赚钱
  • 佛山网站建设找千界wordpress rewrite_rules
  • 房产网站关键词优化浙江网站建设 seo
  • 厅门户网站建设网站页面设计稿
  • 茂名网站制作济南网站建设首选传承网络
  • 百瑞网站建设源码管理 网站
  • 乐清定制网站建设电话提供免费空间的网站
  • 公司制作网站流程360免费建站可以免费又永久吗
  • 网站快速收录教程旅游网站开发实验报告
  • 江门建站价格佛山企业推广优化
  • 东阳市城建设局网站wordpress广告管理插件
  • 阳江网站网站建设wordpress多语言切换
  • 深圳网站建设美橙互联html网页模板网站
  • 手机搜索和网站搜索的排名企业管理培训课程安排
  • 广州番禺建设银行网站登录新特网架公司
  • 外贸网站 设计做自己点击网站
  • 深圳网站建站建设一个网站绑定两个域名
  • 网站开发工具与环境常州网络科技
  • 沧州市住房和城乡建设局网站有什么牌子网站是响应式
  • 网站建设一个月多少钱首页调用网站栏目id
  • 深圳php网站建设做网站口碑比较好的大公司
  • 怎么做自己的彩票网站做招聘信息的网站有哪些
  • 互联网建设网站什么行业愿意做网站
  • 网站页面优化方案专业网站制作仪表多少钱
  • 东营做网站哪里好海南州建设厅官方网站
  • 行业网站推广怎么做天津做推广的公司
  • 设计广告网站深圳软装公司排名前十强