当前位置: 首页 > news >正文

常州模板网站建设价格可做百度百科参考资料的网站

常州模板网站建设价格,可做百度百科参考资料的网站,东莞外贸建站及推广,物流公司哪个最便宜PCA的用处:找出反应数据中最大变差的投影(就是拉的最开)。 在减少需要分析的指标同时,尽量减少原指标包含信息的损失,以达到对所收集数据进行全面分析的目的 但是什么时候信息保留的最多呢?具体一点&#…

PCA的用处:找出反应数据中最大变差的投影(就是拉的最开)。

在减少需要分析的指标同时,尽量减少原指标包含信息的损失,以达到对所收集数据进行全面分析的目的

但是什么时候信息保留的最多呢?具体一点?

首先:去中心化(把坐标原点放到数据中心,如上图所示)

然后,找坐标系(找到方差最大的方向)

问题是:怎么找到方差最大的方向呢????????

一.引子

1.使用矩阵可以进行数据的线性变换(数据的拉伸)

2.使用矩阵可以进行数据的线性变换(数据的旋转)

3.结合起来两种操作

拉伸决定了方差最大的方向是横或者纵

旋转决定了方差最大的方向的角度

怎么求R?

协方差矩阵的特征向量就是R

二.数学原理:

三.PCA流程图:

PCA与SVD的联系:

四.例子:

五.代码:

# -*- coding: utf-8 -*-
"""
Created on Tue Oct 13 11:12:24 2020@author: pc① 对原数据集零均值化。代码是:meanRemoved = dataMat - mean(dataMat,axis=0)② 求出均值化X的协方差矩阵:公式是:Cov(X)=\frac{1}{m-1}X^{T}X,代码是:covMat = cov(meanRemoved,rowvar=0)③ 求这个协方差矩阵的特征值,特征向量,代码是:eigVals, eigVects = linalg.eig(mat(covMat))④ 把这些特征值按从大到小排列,返回特征值的下标,代码是:eigValInd = argsort(-eigVals)⑤ 选出前topNfeat个特征值,返回这些选中的特征值的下标,并根据下标从特征向量矩阵eigVects中取出这些选中的特征向量组成矩阵P,这就是我们要找的变换矩阵P,代码是:redEigVects = eigVects[:,eigValInd[:topNfeat] ]⑥ 返回降维后的数据,公式是:Y=X•P,代码是:lowDDataMat = meanRemoved * redEigVects⑦ 原数据映射到新的空间中。公式是:X^{'}=Y\cdot P^{T}+mean,代码是:reconMat = (lowDDataMat * redEigVects.T) + meanValues
"""import numpy as np
import matplotlib.pyplot as pltdef pca(dataMat, topNfeat = 999999):meanValues = np.mean(dataMat,axis=0) # 竖着求平均值,数据格式是m×nmeanRemoved = dataMat - meanValues  # 0均值化  m×n维covMat = np.cov(meanRemoved,rowvar=0)  # 每一列作为一个独立变量求协方差  n×n维eigVals, eigVects = np.linalg.eig(np.mat(covMat)) # 求特征值和特征向量  eigVects是n×n维eigValInd = np.argsort(-eigVals)  # 特征值由大到小排序,eigValInd十个arrary数组 1×n维eigValInd = eigValInd[:topNfeat]  # 选取前topNfeat个特征值的序号  1×r维print(eigValInd)redEigVects = eigVects[:,eigValInd] # 把符合条件的几列特征筛选出来组成P  n×r维lowDDataMat = meanRemoved * redEigVects  # 矩阵点乘筛选的特征向量矩阵  m×r维 公式Y=X*PreconMat = (lowDDataMat * redEigVects.T) + meanValues  # 转换新空间的数据  m×n维return lowDDataMat, reconMatdef drawPoints(dataset1,dataset2):  # 画图,dataset1是没降维的数据,dataset2是数据映射到新空间的数据fig = plt.figure()ax1 = fig.add_subplot(211)ax2 = fig.add_subplot(212)ax1.scatter(dataset1[:,0],dataset1[:,1],marker='s',s=5,color='red')dataset2 = np.array(dataset2)ax2.scatter(dataset2[:,0],dataset2[:,1],s=5,color='blue')plt.show()if __name__ == '__main__':dataSetList = []fr = open('pca_data_set1.txt')for row in fr.readlines():cur_line = row.strip().split('\t')proce_line = list(map(float,cur_line))dataSetList.append(proce_line)dataSetList = np.array(dataSetList)data = dataSetListproccess_data, reconMat = pca(data,topNfeat = 1)drawPoints(data,reconMat)

http://www.yayakq.cn/news/140847/

相关文章:

  • 建设中小企业网站网页设计代码居中
  • 初二做网站的首页模板晋江小学网站建设
  • 怎么用ps制作个人网站模板下载建设邮箱网站
  • 个人网页设计欣赏欣赏网站源码如何优化
  • 亚马逊购物网站单位企业邮箱怎么申请
  • 网页设计知名网站中关村在线
  • 重庆网络推广网站网站正在建设中 源码
  • 怎样做营销型网站商务网站建设实训心得
  • 班级网站建设组织机构中国电商平台排行
  • 龙岩任做网站的哪几个比较好广州网站建设 领航科技
  • 网站移动端生成器seo网站推广是什么意思
  • 怎么查询网站点击量如何推广公众号文章
  • 沈阳市网站建设哪里的公司比较好网站建设过程中应该注意的事项有
  • 龙华公司做网站做物流网站费用多少
  • thinkphp 网站下载效果图在线网
  • dede网站数据库路径连云港网站建设连云港
  • 网站后角色管理权限怎么设置?wordpress没注册按钮
  • 连锁公司网站源码去掉自豪地采用wordpress
  • 化工企业商城网站建设公司企业所得税优惠政策2022年
  • 做特卖网站公司部门解散员工赔偿
  • 上海网站排名提升浙江省城乡建设信息港
  • 诸暨做网站小程序连接wordpress
  • 平湖公司网站建设大型企业的微网站谁做
  • 精英学校老师给学生做的网站html5响应时网站
  • 颍上做网站长春关键词seo
  • 公司网站制作公司倒闭管理咨询岗位做什么
  • 成都网站建设定制开发服务程序员培训机构最新排名
  • 沈阳制作网站网络营销个人网站
  • 电子商务网站建设与策划郑州编程培训机构排名前十
  • destoon 手机网站模板wordpress找不到后台