当前位置: 首页 > news >正文

国家建设部网站倪虹沈阳关键词自然排名

国家建设部网站倪虹,沈阳关键词自然排名,wordpress管理员角色,一键生成网页主成分分析(PCA, Principal Component Analysis)和线性判别分析(LDA, Linear Discriminant Analysis)是两种常用的降维方法,它们虽然都用于数据降维,但核心思想和应用场景不同。 PCA(主成分分析…

主成分分析(PCA, Principal Component Analysis)和线性判别分析(LDA, Linear Discriminant Analysis)是两种常用的降维方法,它们虽然都用于数据降维,但核心思想和应用场景不同。

PCA(主成分分析)

PCA 是一种无监督学习方法,主要用于特征降维,以最大化数据的方差,同时减少信息损失。其核心思想是找到数据的主成分(方差最大的方向),然后对数据进行投影,从而降低维度。

PCA的步骤
  1. 将数据中心化(去均值)并标准化,以消除量纲影响。
  2. 衡量不同特征之间的相关性。
  3. 找到协方差矩阵的特征值和特征向量,特征向量代表数据的主方向,特征值表示该方向上的方差信息量。
  4. 根据特征值大小选择前 K K K个特征向量构成新的特征空间。
  5. 用选择的特征向量将原始数据投影到新的低维空间。

它不考虑类别标签,仅关注数据的整体分布,通过选择方差最大的方向来保留最多的信息。其主要作用是特征降维,去除冗余特征,并用于数据可视化,尤其适用于高维数据的降维处理,以便于后续分析和建模。

def pca(X:np.array, n_components:int) -> np.array:"""PCA 降维。"""# 1. 数据标准化(去均值)X_mean = np.mean(X, axis=0)X_centered = X - X_mean # (m, n)# print(f'X_centered.shape: {X_centered.shape}')# 2. 计算协方差矩阵covariance_matrix = np.cov(X_centered, rowvar=False)# 3. 计算特征值和特征向量eigenvalues, eigenvectors = np.linalg.eig(covariance_matrix)# 4. 按特征值降序排序sorted_indices = np.argsort(eigenvalues)[::-1]top_eigenvectors = eigenvectors[:, sorted_indices[:n_components]] # (n, n_components)# print(f'top_eigenvectors.shape: {top_eigenvectors.shape}')# 5. 投影到新空间X_pca = np.dot(X_centered, top_eigenvectors) # (m, n_components)# print(f'X_pca.shape: {X_pca.shape}')return X_pca

LDA (线性判别分析)

LDA 是一种有监督的降维方法,目标是在降维的同时最大化类别之间的可分性。与 PCA 不同,LDA 利用类别标签来优化数据投影,使得不同类别的样本尽可能分开。

LDA的步骤
  1. 计算类内散度矩阵 S W S_W SW
  2. 计算类间散度矩阵 S B S_B SB
  3. 求解投影方向
  4. 选择前 k k k个特征向量组成投影矩阵 W W W

它利用类别信息来优化数据投影,使得不同类别的样本在低维空间中尽可能分开。通过最大化类间距离并最小化类内方差,LDA能够增强类别可分性,因此广泛应用于分类任务,如人脸识别、文本分类等,有助于提高模型的分类性能。

def lda(X:np.array, y:np.array, n_components:int) -> np.array:"""LDA 降维"""# 获取类别列表classes = np.unique(y)n_features = X.shape[1]# 计算总均值mean_total = np.mean(X, axis=0)# 计算类内散度矩阵 Sw 和 类间散度矩阵 SbS_W = np.zeros((n_features, n_features))S_B = np.zeros((n_features, n_features))for c in classes:X_c = X[y == c]  # 取出类别 c 的所有样本mean_c = np.mean(X_c, axis=0)  # 计算类别 c 的均值S_W += np.cov(X_c, rowvar=False) * (X_c.shape[0] - 1)  # 类内散度矩阵mean_diff = (mean_c - mean_total).reshape(-1, 1)S_B += X_c.shape[0] * (mean_diff @ mean_diff.T)  # 类间散度矩阵# 计算 Sw^-1 * Sb 的特征值和特征向量eigvals, eigvecs = np.linalg.eig(np.linalg.inv(S_W) @ S_B)# 选取前 n_components 个特征向量(按特征值降序排序)sorted_indices = np.argsort(eigvals)[::-1]W = eigvecs[:, sorted_indices[:n_components]]# 投影数据到 LDA 低维空间X_lda = X @ Wreturn X_lda, W

PCA vs. LDA

PCALDA
类别信息无监督,不考虑类别有监督,利用类别信息
目标最大化数据方差,保留最多信息最大化类间距离,增强类别可分性
计算计算协方差矩阵的特征值计算类间/类内散度矩阵的特征值
应用场景适用于降维、特征提取、数据压缩适用于分类任务,提高模型性能
http://www.yayakq.cn/news/64679/

相关文章:

  • 开发出来的电子商务网站域名有没有专门做化妆品小样的网站
  • 青岛做外贸网站的公司广州发布紧急通知
  • 陕西省交通建设集团公司门户网站设计吧 网站
  • 电信的网做的网站移动网打不开该找电信还是移动淄博天一建设项目招标代理有限公司网站
  • 邢台网站改版定制大型网站快速排名
  • 婚纱摄影网站的设计思路ppt在线浏览网站源码
  • 重庆公司企业网站建设哪个网站推广产品好
  • 代理网站备案表金华建设二建哪个网站报名
  • 网站开发公司源码长沙市人才招聘网最新招聘信息
  • 沈阳企业网站制作公司宜春seo网站推广
  • h5响应式集团网站推荐广东东莞网站建设
  • asp.net网站安装顺序网站建设毕业设计综述
  • 深圳网站制作必荐祥奔科技什么网站建设比较好的
  • 固安县城乡和住房建设局网站安卓手机优化软件排名
  • 网站建设的互动性深圳网页设计机构
  • 企业网站建设英文河南网站建站推广
  • 2021免费网站大全网站改不了分类
  • 网站友情链接模板wordpress 加载完毕
  • 网站建设和维护实训做地方门户网站
  • 某些网页打不开是什么原因温州谷歌seo
  • 河南省建设厅网站总经济师自己制作免费网站
  • 旅游搜索网站开发discuz视频网站模板
  • 物流网站购买物流单号如何在别人网站挂黑链
  • 手机建站平台微点艺术品网站模板
  • 企业网站建设顾问wordpress 获取当前位置
  • 检察 网站建设网站建设网站设计多少钱
  • 网站欣赏大型网络游戏排行榜前十
  • 怎么给自己的网站推广合肥企业网站
  • 三亚做网站多少钱一平方网站开发都用什么浏览器
  • 自适应网站建设公司个人备案的网站可以做商城