当前位置: 首页 > news >正文

网站页面背景网站后台的编辑器不显示

网站页面背景,网站后台的编辑器不显示,网页微信登录首页,成都百度seo搜索引擎优化培训文章目录 K均值聚类密度聚类(DBSCAN)层次聚类AGNES 算法DIANA算法 高斯混合模型聚类聚类效果的衡量指标小结 K均值聚类 步骤: Step1:随机选取样本作为初始均值向量。 Step2:计算样本点到各均值向量的距离,…

文章目录

  • K均值聚类
  • 密度聚类(DBSCAN)
  • 层次聚类
    • AGNES 算法
    • DIANA算法
  • 高斯混合模型聚类
  • 聚类效果的衡量指标
  • 小结

K均值聚类

  • 步骤:
    Step1:随机选取样本作为初始均值向量。
    Step2:计算样本点到各均值向量的距离,距离哪个最近就属于哪个簇
    Step3:重新计算中心点作为均值向量,重复第二步直到收敛
  • 常见距离
    • 曼哈顿距离(街区距离)
    • 欧氏距离
    • 切比雪夫距离(棋盘距离)
    • 闵氏距离(结合前三种)
    • 余弦相似度
      • 适用场景:塔吊和文本分析
    • 汉明距离
      • 适用场景:计算机网络中二进制纠错
  • 没有哪个距离最好,只有哪个距离最合适,这就是理解这么多距离的原因

密度聚类(DBSCAN)

  1. 概念:
  • 给定数据集D={x1,x2,…,xm}
  • 邻域ε:对x∈D,其ε邻域包含样本集D中与x的距离不大于ε的样本
  • 核心对象:若x的ε邻域至少包含MinPts个样本,即|N(x)|≥MinPts,则x是一个核心对象。
    N ( x ) = { x ′ ∈ D ∣ dist ( x , x ′ ) ≤ ε } N(x) = \{x' \in D \mid \text{dist}(x, x') \leq \varepsilon\} N(x)={xDdist(x,x)ε}
  1. 密度直达、密度可达、密度相连

层次聚类

应用:生物领域

AGNES 算法

  • 思想类似归并排序,自底向上
    Step1:先将每个样本当成一个簇
    Step2:然后将距离最近的两个簇进行合并
    Step3:重复Step2
    直到,最远的两个簇的距离超过阈值或簇的个数达到指定值
  • 距离:最大距离、最小距离、平均距离

DIANA算法

  • 思想类似快速排序,自顶向下
    Step1:初始化,所有样本集中归为一个簇
    Step2:在同一个簇中,计算任意两个样本之间的距离,找到距离最远的两个样本点a,b,
    将a,b作为两个簇的中心:
    Step3:计算原来簇中剩余样本点距离a,b的距离,距离哪个中心近,分配到哪个簇中
    Step4:重复步骤2、3
    直到,最远两簇距离不足阈值,或者簇的个数达到指定值,终止算法

高斯混合模型聚类

  • 应用:将混合的连个数据集分开
  • 一维高斯函数,多元独立高斯函数
  • 正态分布就是高斯函数
    f ( x ) = 1 ( 2 π ) d / 2 ⋅ ∣ Σ ∣ 1 / 2 ⋅ exp ⁡ ( − 1 2 ( x − μ ) T Σ − 1 ( x − μ ) ) f(x) = \frac{1}{(2\pi)^{d/2} \cdot |\Sigma|^{1/2}} \cdot \exp\left(-\frac{1}{2}(x - \mu)^T \Sigma^{-1} (x - \mu)\right) f(x)=(2π)d/2∣Σ1/21exp(21(xμ)TΣ1(xμ))
  • 高斯混合模型:
    f ( x ) = ∑ i = 1 K w i ⋅ 1 ( 2 π ) d / 2 ⋅ ∣ Σ i ∣ 1 / 2 ⋅ exp ⁡ ( − 1 2 ( x − μ i ) T Σ i − 1 ( x − μ i ) ) f(x) = \sum_{i=1}^{K} w_i \cdot \frac{1}{(2\pi)^{d/2} \cdot |\Sigma_i|^{1/2}} \cdot \exp\left(-\frac{1}{2}(x - \mu_i)^T \Sigma_i^{-1} (x - \mu_i)\right) f(x)=i=1Kwi(2π)d/2Σi1/21exp(21(xμi)TΣi1(xμi))
    Step1:将参数随机初始化
    Step2:计算x_j由各混合成分生成的后验概率,即观测数据x_j由第i个分模型生成的概率p(z_j=i|x_j)并记为γ_ji
    Responsibility ( x i , θ ) = π k ⋅ N ( x i ∣ μ k , Σ k ) ∑ j = 1 K π j ⋅ N ( x i ∣ μ j , Σ j ) \text{Responsibility}(x_i, \theta) = \frac{\pi_k \cdot \mathcal{N}(x_i | \mu_k, \Sigma_k)}{\sum_{j=1}^{K} \pi_j \cdot \mathcal{N}(x_i | \mu_j, \Sigma_j)} Responsibility(xi,θ)=j=1KπjN(xiμj,Σj)πkN(xiμk,Σk)
    Step3:利用γ_ji计算新均值
    Step4:利用γ_ji计算新标准差
    Step5:利用γ_ji计算新权值
    Step6:重复Step2-5直到收敛
  • 最大似然函数思想

聚类效果的衡量指标

  • 目的:评估聚类结果是否好坏,确立优化目标
  • 结论:簇内彼此相似,簇间彼此不同
  • 指标(是否用到样本均值):
    • 外部指标:JC指数、FMI指数、RI指数
    • 内部指标:DB指数,Dunn指数

小结

  • 没有最优的算法,只有最合适的算法。

参考书:周志华-机器学习-西瓜书

http://www.yayakq.cn/news/500307/

相关文章:

  • 网站建设以后主要做什么网站设计由哪个部门做
  • 购物网站开发django什么是h5开发
  • 怎么进网站后台管理系统做网站多少钱PageAdmin
  • 家具能在什么网站上做WordPress主题开发核心知识
  • 大连网站运营服务关系型网站怎么做
  • 财务公司网站建设2016wordpress淘宝客程序
  • 网站的建设与规划上海市发布
  • wordpress做了个站没流量镇江房产网站建设
  • 计算机网站开发的目的wordpress wptouch
  • 漳州网站建设优化推广网站优化建议
  • 网站建设是永久性的吗手机版网页制作
  • 深圳专门做网站的公司网站换模板要怎么做
  • 湛江网站建设方案外包普陀专业做网站
  • 网站建设 备案什么意思吴江建设工程招标中心网站
  • 北京校园网站建设网站建设年度总结
  • 巩义机械厂网站建设企业邮箱哪家比较好
  • 网站备案号查询网址网站建设赚钱
  • 国内优秀企业网站设计网站建设与管理试题及答案
  • 上海城乡建设网站证件查询wordpress onepress
  • 如何做网站seo优化网站导航建设注意
  • 生物制药公司网站建设如何购买一个网站的域名
  • 厦门微信商城网站建设广东如何做网站设计
  • 大连模板网站制作哪家专业重庆市建设工程交易中心网站
  • 关于大创做网站的项目计划书网站建设合同义务
  • 给公司做网站的公司平面设计培训学校学费
  • 网站的页面风格有哪些监控设备公司企业网站源码
  • 公司推广做哪个网站上海网站建设公司哪家好?
  • 网站建设seo网络推广手机排行榜2024前十名最新
  • 俄语网站服务器朝阳周边网站建设
  • 校园网站平台建设没有货源可以开网店吗