当前位置: 首页 > news >正文

广东h5网站建设济源做网站的公司

广东h5网站建设,济源做网站的公司,品牌设计案例分析,福州seo排名优化公司前言 聚类算法又叫做”无监督分类“,目标是通过对无标记训练样本来揭示数据的内在性质及 规律,为进一步的数据分析提供基础。 Kmeans 作为聚类算法的典型代表,Kmeans可以说是最简单的聚类算法,没有之一,那她是怎么完…

前言

聚类算法又叫做”无监督分类“,目标是通过对无标记训练样本来揭示数据的内在性质及 规律,为进一步的数据分析提供基础。

Kmeans

作为聚类算法的典型代表,Kmeans可以说是最简单的聚类算法,没有之一,那她是怎么完成聚类的呢?

  1. 算法接受参数k
  2. 给定样本集 D = { x 1 , x 2 , . . . , x n } D=\{x_1,x_2,...,x_n\} D={x1,x2,...,xn}
  3. 随机选点k个中心(质心)
  4. 遍历样本集,先取距离最近的质心,从而根据质心分解样本集D簇划分 C = { C 1 , C 2 , . . . , C k } C=\{C_1,C_2,...,C_k\} C={C1,C2,...,Ck}
  5. 最小化平方误差在这里插入图片描述
  6. 利用簇中均值等方法更新该簇类的中心k个;
  7. 重覆4-6的步骤,直至E不再更新

Kmeans中用的是欧式距离

kmeans的计算过程

  1. 现在有4组数据,每组数据有2个维度,对其进行聚类分为2类,将其可视化一下。
    在这里插入图片描述
  2. 通过比较,将其进行归类。并使用平均法更新中心位置。在这里插入图片描述
  3. 再次计算每个点与更新后的位置中心的距离,直到上一次的类别标记无变化,即可停止
import matplotlib.pyplot as plt
from sklearn.cluster import  KMeans
from sklearn.datasets import make_blobs## 创建数据集
X, _ = make_blobs(n_samples=10000, centers=2, random_state=0)## kmeans超参数值列表
n_clusters_list = [4, 8, 16]# 图的框架
fig, axs = plt.subplots(1, len(n_clusters_list), figsize=(12, 5)
)
axs = axs.T
for j, n_clusters in enumerate(n_clusters_list):## 创建模型algo = KMeans(n_clusters=n_clusters, random_state=random_state, n_init=3)algo.fit(X)centers = algo.cluster_centers_axs[j].scatter(X[:, 0], X[:, 1], s=10, c=algo.labels_)## 画质心axs[j].scatter(centers[:, 0], centers[:, 1], c="r", s=20)axs[j].set_title(f"{n_clusters} clusters")
for ax in axs.flat:ax.label_outer()ax.set_xticks([])ax.set_yticks([])
plt.show()

聚类算法用于降维

K-Means聚类最重要的应用之一是非结构数据(图像,声音)上的矢量量化(VQ)。非结构化数据往往占用比较多的储存空间,文件本身也会比较大,运算非常缓慢,我们希望能够在保证数据质量的前提下,尽量地缩小非结构化数据的大小,或者简化非结构化数据的结构。

  1. 一组40个样本的数据,分别含有40组不同的信息(x1,x2)。
  2. 将代表所有样本点聚成4类,找出四个质心.这些点和他们所属的质心非常相似,因此他们所承载的信息就约等于他们所在的簇的质心所承载的信息。
  3. 使用每个样本所在的簇的质心来覆盖原有的样本,有点类似四舍五入的感觉,类似于用1来代替0.9和0.8。

这样,40个样本带有的40种取值,就被我们压缩了4组取值,虽然样本量还是40个,但是这40个样本所带的取值其实只有4个,就是分出来的四个簇的质心。查看官方用例

主要参考

《机器学习理论(十三)Kmeans聚类》

http://www.yayakq.cn/news/501726/

相关文章:

  • 软件免费网站大全做网站设计用到的软件
  • 河北网站建设多少钱上海公共服务平台官网
  • 湘西建网站服务器租用云服务器
  • 建设厅网站密码找回大连市网站推广公司
  • 做地方网站能赚钱吗响应式商城网站
  • 买了一个域名怎么做网站做毕业设计网站教程
  • 定制网站建设公司哪家好建设工程消防设计备案凭证查询网站
  • 秦皇岛网站建公司做奢侈品回收网站特点
  • 五合一免费建站杭州北京网站建设公司
  • 做网站能用本地的数据库嘛公司网站建站流程
  • 做图兼职网站有哪些鄂州网站制作人才招聘
  • 入门 做网站 书籍网站版面设计注意事项
  • html5网站后台模板wordpress $数组
  • 在线生成个人网站app广州公司注册在线
  • 做网站包括什么条件医疗网站建设基本流程
  • 非营利组织网站建设会计分录wordpress头部调用代码
  • 银川公司做网站怎么做外语网站
  • 响应式网站建设信息自己做网站要买服务器
  • 网站建设项目软件开发招标文件文本分析网站
  • 英国做电商网站有哪些外贸类网站模板
  • 网站需求分析问题wordpress 仿简书模板
  • 关于做面包的网站.ai域名注册网站
  • 能看的网站怎么在工商局网站查公司
  • 网站后台管理系统模板 htmlppt图标网站链接怎么做
  • 做网站可以申请专利吗网站开发先写后端先写前端
  • 平台网站定制最新购物网站建设框架
  • 南通网站设计专家淘宝代运营公司哪家好
  • 西安网站推广优化手机制作网站教程
  • 海晏网站建设公司登录wordpress的网址
  • 网站开发的付款方式惠州淡水网站建设公司