当前位置: 首页 > news >正文

做刀网站迁安做网站中的cms开发

做刀网站,迁安做网站中的cms开发,a5wordpress模板,哪个网站是做安全教育1. 有监督学习和无监督学习 在机器学习算法中,常把算法分为有监督学习和无监督学习两种。他们之间的区别主要在于输入数据集类型和学习目标。 (1)有监督学习:训练输入的数据需要带有标签,以便算法能够学习输入和输出…

1. 有监督学习和无监督学习

在机器学习算法中,常把算法分为有监督学习和无监督学习两种。他们之间的区别主要在于输入数据集类型学习目标

(1)有监督学习:训练输入的数据需要带有标签,以便算法能够学习输入和输出之间的映射关系;有监督学习的目标是通过对训练数据的学习,实现对未知数据的预测和分类。

(2)无监督学习:训练数据不需要标签,算法只能使用输入数据进行学习,目标是找到输入数据之间的相似性和区别。

这里我们要介绍的Kmeans聚类算法,就是一种无监督学习算法,输入的训练数据不需要类别标签,而是通过计算数据点之间的相似性来对数据进行分类。

2. Kmeans算法原理

  • K-means聚类算法的原理是:

(1) 首先随机选择K个点作为初始的聚类中心;

(2)然后计算每个点到聚类中心的距离,将每个点分配到离它最近的聚类中心所在的簇中;

(3)对于每个簇,计算每个簇所有点的平均值,并将其作为新的聚类中心点;

(4)重复这个过程,直到聚类中心不再发生变化,或者达到预设的迭代次数。

这个算法的目标是最小化每个聚类内的距离和,即使得每个点与其所在聚类中心的距离之和最小。它尝试使得每个聚类尽可能小,并且不同聚类之间的距离尽可能大。

  • K值如何确定

K值是一个重要的超参数,表示簇的个数,即要把数据分为几个类别。

K值的确定可以通过以下几种方法:

肘部法:肘部法所使用的聚类评价指标为数据集中所有样本点到其簇中心的距离之和的平方。

轮廓系数法:轮廓系数是一种非常常用的聚类效果评价指标。

可视化数据:最常用最简单的方法是可视化数据,然后观察出聚类聚成几类比较合适。

交叉验证:计算不同k值下KMeans算法的BIC和AIC值,BIC或AIC值越小,选择该k值。

3. 运行代码

import matplotlib.pyplot as plt
import sklearn
import numpy as npfrom sklearn.datasets import make_blobs
from sklearn.cluster import KMeansdef main():# step1: 首先用sklearn包生成训练集模板(这里的簇心为4)# 生成合成数据# n_samples是待生成的样本总数# centers 表示要生成的样本中心(类别)数,或是确定的中心点数量blobs = make_blobs(n_samples=200, random_state=1, centers=4)X_blobs = blobs[0]      # 提取特征数据Y_blobs = blobs[1]      # 类别plt.figure(1)plt.scatter(X_blobs[:, 0], X_blobs[:, 1], c=Y_blobs)# step2# step3: 聚类kmeans = KMeans(n_clusters=4, init='k-means++', n_init=10, max_iter=300, random_state=None, )kmeans.fit(X_blobs)# step4: plotx_min, x_max = X_blobs[:, 0].min() - 0.5, X_blobs[:, 0].max() + 0.5y_min, y_max = X_blobs[:, 1].min() - 0.5, X_blobs[:, 1].max() + 0.5# step5xx, yy = np.meshgrid(np.arange(x_min, x_max, 0.02), np.arange(y_min, y_max, 0.02))Z = kmeans.predict(np.c_[xx.ravel(), yy.ravel()])Z = Z.reshape(xx.shape)plt.figure(2)plt.clf()plt.imshow(Z, interpolation='hermite', extent=(xx.min(), xx.max(), yy.min(), yy.max()), cmap=plt.cm.winter,aspect='auto', origin='lower')plt.plot(X_blobs[:, 0], X_blobs[:, 1], 'w.', markersize=5)# 用红色的x表示簇中心centroids = kmeans.cluster_centers_plt.scatter(centroids[:, 0], centroids[:, 1], marker="x", s=150, linewidths=3, color='r', zorder=10)plt.xlim(x_min, x_max)plt.ylim(y_min, y_max)plt.xticks()plt.yticks()plt.show()if __name__ == '__main__':main()

http://www.yayakq.cn/news/361635/

相关文章:

  • 偃师做网站wordpress 增量备份
  • 深圳网深圳网站开发公司商业网站的网址
  • 网站功能需求列表展台设计展会展位设计
  • 网页游戏网址推荐搜狗搜索引擎优化
  • 建微信网站木材 技术支持 东莞网站建设
  • 网站建设网页制作网站建设怎么做账务处理
  • 网站建设服务的具体条件自己做网站内容读取太慢
  • 网站规划怎么写宣传册样式
  • 如何用html做班级网站做网站一定要用服务器吗
  • 12306网站哪个公司做的搜索引擎排名机制
  • 民宿设计网站大全八戒网设计官网
  • 一站式营销推广平台随州什么公司做网站
  • django 做网站的代码建设部网站注册
  • 个人房产信息查询网站wordpress 页面满屏
  • 阳江企业网站建设佛山哪家网站建设比较好
  • 品牌型 网站建设怎么做网站的主页面
  • wordpress做cms网站做视频哪个网站素材好
  • dw做网站站点dw公司网页制作
  • 公司网站招聘板块怎么做马鞍山网站建设设计
  • 个人网站建设的目的酒店网络营销策略论文
  • 广州网站排名优化服务药品彩页设计
  • 南昌购物网站开发情留 蚊子 pj wordpress
  • 郑州企业建设网站有什么好处百度推广电话营销话术
  • 襄阳seo站内优化网站模版切换
  • 制作app免费网站模板下载建筑工程外架安全网
  • 怎样加入好大夫网站做医生自己建网站写小说
  • 广州站电话wordpress添加文章页不显示图片
  • 网站设计要注意事项网络营销的目的和意义
  • 唯品会一家做特卖的网站手机版wordpress添加百度统计代码
  • 专业做网站公司24小时接单安监局网站做应急预案备案