自已电脑做网站网站开发语言查询 蔡学镛
根据到给点样本的距离,来聚类。
1.曼哈顿距离、

2.欧几里得距离
直线距离
3.切比雪夫距离

4.闵氏距离

5.余弦相似度

对数据大小/长度等不关注,只关注相似度。
6.汉明距离 二进制距离

二、密度聚类 DBSCAN

前提是样本是根据紧密程度分布的。


先用超参数生成核心对象
三、层次聚类
合并距离最近的两个样本点。关键是求距离。




四、高斯混合分布聚类:数据重合,均值或方差至少有一个是不同的。
五、总结

六、性能度量
1.利用真实值

2.不利用外部真实值

