当前位置: 首页 > news >正文

阿里企业邮箱电话南城网站优化公司

阿里企业邮箱电话,南城网站优化公司,网站能不能用自己的电脑做服务器,网站建设 数据库管理文章目录 数据准备阶段KNN预测的过程1.计算新样本与已知样本点的距离2.按照举例排序3.确定k值4.距离最近的k个点投票 scikit-learn中的KNN算法 数据准备阶段 import matplotlib.pyplot as plt import numpy as np# 样本特征 data_X [[0.5, 2],[1.8, 3],[3.9, 1],[4.7, 4],[6.…

文章目录

  • 数据准备阶段
  • KNN预测的过程
    • 1.计算新样本与已知样本点的距离
    • 2.按照举例排序
    • 3.确定k值
    • 4.距离最近的k个点投票
  • scikit-learn中的KNN算法

数据准备阶段

import matplotlib.pyplot as plt
import numpy as np
# 样本特征
data_X = [[0.5, 2],[1.8, 3],[3.9, 1],[4.7, 4],[6.2, 6],[7.5, 5],[8.3, 3.5],[9.1, 7],[9.8, 4.5]
]# 样本标记
data_y = [0, 0, 0, 1, 1, 1, 1, 1, 1]
X_train = np.array(data_X)
y_train = np.array(data_y)
X_train
array([[0.5, 2. ],[1.8, 3. ],[3.9, 1. ],[4.7, 4. ],[6.2, 6. ],[7.5, 5. ],[8.3, 3.5],[9.1, 7. ],[9.8, 4.5]])
y_train
array([0, 0, 0, 1, 1, 1, 1, 1, 1])

选出样本标记为0的样本特征

y_train == 0
array([ True,  True,  True, False, False, False, False, False, False])
X_train[y_train==0]
array([[0.5, 2. ],[1.8, 3. ],[3.9, 1. ]])
X_train[y_train==0, 0]
array([0.5, 1.8, 3.9])
X_train[y_train==0, 1]
array([2., 3., 1.])
X_train[y_train==1, 0].shape
(6,)
X_train[y_train==1, 1].shape
(6,)
plt.scatter(X_train[y_train==0, 0], X_train[y_train==0, 1], color='red', marker='x')
plt.scatter(X_train[y_train==1, 0], X_train[y_train==1, 1], color='black', marker='o')
plt.show()

在这里插入图片描述

增加新的样本点

data_new = np.array([4, 5])
plt.scatter(X_train[y_train==0, 0], X_train[y_train==0, 1], color='red', marker='x')
plt.scatter(X_train[y_train==1, 0], X_train[y_train==1, 1],color='black', marker='o')
plt.scatter(data_new[0], data_new[1], color='b', marker='^')
plt.show()

在这里插入图片描述

KNN预测的过程

1.计算新样本与已知样本点的距离

for data in X_train:print(np.sqrt(np.sum((data - data_new) ** 2)))
4.6097722286464435
2.973213749463701
4.001249804748512
1.2206555615733703
2.4166091947189146
3.5
4.5541190146942805
5.478138369920935
5.821511831131154
distances = [np.sqrt(np.sum((data - data_new) ** 2)) for data in X_train]
distances
[4.6097722286464435,2.973213749463701,4.001249804748512,1.2206555615733703,2.4166091947189146,3.5,4.5541190146942805,5.478138369920935,5.821511831131154]

2.按照举例排序

np.sort(distances)
array([1.22065556, 2.41660919, 2.97321375, 3.5       , 4.0012498 ,4.55411901, 4.60977223, 5.47813837, 5.82151183])
sort_index = np.argsort(distances)
sort_index
array([3, 4, 1, 5, 2, 6, 0, 7, 8], dtype=int64)

3.确定k值

k = 5

4.距离最近的k个点投票

first_k = [y_train[i] for i in sort_index[:k]]
first_k
[1, 1, 0, 1, 0]
from collections import Counter
Counter(first_k)
Counter({1: 3, 0: 2})
Counter(first_k).most_common()
[(1, 3), (0, 2)]
Counter(first_k).most_common(1)
[(1, 3)]
predict_y = Counter(first_k).most_common(1)[0][0]
predict_y
1

得到结果为1,KNN判断新加入的点data_y的标记应该为1,从图中也可以看到,新加入的点更靠近标记为1的点群。

scikit-learn中的KNN算法

 from sklearn.neighbors import KNeighborsClassifier
kNN_classifier = KNeighborsClassifier(n_neighbors=5)
kNN_classifier.fit(X_train, y_train)
data_new.reshape(1, -1)
array([[4, 5]])
predict_y = kNN_classifier.predict(data_new.reshape(1, -1))
predict_y
array([1])

与手写KNN得到的结果相同,皆判断为1。

http://www.yayakq.cn/news/982462/

相关文章:

  • 网站设计与开发技术教程多语言网站怎么做
  • 外部调用wordpress站点文章网站seo在线优化
  • 网站建设用电脑管理咨询公司属于什么行业
  • 南和县建设局黄页网站邢台论坛网
  • 公司网站如何被收录wap娃派手机信息网
  • 一个专门做视频配音的网站河南平台网站建设公司
  • 一个做外汇的网站叫熊猫什么的企业网站首页flash
  • 那些网站可以做文案兼职长春做网站 长春万网
  • uo建设网站做外贸a货网站
  • .课程网站建设与应用企业网络营销策划方案范文
  • 网站建设设计风格如何与色彩搭配单页网站 seo
  • 网站编辑器做段落空格最新代理项目
  • 网站关键词价格唐山培训网站建设
  • 建立公司网站的好处dw制作简单网站模板下载地址
  • 山东网站制作设计h5设计制作
  • 南通seo公司网站施工企业筹备建立
  • 帮客户做网站图片被告侵权怎么购买网站空间和域名
  • 微网站 建设方案企业整体形象设计
  • 中国工厂网站官方网站庆阳做网站
  • 淘宝客网站html宁波网络营销网站建设
  • 注册公司在哪个网站注册注册公司需要什么条件和材料
  • 上海外贸营销网站建设进口网站建设
  • 网站内容建设的布局和结构做网站销售会遇到哪些问题
  • 沂南网站开发成都 在线 网站建设
  • 即墨网站建设地址自己设计app
  • photoshop设计一个精美的网站主页wordpress百度云下载
  • 青浦做网站广西建设职业技术学院官网
  • 深圳营销型网站策划网址制作网站
  • 东莞市建设规划局网站跳网站查询的二维码怎么做的
  • 微网站 制作网上商城名字大全