python實現K最近鄰算法

2020-02-22 23:01:23

字體：大中小

來源：轉載

供稿：網友

KNN核心算法函數，具體內容如下

#! /usr/bin/env python3# -*- coding: utf-8 -*-# fileName ： KNNdistance.py# author : zoujiameng@aliyun.com.cnimport mathdef getMaxLocate(target): # 查找target中最大值的locate maxValue = float("-inFinIty") for i in range(len(target)):  if maxValue < target[i]:   maxValue = target[i]   flag = i return flagdef KDistance(K, dest, source): destlen = len(dest) source1len = len(source[1]) sourcelen = len(source) KNN = [] locate = source # 準備從source中剔除N-K個最大值 if destlen == source1len:  for i in range(sourcelen):   delta = 0   for j in range(source1len):# 畢達哥拉斯公式    delta += (dest[j] - source[i][j])*(dest[j] - source[i][j])   KNN.append(math.sqrt(delta))  for k in range(sourcelen, K, -1):   flag = getMaxLocate(KNN)   #print("%s 最大元素位置為%d" % (KNN, flag))   KNN.remove(KNN[flag]);   locate.remove(locate[flag])# 移除對應位置的元素   #print(locate)  return locate # 返回最終K個最接近的元素 else:  return None

假設你在伯克利開個小小的面包店,每天都做新鮮面包,需要根據如下一組特征預測當天該烤多少條面包:

a. 天氣指數1~5(1表示天氣很糟,5表示天氣非常好);
b. 是不是周末或節假日(周末或節假日為1,否則為0);
c. 有沒有活動(1表示有,0表示沒有)。

已知

historyA(5, 1, 0) = 300
historyB(3, 1, 1) = 225
historyC(1, 1, 0) = 75
historyD(4, 0, 1) = 200
historyE(4, 0, 0) = 150
historyF(2, 0, 0) = 50

回歸:周末，天氣不錯

Now(4, 1, 0) = ?

#! /usr/bin/env python3# -*- coding: utf-8 -*-# fileName ： KNNdistance.py# author : zoujiameng@aliyun.com.cnif __name__ == "__main__": history = {} history[5, 1, 0] = 300 history[3, 1, 1] = 225 history[1, 1, 0] = 75 history[4, 0, 1] = 200 history[4, 0, 0] = 150 history[2, 0, 0] = 50 dest = [4, 1, 0] source = [] for i in history:  source.append(i) print(source) from KNNdistance import KDistance K = 4 locate = KDistance(K, dest, source) avg = 0 for i in range(len(locate)):  avg+=history[locate[i]] avg/=K print("回歸結果：今天應該烤%d個面包" % round(avg))

KNN算法：

創建分類系統分類（分組），特征抽?。ǖ玫较嗨瞥潭龋? 回歸,即預測數值 KNN算法真的是很有用,堪稱你進入神奇的機器學習領域的領路人!機器學習旨在讓計算機更聰明。你見過一個機器學習的例子:創建推薦系統。 OCR指的是光學字符識別 (optical character recognition),這意味著你可拍攝印刷頁面的照片,計算機將自動識別出其中的文字。Google使用OCR來實現圖書數字化。一般而言,OCR算法提取線段、點和曲線等特征。 OCR中的特征提取要復雜得多,但再復雜的技術也是基于KNN等簡單理念的。這些理念也可用于語音識別和人臉識別。你將照片上傳到Facebook時,它有時候能夠自動標出照片中的人物,這是機器學習在發揮作用! OCR的第一步是查看大量的數字圖像并提取特征,這被稱為訓練(training)。大多數機器學習算法都包含訓練的步驟:要讓計算機完成任務,必須先訓練它。

上一篇：Python實現的棧（Stack）

下一篇：詳解Python 實現元胞自動機中的生命游戲(Game of life)