国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

對python sklearn one-hot編碼詳解

2020-02-15 22:19:02
字體:
來源:轉載
供稿:網友

one-hot編碼的作用

使用one-hot編碼,將離散特征的取值擴展到了歐式空間,離散特征的某個取值就對應歐式空間的某個點

將離散特征通過one-hot編碼映射到歐式空間,是因為,在回歸,分類,聚類等機器學習算法中,特征之間距離的計算或相似度的計算是非常重要的,而我們常用的距離或相似度的計算都是在歐式空間的相似度計算,計算余弦相似性,基于的就是歐式空間。

sklearn的一個例子

from sklearn import preprocessingenc = preprocessing.OneHotEncoder()enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])print(enc.n_values_)//每個特征對應的最大位數print(enc.transform([[0,1,3]]).toarray())print(enc.transform([[0,1,1]]).toarray())

上面代碼enc.fit()里有一個4行3列的矩陣

1、每一列對應于一個樣本的特征序列,即一個樣本有三個特征

2、4行表明傳入了4個樣本

3、觀察每一列的值可以知道:第一個特征有兩個取值0,1;第二個特征有三個取值0,1,2;第三個特征有4個取值0,1,2,3

4、所以第一個特征的one-hot編碼是一個兩位的01串,第二個特征是一個三位的01串,第三個特征是一個4位的01串

以上這篇對python sklearn one-hot編碼詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 清水县| 潜山县| 章丘市| 赤水市| 射洪县| 吴江市| 兰考县| 庆安县| 西贡区| 临沂市| 嵩明县| 繁昌县| 墨玉县| 库尔勒市| 衢州市| 始兴县| 鄄城县| 西华县| 绍兴县| 崇礼县| 喀喇| 嵊泗县| 福海县| 密山市| 石渠县| 青冈县| 弋阳县| 晴隆县| 朝阳区| 吉林市| 兰考县| 涞水县| 横峰县| 华阴市| 耒阳市| 文登市| 六盘水市| 桐庐县| 阳山县| 沽源县| 汾西县|