国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

pandas使用get_dummies進行one-hot編碼的方法

2020-02-15 22:19:45
字體:
來源:轉載
供稿:網友

離散特征的編碼分為兩種情況:

1、離散特征的取值之間沒有大小的意義,比如color:[red,blue],那么就使用one-hot編碼

2、離散特征的取值有大小的意義,比如size:[X,XL,XXL],那么就使用數值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的對離散型特征進行one-hot編碼

import pandas as pddf = pd.DataFrame([   ['green', 'M', 10.1, 'class1'],    ['red', 'L', 13.5, 'class2'],    ['blue', 'XL', 15.3, 'class1']]) df.columns = ['color', 'size', 'prize', 'class label'] size_mapping = {   'XL': 3,   'L': 2,   'M': 1}df['size'] = df['size'].map(size_mapping) class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}df['class label'] = df['class label'].map(class_mapping)

說明:對于有大小意義的離散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies進行one-hot編碼
pd.get_dummies(df)

以上這篇pandas使用get_dummies進行one-hot編碼的方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 建平县| 偏关县| 普定县| 晴隆县| 博罗县| 苏州市| 邹平县| 辽宁省| 定陶县| 昂仁县| 东丽区| 肇源县| 北流市| 三穗县| 黔江区| 应用必备| 梅河口市| 保康县| 咸宁市| 容城县| 奈曼旗| 万源市| 青冈县| 敖汉旗| 民丰县| 荔浦县| 义乌市| 和平县| 鸡泽县| 镇江市| 如皋市| 池州市| 江阴市| 石阡县| 中方县| 乌拉特前旗| 遂平县| 朔州市| 长垣县| 梁平县| 丽江市|