国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 幫助中心 > 正文

關于pandas的離散化,面元劃分詳解

2024-07-09 22:41:50
字體:
來源:轉載
供稿:網友

pd.cut

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)

x:要分箱的輸入數組,必須是一維的

bins:int或標量序列

若bins是一個int,它定義在x范圍內的等寬單元的數量。然而,在這種情況下,x的范圍在每一側延伸0.1%以包括x的最小值或最大值

若bins是一個序列,它定義了允許非均勻bin寬度的bin邊緣。在這種情況下不進行x的范圍的擴展

right:bool,可選:決定區間的開閉,如果right == True(默認),則區間[1,2,3,4]指示(1,2],(2,3],(3,4]

labels:array或boolean,默認值為無:用作生成的區間的標簽。必須與生成的區間的長度相同。如果為False,則只返回bin的整數指示符

retbins:bool,可選:是否返回bin。如果bin作為標量給出,則可能有用

precision:int:存儲和顯示容器標簽的精度,默認保留三位小數

include_lowest:bool:第一個間隔是否應該包含左邊

import numpy as npimport pandas as pd# 使用pandas的cut函數劃分年齡組ages = [20,22,25,27,21,23,37,31,61,45,32]bins = [18,25,35,60,100]cats = pd.cut(ages,bins)print(cats) # 分類時,當數據不在區間中將變為nan# 統計落在各個區間的值數量print(pd.value_counts(cats))# 使用codes為年齡數據進行標號print(cats.codes)# 設置自己想要的面元名稱group_names = ['Youth','YoungAdult','MiddleAged','Senior']print(pd.cut(ages, bins, labels=group_names))# 設置區間數學符號為左閉右開print(pd.cut(ages, bins, right=False))# 向cut傳入面元的數量,則會根據數據的最小值和最大值計算等長面元print(pd.cut(ages, 4, precision=2)) # precision=2表示設置的精度

pd.qcut

與cut類似,它可以根據樣本分位數對數據進行面元劃分

pandas.qcut(x, q, labels=None, retbins=False, precision=3) 

x:ndarray或Series

q:整數或分位數陣列分位數。十分位數為10,四分位數為4或者,分位數陣列,例如[0,.25,.5,.75,1.]四分位數

labels:array或boolean,默認值為無:用作生成的區間的標簽。必須與生成的區間的長度相同。如果為False,則只返回bin的整數指示符。

retbins:bool,可選:是否返回bin。如果bin作為標量給出,則可能有用。

precision:int:存儲和顯示容器標簽的精度

import numpy as npimport pandas as pd# qcut可以根據樣本分位數對數據進行面元劃分# data = np.random.randn(20) # 正態分布data = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]cats = pd.qcut(data, 4) # 按四分位數進行切割print(cats)print(pd.value_counts(cats))print("-------------------------------------------------")# 通過指定分位數(0到1之間的數值,包含端點)進行面元劃分cats_2 = pd.qcut(data, [0, 0.5, 0.8, 0.9, 1])print(cats_2)print(pd.value_counts(cats_2))

以上這篇關于pandas的離散化,面元劃分詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林網之家。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 建宁县| 博兴县| 泾源县| 将乐县| 西乌珠穆沁旗| 洛隆县| 吉木乃县| 寻乌县| 马边| 恩平市| 林甸县| 亚东县| 甘肃省| 关岭| 界首市| 霍林郭勒市| 连山| 武强县| 新竹县| 银川市| 梓潼县| 惠州市| 龙门县| 长治县| 株洲市| 金溪县| 卓尼县| 肥城市| 富民县| 平顺县| 上虞市| 化州市| 乃东县| 浏阳市| 长治县| 开远市| 双城市| 尤溪县| 大庆市| 高要市| 洞口县|