国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python利用sklearn包編寫決策樹源代碼

2020-02-16 11:14:54
字體:
來源:轉載
供稿:網友

本文實例為大家分享了python編寫決策樹源代碼,供大家參考,具體內容如下

因為最近實習的需要,所以用python里的sklearn包重新寫了一次決策樹。

工具:sklearn,將dot文件轉化為pdf格式(是為了將形成的決策樹可視化)graphviz-2.38,下載解壓之后將其中的bin文件的目錄添加進環境變量

源代碼如下:

from sklearn.feature_extraction import DictVectorizerimport csvfrom sklearn import treefrom sklearn import preprocessingfrom sklearn.externals.six import StringIOfrom xml.sax.handler import feature_external_gesfrom numpy.distutils.fcompiler import dummy_fortran_file# Read in the csv file and put features into list of dict and list of class labelallElectronicsData = open(r'E:/DeepLearning/resources/AllElectronics.csv', 'rt')reader = csv.reader(allElectronicsData)headers = next(reader)featureList = []lableList = []for row in reader:lableList.append(row[len(row)-1])rowDict = {}#不包括len(row)-1for i in range(1,len(row)-1):rowDict[headers[i]] = row[i]featureList.append(rowDict)print(featureList)vec = DictVectorizer()dummX = vec.fit_transform(featureList).toarray()print(str(dummX))lb = preprocessing.LabelBinarizer()dummY = lb.fit_transform(lableList)print(str(dummY))#entropy=>ID3clf = tree.DecisionTreeClassifier(criterion='entropy')clf = clf.fit(dummX, dummY)print("clf:"+str(clf))#可視化treewith open("resultTree.dot",'w')as f:f = tree.export_graphviz(clf, feature_names=vec.get_feature_names(),out_file = f)#對于新的數據怎樣來查看它的分類oneRowX = dummX[0,:]print("oneRowX: "+str(oneRowX))newRowX = oneRowXnewRowX[0] = 1newRowX[2] = 0predictedY = clf.predict(newRowX)print("predictedY: "+ str(predictedY))

這里的AllElectronics.csv,形式如下圖所示:

今天早上好不容易將jdk、eclipse以及pydev裝進linux,但是,但是,但是,想裝numpy的時候,總是報錯,發現是沒有gcc,然后又去裝gcc,真是醉了,到現在gcc還是沒有裝成功,再想想方法

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 永康市| 靖西县| 汝州市| 平凉市| 广饶县| 寿光市| 化隆| 电白县| 玉山县| 碌曲县| 安新县| 庄河市| 泊头市| 湄潭县| 兴山县| 富裕县| 长子县| 遂溪县| 岳普湖县| 巴中市| 洮南市| 石阡县| 改则县| 政和县| 冕宁县| 隆昌县| 南木林县| 巴林左旗| 自贡市| 望奎县| 绥滨县| 买车| 阿克陶县| 黄龙县| 金堂县| 家居| 巍山| 宝应县| 昔阳县| 封丘县| 郧西县|