国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<td id="n7hn3"><optgroup id="n7hn3"></optgroup></td>

<style id="n7hn3"></style>

首頁 > 學院 > 開發設計 > 正文

spark | 讀數據

2019-11-08 18:21:24

字體：大中小

來源：轉載

供稿：網友

為何要單獨一個博文來記錄讀取數據呢？我覺得讀數據很重要，涉及到不同格式的數據，各式各樣的情況，故而記之。

注意：以python語言為工具

讀csv格式的本數據有３列# -*- coding:utf-8 -*- from pyspark import SparkContextsc = SparkContext("local[2]", "First Spark App")# we take the raw data in CSV format and convert it into a set of records of the form (user, PRoduct, price)data = sc.textFile("data/UserPurchaseHistory.csv").map(lambda line: line.split(",")).map(lambda record: (record[0], record[1], record[2]))

上面代碼中核心代碼是：

sc.textFile("data/UserPurchaseHistory.csv").map(lambda line: line.split(",")).map(lambda record: (record[0], record[1], record[2]))

第一個map是用于分割，第二個map用于讀取列采用lambda函數

繼續更新中。。。

上一篇：倒三角形

下一篇：程序員書籍列表

學習交流

索泰發布一款GTX 1070 Mini迷你版本:小機

索泰發布一款GTX 1070 Mini迷你版本:小機箱大愛...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

榮耀總裁趙明烏鎮演講：榮耀首款5G手機V30下月發布

2019-10-23 09:17:05

搜狐張朝陽：回歸媒體是搜狐重新崛起的關鍵

2019-10-21 09:20:02

華為輪值董事長郭平：虛擬技術創造現實價值

2019-10-21 09:00:12

滴滴英文服務上線兩周年用戶已超200萬

2019-09-26 08:57:12

華為推出全球至快AI訓練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國技術團隊

2019-09-25 08:15:43

疑難解答

圖片精選

網友關注

主站蜘蛛池模板：崇礼县| 诸城市| 木里| 南皮县| 太原市| 庐江县| 齐河县| 金平| 辽阳县| 长葛市| 鄂托克前旗| 尤溪县| 海晏县| 莫力| 舟曲县| 伊宁市| 阿克苏市| 玉林市| 宁陕县| 黔江区| 招远市| 财经| 张家界市| 松桃| 且末县| 深圳市| 镇巴县| 佛教| 合阳县| 维西| 建水县| 吐鲁番市| 礼泉县| 鹰潭市| 虹口区| 平谷区| 庆云县| 郎溪县| 南陵县| 大冶市| 金平|

<style id="cklqc"><mark id="cklqc"><dfn id="cklqc"></dfn></mark></style>

<rp id="cklqc"></rp>

<td id="cklqc"></td>