国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

跟天齊老師學Spark(1)--Spark簡介

2019-11-11 03:19:49
字體:
來源:轉載
供稿:網友
spark官網:http://spark.apache.orgSpark其實是一個大數據計算引擎,只能解決計算的問題,它需要依賴數據的存儲系統;Spark不會取代Hadoop,因為Hadoop不僅是解決了計算的問題,它還解決了存儲的問題;spark是apache旗下的一個開源框架。它的logo:快如閃電的一個集群。用來做大規模的數據計算處理。在2016年7月出來spark-2.0版本,我們現在使用的是1.6.2版本;Spark比hadoop的MaPReduce在內存中快100倍,即使在磁盤上也比Hadoop快10倍。在Spark的計算引擎之上有很多強大的工具:spark sql,spark streaming,mllib,graphx。提供一站式計算服務(離線計算、實時計算、機器學習、圖計算等)。這些都是它的子項目,但是他們都是運行在spark的計算引擎之上。有了spark的話,我們只要一個spark集群即可。如果用hadoop的話,要維護hadoop集群,可能還要維護storm集群。但是如果你的公司搞了2年hadoop相關的技術了,現在突然轉向spark的話,可能轉化的成本比較高。如果你的公司剛開始起步,可以優先選擇spark技術。它的特點:快,易用(java,scala,python,R),通用,運行在多平臺(可以運行在yarn這個資源調度平臺上,可以從hdfs中讀數據,再寫入hdfs,還可以運行在mesos資源調度平臺上,spark還可以運行在自己獨立的集群模式上,這就是standalone集群模式,spark還可以運行在云上,可以從hdfs中讀數據,從hbase中讀數據,從cassandra中讀數據,還可以跑在S3上)對spark貢獻排名第一的是一個華人(美國伯克利大學)。還有很多的國人面孔。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 嘉善县| 阜南县| 日照市| 高尔夫| 扬中市| 嵩明县| 新宁县| 台北市| 逊克县| 文登市| 汾西县| 滦南县| 杭州市| 洛隆县| 桃江县| 雷山县| 色达县| 富锦市| 弥渡县| 阳春市| 林口县| 桃园市| 铁岭县| 南华县| 行唐县| 北票市| 馆陶县| 霸州市| 新巴尔虎右旗| 赤水市| 信宜市| 永胜县| 永顺县| 龙泉市| 绍兴市| 潜江市| 油尖旺区| 临武县| 上饶市| 安阳市| 博爱县|