国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 學(xué)院 > 開(kāi)發(fā)設(shè)計(jì) > 正文

跟天齊老師學(xué)Spark(1)--Spark簡(jiǎn)介

2019-11-11 04:30:03
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友
spark官網(wǎng):http://spark.apache.orgSpark其實(shí)是一個(gè)大數(shù)據(jù)計(jì)算引擎,只能解決計(jì)算的問(wèn)題,它需要依賴數(shù)據(jù)的存儲(chǔ)系統(tǒng);Spark不會(huì)取代Hadoop,因?yàn)镠adoop不僅是解決了計(jì)算的問(wèn)題,它還解決了存儲(chǔ)的問(wèn)題;spark是apache旗下的一個(gè)開(kāi)源框架。它的logo:快如閃電的一個(gè)集群。用來(lái)做大規(guī)模的數(shù)據(jù)計(jì)算處理。在2016年7月出來(lái)spark-2.0版本,我們現(xiàn)在使用的是1.6.2版本;Spark比hadoop的MaPReduce在內(nèi)存中快100倍,即使在磁盤上也比Hadoop快10倍。在Spark的計(jì)算引擎之上有很多強(qiáng)大的工具:spark sql,spark streaming,mllib,graphx。提供一站式計(jì)算服務(wù)(離線計(jì)算、實(shí)時(shí)計(jì)算、機(jī)器學(xué)習(xí)、圖計(jì)算等)。這些都是它的子項(xiàng)目,但是他們都是運(yùn)行在spark的計(jì)算引擎之上。有了spark的話,我們只要一個(gè)spark集群即可。如果用hadoop的話,要維護(hù)hadoop集群,可能還要維護(hù)storm集群。但是如果你的公司搞了2年hadoop相關(guān)的技術(shù)了,現(xiàn)在突然轉(zhuǎn)向spark的話,可能轉(zhuǎn)化的成本比較高。如果你的公司剛開(kāi)始起步,可以優(yōu)先選擇spark技術(shù)。它的特點(diǎn):快,易用(java,scala,python,R),通用,運(yùn)行在多平臺(tái)(可以運(yùn)行在yarn這個(gè)資源調(diào)度平臺(tái)上,可以從hdfs中讀數(shù)據(jù),再寫入hdfs,還可以運(yùn)行在mesos資源調(diào)度平臺(tái)上,spark還可以運(yùn)行在自己獨(dú)立的集群模式上,這就是standalone集群模式,spark還可以運(yùn)行在云上,可以從hdfs中讀數(shù)據(jù),從hbase中讀數(shù)據(jù),從cassandra中讀數(shù)據(jù),還可以跑在S3上)對(duì)spark貢獻(xiàn)排名第一的是一個(gè)華人(美國(guó)伯克利大學(xué))。還有很多的國(guó)人面孔。
發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 汝阳县| 廊坊市| 勐海县| 丹巴县| 泰顺县| 双牌县| 牡丹江市| 锡林郭勒盟| 新泰市| 秦皇岛市| 濮阳市| 临沭县| 大悟县| 高密市| 扶沟县| 安泽县| 天津市| 留坝县| 诏安县| 陇川县| 青州市| 韶山市| 都安| 齐齐哈尔市| 读书| 淮安市| 蕲春县| 贺州市| 英德市| 乐平市| 都江堰市| 罗源县| 金华市| 湟中县| 萨迦县| 北宁市| 霍林郭勒市| 凌云县| 湘潭县| 吉水县| 九江县|