国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

跟天齊老師學Spark(5)--使用IDEA開發Spark程序

2019-11-11 03:18:00
字體:
來源:轉載
供稿:網友
使用IDEA開發spark程序:補全的快捷鍵:"Ctrl+Alt+v"下面是提交spark程序到spark集群上運行的命令:
spark/bin/spark-submit /--master spark://hadoop01:7077,spark://hadoop02:7077 /--executor-memory 512m --total-executor-cores 7 /--class cn.itcast.spark.WordCount //root/spark-1.0-SNAPSHOT.jar /hdfs://hadoop01:9000/wc /hdfs://hadoop01:9000/wc/out后面會給大家介紹如何在IDEA中既可以編譯java程序,又可以編譯scala程序,這就需要兩個插件。其實在打包的時候,不用在pom文件制定main方法的全類名,因為我們可能會寫很多的程序,我們可以在它執行的時候,動態的告訴它調哪個main方法。---使用java來開發一個簡單spark的wordcount程序----------------------------------------------------------------
import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaPairRDD;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavasparkContext;import org.apache.spark.api.java.function.FlatMapFunction;import org.apache.spark.api.java.function.Function2;import org.apache.spark.api.java.function.PairFunction;import scala.Int;import scala.Tuple2;import java.util.Arrays;/** * Created by SYJ on 2016/10/22. */public class JavaWordCount {    public static void main(String[] args) {        SparkConf sparkConf = new SparkConf().setAppName("JavaWordCount");        JavaSparkContext context = new JavaSparkContext(sparkConf);        JavaRDD<String> lines = context.textFile(args[0]);        JavaRDD<String> words = lines.flatMap(new FlatMapFunction<String, String>() {            @Override            public Iterable<String> call(String line) throws Exception {                return Arrays.asList(line.split(" "));            }        });        JavaPairRDD<String, Integer> wordAndOne = words.mapToPair(new PairFunction<String, String, Integer>() {            @Override            public Tuple2<String, Integer> call(String word) throws Exception {                return new Tuple2<String, Integer>(word, 1);            }        });        JavaPairRDD<String, Integer> result = wordAndOne.reduceByKey(new Function2<Integer, Integer, Integer>() {            @Override            public Integer call(Integer i1, Integer i2) throws Exception {                return i1 + i2;            }        });        JavaPairRDD<Integer, String> swapedPair = result.mapToPair(new PairFunction<Tuple2<String, Integer>, Integer, String>() {            @Override            public Tuple2<Integer, String> call(Tuple2<String, Integer> tp) throws Exception {                return new Tuple2<Integer, String>(tp._2, tp._1);            }        });        JavaPairRDD<String, Integer> finalResult = swapedPair.sortByKey(false).mapToPair(new PairFunction<Tuple2<Integer, String>, String, Integer>() {            @Override            public Tuple2<String, Integer> call(Tuple2<Integer, String> tp) throws Exception {                return tp.swap();            }        });        finalResult.saveAsTextFile(args[1]);        context.stop();    }}
上一篇:spring中jar包依賴

下一篇:活動選擇

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 镇原县| 桂阳县| 沾化县| 宁夏| 延寿县| 兰州市| 萝北县| 玉田县| 崇礼县| 凌云县| 乌拉特中旗| 辉南县| 永平县| 克什克腾旗| 扎鲁特旗| 沧州市| 临安市| 茂名市| 璧山县| 榕江县| 西昌市| 旺苍县| 黑水县| 三台县| 崇阳县| 扬州市| 瑞金市| 大余县| 哈密市| 余江县| 民乐县| 于都县| 安新县| 长沙市| 巨鹿县| 涡阳县| 锡林浩特市| 增城市| 博爱县| 确山县| 泰顺县|