国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

跟天齊老師學Spark(5)--使用IDEA開發Spark程序

2019-11-11 04:27:28
字體:
來源:轉載
供稿:網友
使用IDEA開發spark程序:補全的快捷鍵:"Ctrl+Alt+v"下面是提交spark程序到spark集群上運行的命令:
spark/bin/spark-submit /--master spark://hadoop01:7077,spark://hadoop02:7077 /--executor-memory 512m --total-executor-cores 7 /--class cn.itcast.spark.WordCount //root/spark-1.0-SNAPSHOT.jar /hdfs://hadoop01:9000/wc /hdfs://hadoop01:9000/wc/out后面會給大家介紹如何在IDEA中既可以編譯java程序,又可以編譯scala程序,這就需要兩個插件。其實在打包的時候,不用在pom文件制定main方法的全類名,因為我們可能會寫很多的程序,我們可以在它執行的時候,動態的告訴它調哪個main方法。---使用java來開發一個簡單spark的wordcount程序----------------------------------------------------------------
import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaPairRDD;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavasparkContext;import org.apache.spark.api.java.function.FlatMapFunction;import org.apache.spark.api.java.function.Function2;import org.apache.spark.api.java.function.PairFunction;import scala.Int;import scala.Tuple2;import java.util.Arrays;/** * Created by SYJ on 2016/10/22. */public class JavaWordCount {    public static void main(String[] args) {        SparkConf sparkConf = new SparkConf().setAppName("JavaWordCount");        JavaSparkContext context = new JavaSparkContext(sparkConf);        JavaRDD<String> lines = context.textFile(args[0]);        JavaRDD<String> words = lines.flatMap(new FlatMapFunction<String, String>() {            @Override            public Iterable<String> call(String line) throws Exception {                return Arrays.asList(line.split(" "));            }        });        JavaPairRDD<String, Integer> wordAndOne = words.mapToPair(new PairFunction<String, String, Integer>() {            @Override            public Tuple2<String, Integer> call(String word) throws Exception {                return new Tuple2<String, Integer>(word, 1);            }        });        JavaPairRDD<String, Integer> result = wordAndOne.reduceByKey(new Function2<Integer, Integer, Integer>() {            @Override            public Integer call(Integer i1, Integer i2) throws Exception {                return i1 + i2;            }        });        JavaPairRDD<Integer, String> swapedPair = result.mapToPair(new PairFunction<Tuple2<String, Integer>, Integer, String>() {            @Override            public Tuple2<Integer, String> call(Tuple2<String, Integer> tp) throws Exception {                return new Tuple2<Integer, String>(tp._2, tp._1);            }        });        JavaPairRDD<String, Integer> finalResult = swapedPair.sortByKey(false).mapToPair(new PairFunction<Tuple2<Integer, String>, String, Integer>() {            @Override            public Tuple2<String, Integer> call(Tuple2<Integer, String> tp) throws Exception {                return tp.swap();            }        });        finalResult.saveAsTextFile(args[1]);        context.stop();    }}
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 荣成市| 汉阴县| 黄大仙区| 赤壁市| 江津市| 双城市| 定州市| 栾川县| 库尔勒市| 鲁甸县| 高雄市| 弋阳县| 崇信县| 调兵山市| 泉州市| 衡东县| 通榆县| 无棣县| 哈尔滨市| 安平县| 安多县| 龙岩市| 敦煌市| 山西省| 白山市| 双峰县| 句容市| 汶川县| 巧家县| 蕉岭县| 五台县| 济宁市| 清徐县| 志丹县| 昆明市| 阜南县| 锦屏县| 巍山| 卢氏县| 台南市| 镇安县|