博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Spark..........WordCount
阅读量:6077 次
发布时间:2019-06-20

本文共 868 字,大约阅读时间需要 2 分钟。

quickstart 将英文单词基数 简单 整个过程比起hadoop快很多

package com.zhiyou100import org.apache.spark.{SparkConf, SparkContext}object WordCount {  def main(args: Array[String]): Unit = {    //创建分布式运行平台  和appname    //使用master制定运行平台 yarn staandalong mesos(生产坏境) local(开发调试)    //local(单线程) local[N](多线程) local[*](本地cpu有多少个核心就启动多少个线程)//    val conf =new SparkConf().setMaster("local[2]").setAppName("word count")//    val conf =new SparkConf().setMaster("spark://master:7077").setAppName("word count")    val conf = new SparkConf()//.setAppName("word count")    conf.set("spark.testing.memory", "2147480000")//后面的值大于512m即可    // 构建SparkContect对象    val sc =new SparkContext(conf)    //加载数据源 获取RDD对象    val fileRdd =sc.textFile("/reversetext/LICENSE.txt").flatMap(line=>line.split("\\s")).map(x=>(x,1)).reduceByKey((v1,v2)=>v1+v2)    println("这是一个Driver 输出")    fileRdd.foreach(println)  }}

转载地址:http://iqagx.baihongyu.com/

你可能感兴趣的文章
LintCode 第一题fizz buzz
查看>>
5002.课件和视频下载--防火墙虚拟系统技术说明
查看>>
fragment中查看view的宽度以及单位px和dip换算
查看>>
第 5 章 网络 - 031 - none和host网络的适用场景
查看>>
第 5 章 Nova - 041 - Resize Instance 操作详解
查看>>
满满都是回忆:微软带你回顾XP时代的100个经典(转自远景论坛)
查看>>
起死回生:专治Linux各种“起不来”
查看>>
PPT制造精巧水晶收获组织机构图好看的ppt模板下载
查看>>
【零基础手把手教你学Python】02 与Python的第一次亲密接触——HelloWorld
查看>>
我的友情链接
查看>>
mysql数据库基础知识
查看>>
mysql中 ${param}与#{param}区别
查看>>
docker基础
查看>>
Java代码实现发送邮件
查看>>
IBM将宣布建立英国数据中心,跻身世界一流AI阵营
查看>>
电脑调整分区后分区不见的数据找回方法
查看>>
SD卡操作
查看>>
机械硬盘显示位置不可用要怎样办啊
查看>>
Apache构建虚拟Web主机
查看>>
nmcli命令使用以及网卡绑定bond
查看>>