当前位置: 首页 > news >正文

中国建设银行官网站金银纪念币温州网站制作策划

中国建设银行官网站金银纪念币,温州网站制作策划,大连新图闻网站设计,做网站程序先从哪一步开始创建RDD 在Spark中创建RDD的方式分为三种: 从外部存储创建RDD从集合中创建RDD从其他RDD创建 textfile 调用SparkContext.textFile()方法,从外部存储中读取数据来创建 RDD parallelize 调用SparkContext 的 parallelize()方法,将一个存在的集合&…

创建RDD

在Spark中创建RDD的方式分为三种:

  1. 从外部存储创建RDD
  2. 从集合中创建RDD
  3. 从其他RDD创建

textfile

调用SparkContext.textFile()方法,从外部存储中读取数据来创建 RDD

parallelize

调用SparkContext 的 parallelize()方法,将一个存在的集合,变成一个RDD

makeRDD

方法一

/** Distribute a local Scala collection to form an RDD.** This method is identical to `parallelize`.*/def makeRDD[T: ClassTag](seq: Seq[T],numSlices: Int = defaultParallelism): RDD[T] = withScope {parallelize(seq, numSlices)}

方法二:分配一个本地Scala集合形成一个RDD,为每个集合对象创建一个最佳分区。

/*** Distribute a local Scala collection to form an RDD, with one or more* location preferences (hostnames of Spark nodes) for each object.* Create a new partition for each collection item.*/def makeRDD[T: ClassTag](seq: Seq[(T, Seq[String])]): RDD[T] = withScope {assertNotStopped()val indexToPrefs = seq.zipWithIndex.map(t => (t._2, t._1._2)).toMapnew ParallelCollectionRDD[T](this, seq.map(_._1), math.max(seq.size, 1), indexToPrefs)}

 举例

scala> val rdd = sc.parallelize(1 to 6, 2)
val rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[2] at parallelize at <console>:1scala> rdd.collect()
val res4: Array[Int] = Array(1, 2, 3, 4, 5, 6)scala> val seq = List(("American Person", List("Tom", "Jim")), ("China Person", List("LiLei", "HanMeiMei")), ("Color Type", List("Red", "Blue")))
val seq: List[(String, List[String])] = List((American Person,List(Tom, Jim)), (China Person,List(LiLei, HanMeiMei)), (Color Type,List(Red, Blue)))scala> val rdd2 = sc.makeRDD(seq)
val rdd2: org.apache.spark.rdd.RDD[String] = ParallelCollectionRDD[0] at makeRDD at <console>:1scala> rdd2.partitions.size
val res0: Int = 3scala> rdd2.foreach(println)
American Person
Color Type
China Personscala> val rdd1 = sc.parallelize(seq)
val rdd1: org.apache.spark.rdd.RDD[(String, List[String])] = ParallelCollectionRDD[1] at parallelize at <console>:1scala> rdd1.partitions.size
val res1: Int = 2scala> rdd2.collect()
val res2: Array[String] = Array(American Person, China Person, Color Type)scala> rdd1.collect()
val res3: Array[(String, List[String])] = Array((American Person,List(Tom, Jim)), (China Person,List(LiLei, HanMeiMei)), (Color Type,List(Red, Blue)))scala> var lines = sc.textFile("/root/tmp/a.txt",3)
var lines: org.apache.spark.rdd.RDD[String] = /root/tmp/a.txt MapPartitionsRDD[4] at textFile at <console>:1scala> lines.collect()
val res6: Array[String] = Array(a,b,c)scala> lines.partitions.size
val res7: Int = 3

转换算子

flatMap

map

reduceByKey

groupByKey

举例

scala> var lines = sc.textFile("/root/tmp/a.txt",3)
var lines: org.apache.spark.rdd.RDD[String] = /root/tmp/a.txt MapPartitionsRDD[13] at textFile at <console>:1scala> lines.flatMap(x=>x.split(",")).map(x=>(x,1)).reduceByKey((a,b)=>a+b).foreach(println)
(c,2)
(b,1)
(d,1)
(a,2)scala> lines.collect()
val res27: Array[String] = Array(a,b,c, c, a,d)scala> lines.map(_.split(",")).collect()
val res25: Array[Array[String]] = Array(Array(a, b, c), Array(c), Array(a, d))scala> lines.flatMap(_.split(",")).collect()
val res26: Array[String] = Array(a, b, c, c, a, d)

行动算子

http://www.yayakq.cn/news/164531/

相关文章:

  • 制作网页网站代码网站开发与设计实训报告摘要
  • 网站功能北京注册公司网上申请入口
  • 那个网站可以做网页购物网站排名
  • 南川区 网站集约化建设方案傻瓜式制作app的软件
  • iis部署网站项目南充市房产信息网官网
  • 页面效果华丽的网站曰本做爰网站
  • 深圳网站开发设计wordpress 协议
  • design网站网站建设公司做ppt吗
  • 建立一个网站需要哪些步骤软件工作室网站模板
  • 营销型网站建设 ppt上海实时新闻
  • 实名网站空间wordpress脚本演示功能
  • 网站的icon图标做多大工程公司招聘
  • 站长工具seo综合查询下载网站 体系
  • 哪个公司做公司网站好中联汇科 网站建设
  • 做水果网站需要些什么做网站购买服务器吗
  • 泰州免费网站建站模板企业网站四大类型
  • 网站建设用python怎么样长春做网站搜吉网传媒
  • xampp做网站可以吗做外贸找生意上哪个网站
  • 婚恋网站制作要多少钱江阴网站开发公司电话
  • githup网站建设网站 keywords seo
  • 西安做网站公司哪家好 应该怎么选择口碑好的秦皇岛网站建设价格
  • pp下载安装 app优化网站用软件好吗
  • 网站建设和谷歌优化网站图片切换怎么做的
  • 网站做联盟广告能赚钱吗iframe 网站前台模板
  • dedecms做企业网站济南三维动画制作公司
  • 备案期间能否做网站解析返利网 网站开发
  • 在阿里云做的网站怎么移动网络公司 给 客户网站备案
  • 中英文网站为什么要分开做网站建立的
  • 石家网站建设公司排名在一个网站上面发布广告怎么做
  • wordpress 忽略更新wordpress seo插件