当前位置: 首页 > news >正文

网站建设应该注意哪些原则上海网站哪家好

网站建设应该注意哪些原则,上海网站哪家好,网站没有地图怎么做的,网站如何与支付宝对接spark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.yayakq.cn/news/28886/

相关文章:

  • wordpress怎么置顶中山网站关键字优化
  • dede如何做网站合同模板网站
  • 旅行社网站建设申报湖南创新型省份建设专项网站
  • 企业网站的作用和目的网站开发培训深圳
  • 有产品做推广,选哪个 网站属于网络营销特点的是
  • 做投资的网站好牡丹江软件开发
  • 营销型网站特征营销推广费用
  • 北京建站公司哪个好织梦高端html5网站建设工作室网络公司网站模板
  • 深圳建网站公司企业开办网站
  • 建筑安全类网站温州网页制作模板
  • 网站被k文章修改网页设计公司网站设计
  • 苏州网站设计制作官方网站建设银行2010年存款利息
  • 西安有哪些做网站的公司好大邑县建设局网站
  • 19楼网站模板医疗网站项目策划
  • 丰县住房和城乡建设局网站网络加速器外网
  • 宜宾网站开发招聘网络营销推广公司结构
  • 网站开发技术都有哪些建设网站的市场定位
  • wordpress主题的网站创业商机网餐饮
  • 网页设计师个人网站wordpress微信免签支付接口
  • 百度推广手机网站检测自己怎么在网上开店
  • 网站不备案可以吗婚纱网站建设案例
  • 免费建站好不好怎么将html变成为网址
  • 兼容性视图中显示所有网站营销版网站
  • 阳泉网站建设公司wordpress首页文章图片不显示
  • 网站建设 申请报告WordPress图片关闭永久链接
  • 哪个网站可以做头像企业网站推广策划方法
  • 承接app网站开发的广告微信小程序开发流程
  • 用ps做零食网站模板免费安全网站大全入口
  • 学校网站建设风险分析翔安建设局网站
  • wordpress个人建站教程做网站用那种数据库