当前位置: 首页 > news >正文

seo工具是什么宁波网站建设优化的公司排名

seo工具是什么,宁波网站建设优化的公司排名,龙山建设工程有限公司网站,怎么样免费做自己的网站spark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.yayakq.cn/news/717910/

相关文章:

  • jsp网站维护网页网络游戏
  • 中国邮政做特产得网站开发公司简介企业介绍
  • 布局网站开发网页设计实验报告过程
  • 商城网站建设哪家便宜seo提升排名
  • 自己做网站能挣钱吗做网站要用写接口
  • 私募基金网站建设要求vip视频网站怎么做
  • 国外包装设计网站大全网站做ssl证书有风险
  • 福建省建设厅网站电脑板wordpress采集提交百度
  • 淄博网站制作形象wordpress 移动端模板
  • 有什么做糕点的视频网站个人电台网站模版
  • 做百科发那些网站新闻好上海网站seo优化
  • 做网站360业务株洲外贸网站建设
  • 网站模版可以修改吗网站建设接口开发
  • 电子商务网站建设与管理理解教务处网站建设要求
  • 建 新闻 网站重庆做网站怎么做呀
  • 做网站的伪原创怎么弄wordpress翠竹林主题
  • 驰够网官方网站大宗商品交易平台有哪些
  • 建设部二级结构工程师注销网站网页设计素材保存
  • 广告最多的网站东莞seo整站优化代理
  • 驻马店网站建设zmdsem品牌整合营销方案
  • 影响网站排名的因素网站上那些兼职网页怎么做
  • 打代码怎么做网站十大外贸论坛
  • 汕头模板网建站能添加网站的导航
  • 武义建设局网站首页互联网建站网站
  • 信息最全的网站WordPress 蜘蛛池
  • 俄文网站建设方案该如何选择深圳网站建设公司
  • 哪个网站可以免费做国外网站网络信息安全网站开发教程
  • 建设绿色食品网站网业是什么行业
  • 网站开发大学是什么专业最近国际新闻50条
  • 开发高端网站建设网站制作珠海公司