当前位置: 首页 > news >正文

做海报的专业网站电子商务安全问题 网站权限

做海报的专业网站,电子商务安全问题 网站权限,电影网站 模板,做网站公司排名是什么一、RDD持久化 1、不采用持久化操作 查看要操作的HDFS文件 以集群模式启动Spark Shell 按照图示进行操作,得RDD4和RDD5 查看RDD4内容,会从RDD1到RDD2到RDD3到RDD4跑一趟 显示RDD5内容,也会从RDD1到RDD2到RDD3到RDD5跑一趟 2、采用持久化…

一、RDD持久化

1、不采用持久化操作
查看要操作的HDFS文件
在这里插入图片描述
以集群模式启动Spark Shell
在这里插入图片描述
按照图示进行操作,得RDD4和RDD5
在这里插入图片描述
查看RDD4内容,会从RDD1到RDD2到RDD3到RDD4跑一趟
在这里插入图片描述
显示RDD5内容,也会从RDD1到RDD2到RDD3到RDD5跑一趟

在这里插入图片描述
2、采用持久化操作
在这里插入图片描述
计算RDD4,就是基于RDD3缓存的数据开始计算,不用从头到尾跑一趟
在这里插入图片描述
计算RDD5,就是基于RDD3缓存的数据开始计算,不用从头到尾跑一趟
在这里插入图片描述

二、存储级别

案例演示设置存储级别
在这里插入图片描述

package net.cxf.rdd.day05import org.apache.log4j.{Level, Logger}
import org.apache.spark.storage.StorageLevel
import org.apache.spark.{SparkConf, SparkContext}import java.awt.SystemTray/*** 功能:* 作者:cxf* 日期:2023年05月06日*/
object SetStorageLevel {def main(args: Array[String]): Unit = {//创建Spark配置对象val conf = new SparkConf().setAppName("SetStorageLevel") //设置应用名称.setMaster("local[*]") //设置主节点位置(本地调试>// 基于Spark配置对象创建Spark容器val sc = new SparkContext(conf)//去除Spark运行信息Logger.getLogger("org").setLevel(Level.OFF)Logger.getLogger("com").setLevel(Level.OFF)System.setProperty("spark.ui.showConsoleProgress", "false")Logger.getRootLogger().setLevel(Level.OFF)//创建RDDval rdd = sc.textFile("hdfs://master:9000/park/words.txt")//将rdd标记为持久化,采用默认存储级别- StorageLevel.MEMORY_ONLYrdd.persist() //无参持久化方法//对rdd做扁平映射,得到rdd1val rdd1 = rdd.flatMap(_.split(" "))//将rdd1持久化都磁盘rdd1.persist(StorageLevel.DISK_ONLY)//将rdd1映射成二元组,得到rdd2val rdd2 = rdd1.map((_, 1))//将rdd2持久化到内存,溢出的数据持久化到磁盘rdd2.persist(StorageLevel.MEMORY_AND_DISK)//第一次行动算子,对标记为持久化的RDD进行不同级别的持久化曹println("元素个数:" + rdd2.count)//第二次行动算子,直接利用rdd2的持久化数据进行操作,无须从头进行计算rdd2.collect.foreach(println)}}

运行程序,查看结果

在这里插入图片描述

三、利用Spark WebUI查看缓存

最好重启Spark Shell
在这里插入图片描述
(一)创建RDD并标记为持久化
在这里插入图片描述
(二)Spark WebUI查看RDD存储信息
在这里插入图片描述
收集RDD数据
在这里插入图片描述
刷新WebUI,发现出现了一个ParallelCollectionRDD的存储信息,该RDD的存储级别为MEMORY,持久化的分区为8,完全存储于内存中。
在这里插入图片描述
单击ParallelCollectionRDD超链接,可以查看该RDD的详细存储信息
在这里插入图片描述
执行以下命令,创建rdd2,并将rdd2持久化到磁盘
在这里插入图片描述
刷新上述WebUI,发现多了一个MapPartitionsRDD的存储信息,该RDD的存储级别为DISK,持久化的分区为8,完全存储于磁盘中。
在这里插入图片描述
(三)将RDD从缓存中删除
在这里插入图片描述
刷新上述WebUI,发现只剩下了MapPartitionsRDD,ParallelCollectionRDD已被移除。
在这里插入图片描述

http://www.yayakq.cn/news/860230/

相关文章:

  • 广东做陶瓷的网站广州知名网站建设性价比高
  • 微信公众号设计网站杭州营销策划公司排名
  • 长春公司网站推广宁波市建设厅网站首页
  • 国内最大的网站制作公司步骤图
  • 小说网站怎么做词免费发布信息不收费的网站
  • 程序员做网站类网站如何做一个虚拟网站
  • 郑州哪个网站建设最好开发一个简单的系统
  • 网站上的图片一般多大萝岗微网站建设
  • 做网站的服务器用什么 系统好邯郸哪里制作网站
  • 网站服务器的功能wordpress用户中心制作
  • 注册公司登陆哪个网站wordpress缩略图幻灯展现
  • 怎样建立个人网站吉林省干部网络培训
  • 学习网站建设网站平台页面设计
  • 网站设计色板卡片风格网站
  • 阿里云做淘宝客网站咨询网站模板
  • 宝安网站建设深圳信科建立网站邮箱
  • 深圳专业网站建设公司哪家好微信搜一搜seo
  • 一个网站两个域名wordpress哪种主页更利于seo
  • 外国人的做视频网站吗绵阳新农网的网站是哪个公司做的
  • 微信公众号做电影网站设计制作合同交印花税吗
  • 做网站开发要学多久北京宣传片制作
  • 天津网站建设设计费用怎么做全网小说网站
  • 推广网站刷排名软件技术大专出来都去干嘛了
  • 新浪博客网站wordpress表情插件
  • 门户网站 模板之家网站推广成本
  • 想做找人做网站实训课做一个网站怎么做
  • 网站301设置网站建设用户画像例子
  • 做科技申报看什么网站做网站美工未来规划
  • sz住房和城乡建设部网站移动端cpu天梯图2021
  • 网站建设注意问题汕头网站建设模块