当前位置: 首页 > news >正文

北京网站建设的服务商ppt模板免费整套

北京网站建设的服务商,ppt模板免费整套,文本怎样做阅读链接网站,使用微信做网站第三方登录第1章 RDD概述 1.1 什么是RDD RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。代码中是一个抽象类,它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。 RDD类比工厂生产。 …

第1章 RDD概述

1.1 什么是RDD

RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。代码中是一个抽象类,它代表一个弹性的、不可变、可分区、里面的元素可并行计算的集合。
RDD类比工厂生产。

 内容和长度都是不可变化的!要修改数据或者加数据进去只能创建新的RDD,RDD的数据是存储在不同计算机的内存中,而Kafka存储在同一计算机的磁盘不同分区。
*** RDD类比工厂生产 ***。
懒加载机制,就是厂长发话才可以运转开干,中间的流程可进行优化,上一个过程结束之后,不存储数据,下一个过程继续,中间车间可以多个,也可以车间合并。
## 1.2 RDD五大特性
![在这里插入图片描述](https://img-blog.csdnimg.cn/1006ea59ad174a678b3bc09e19f61c16.png)
# 第2章 RDD编程
## 2.1 RDD的创建
在Spark中创建RDD的创建方式可以分为三种:从集合中创建RDD、从外部存储创建RDD、从其他RDD创建。
2.1.1 IDEA环境准备
1)创建一个maven工程,工程名称叫SparkCore
![在这里插入图片描述](https://img-blog.csdnimg.cn/c5c67a6a376e41dda98775796dcf4376.png)
2)创建包名:com.aa.createrdd
3)在pom文件中添加spark-core的依赖```dart
<dependencies><dependency><groupId>org.apache.spark</groupId><artifactId>spark-core_2.12</artifactId><version>3.1.3</version></dependency>
</dependencies>

4)如果不希望运行时打印大量日志,可以在resources文件夹中添加log4j.properties文件,并添加日志配置信息

log4j.rootCategory=ERROR, console
log4j.appender.console=org.apache.log4j.ConsoleAppender
log4j.appender.console.target=System.err
log4j.appender.console.layout=org.apache.log4j.PatternLayout
log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n# Set the default spark-shell log level to ERROR. When running the spark-shell, the
# log level for this class is used to overwrite the root logger's log level, so that
# the user can have different defaults for the shell and regular Spark apps.
log4j.logger.org.apache.spark.repl.Main=ERROR# Settings to quiet third party logs that are too verbose
log4j.logger.org.spark_project.jetty=ERROR
log4j.logger.org.spark_project.jetty.util.component.AbstractLifeCycle=ERROR
log4j.logger.org.apache.spark.repl.SparkIMain$exprTyper=ERROR
log4j.logger.org.apache.spark.repl.SparkILoop$SparkILoopInterpreter=ERROR
log4j.logger.org.apache.parquet=ERROR
log4j.logger.parquet=ERROR# SPARK-9183: Settings to avoid annoying messages when looking up nonexistent UDFs in SparkSQL with Hive support
log4j.logger.org.apache.hadoop.hive.metastore.RetryingHMSHandler=FATAL
log4j.logger.org.apache.hadoop.hive.ql.exec.FunctionRegistry=ERROR

2.1.2 创建IDEA快捷键

1)点击File->Settings…->Editor->Live Templates->output->Live Template
在这里插入图片描述
在这里插入图片描述
2)点击左下角的Define->选择JAVA
在这里插入图片描述
3)在Abbreviation中输入快捷键名称sc,在Template text中填写,输入快捷键后生成的内容。
在这里插入图片描述

// 1.创建配置对象
SparkConf conf = new SparkConf().setMaster("local[*]").setAppName("sparkCore");// 2. 创建sparkContext
JavaSparkContext sc = new JavaSparkContext(conf);// 3. 编写代码// 4. 关闭sc
sc.stop();
http://www.yayakq.cn/news/914032/

相关文章:

  • 织梦博客网站模板下载大宗交易网登录
  • 58同城长沙回收网站建设网站管理后台密码忘记了
  • 酒类网站建设策划书小网站模板下载 迅雷下载 迅雷下载不了
  • 广东网站开发公司电话社区类网站开发实践
  • 个人网站设计作品图片211工程建设网站
  • 深圳 建设银行国际互联网站贵阳网站建设费用多少网帮你
  • 澄迈网站新闻建设房子wordpress换域名和空间
  • 孝感哪家做网站的公司好建立企业网站的目的和意义
  • wap网站界面西宁做网站君博示范
  • 医院网站可信认证必须做吗网站开发执行什么标准号
  • 网站建设腾讯课堂wordpress 充值积分插件
  • 做PPT的辅助网站免费男人做那个的视频网站
  • 北京网站建设专业乐云seo电子商务网站详细设计
  • 百度做网站 推广费用怎么收潍坊汇聚网站
  • 网站开发开票编码归属佛山技术支持 禅城企业网站
  • 怎么做系统软件网站宣传方式
  • 福州晋安区建设局网站网站开发网页制作薪资
  • 网站建设公司被网监大队检查除了亚马逊还有啥网站做海淘
  • 手机建站模版thinkcmf 做企业网站
  • 广州市外贸网站建设文明网站建设情况报告
  • 企业网站展示生产的处方药介绍处罚案件网络安全方案设计步骤
  • 招聘网站套餐做导购网站用什么样的主机
  • 网站建设公司推荐5788网络公司经营范围网站建设
  • 辽源网站优化手机购物网站 设计
  • 歌曲网站源码金科做的网站
  • 网站开发工具发展史媒体软文推广平台
  • 微信与网站对接权威网站建设公司
  • 新网站建设代理商住房和城乡建设部网站 城市绿地分类
  • 学校网站建设评估开源wiki做网站
  • 营销型网站建设知识模板网站禁止右键