当前位置: 首页 > news >正文

平面设计与网站开发概述湖北省建筑信息平台

平面设计与网站开发概述,湖北省建筑信息平台,wordpress如何设置菜单,室内设计师测评网目录 一、第一种:parallelize 获取rdd时 二、第二种:通过外部读取数据-textFile 三、上面提到了默认分区数,那么默认分区是怎么计算呢? 一、第一种:parallelize 获取rdd时 没有指定:spark.default.paral…

目录

一、第一种:parallelize 获取rdd时

二、第二种:通过外部读取数据-textFile

三、上面提到了默认分区数,那么默认分区是怎么计算呢?


一、第一种:parallelize 获取rdd时

  • 没有指定:spark.default.parallelism参数值决定
  • 指定分区:指定几个,就是几个分区

总结:假如指定了分区数,分区数就是这个,假如没有指定spark.default.parallelism。

二、第二种:通过外部读取数据-textFile

  • 没有指定:spark.default.parallelism和2取最小值,

                         具体计算并行度的公式:min(spark.default.parallelism,2)

  • 指定分区:最小分区数,最少有这么多分区,具体的分区数可以根据HDFS分片规则来 hdfs                     ( 一片是128M或者128*1.1 = 140.8M)

rdd3 = sc.textFile("hdfs://bigdata01:9820/datas/wordcount/data.txt", minPartitions=2) 

假如你这个data.txt = 500M ,此时的分区数是:4  因为 500 =  128+ 128+ 128+ 116

三、上面提到了默认分区数,那么默认分区是怎么计算呢?

  • local模式

     默认并行度取决于本地机器的核数,即:

  1. local: 没有指定CPU核数,则所有计算都运行在一个线程当中,没有任何并行计算
  2. local[K]:指定使用K个Core来运行计算,比如local[2]就是运行2个Core来执行
  3. local[*]: 自动帮你按照CPU的核数来设置线程数。比如CPU有4核,Spark帮你自动设置4个线程计算
  • 集群模式

      集群模式包含Stanalone、Yarn模式,Mesos的默认并行度为8
      默认并行度取决于所有executor上的总核数与2的最大值,比如集群模式的设置如下:

--num-executors 5
--executor-cores 2
上面配置Executor的数量为5,每个Executor的CPU Core数量为2,
executor上的总核数10,则默认并行度为Max(10,2)=10。

http://www.yayakq.cn/news/41914/

相关文章:

  • 贷款类的网站好做怎么做仓库管理系统erp
  • 深圳企业网站建设制作莱阳网站建设公司
  • 网站 建设 深圳公关公司和广告公司的区别
  • 网站与网站自动跳转代码百度关键词怎么做排名
  • 金华网站推广最近新闻头条
  • 做产地证新网站精选南昌网站建设公司
  • 代码网站怎么做的国家企业信息公示网查询官网网址
  • 网站开发工作计划好网站制作公司
  • 网站建设的语言与工具小城镇建设投稿网站
  • 有意义的网站网站优化是做什么的
  • 网站建设小程序山东网站毕业设计答辩问题
  • 我看别人做系统就直接网站下载软件wordpress手机建站
  • 免费网站空间有哪些济南装修网
  • 网站平台建设的实训报告律师在线咨询免费24小时电话
  • asp网站301建湖人才网手机版
  • 网站建设税率长沙seo制作
  • 深圳朝阳电子网站建设建设银行网站不能登录不了
  • 郑州网站建设彳汉狮网络破解插件有后门wordpress
  • 在百度怎么做网站和推广线上推广软件
  • 网站标题在哪里长沙手机网站建设公司
  • 网站的形成制作灯笼的过程
  • 如何对网站做渗透小型网站制作
  • 一键生成表白网站平台运营推广方案
  • win2003网站建设电子印章在线制作
  • 枣阳建设局网站首页网站建设开发外包公司
  • 网站建设企业宣传口号成都淮洲新城建设投资有限公司网站
  • 如果网站没有icp备案号专业做视频的网站有哪些
  • 网站建设咨询中心抖音关键词排名优化
  • 网站开发流程原理如何下载网页上的视频
  • 蓝色风格网站模板做宠物网站心得