当前位置: 首页 > news >正文

单页式网站模板亿速云官网

单页式网站模板,亿速云官网,好看免费的ppt模板下载,wordpress加上qq登录我们都知道Spark是弹性分布式数据集,数据会存储在多台机器上,那么如何确保在分布式数据计算中,数据不丢失就是其中的关键的部分。本文主要讲解一下Spark中的容错机制。 Spark 主要提供了3个层面的数据容错机制。分别是 调度层,RDD…

         我们都知道Spark是弹性分布式数据集,数据会存储在多台机器上,那么如何确保在分布式数据计算中,数据不丢失就是其中的关键的部分。本文主要讲解一下Spark中的容错机制。

        Spark 主要提供了3个层面的数据容错机制。分别是 调度层,RDD血统层, Checkpoint 层。在这3大层面中包括Spark RDD容错的4大核心要点.

  • (调度层)Stage输出失败,上层调度器DAGScheduler重试。
  • (调度层)Spark计算中,Task内部任务失败,底层调度器重试。
  • (血统层)RDD Lineage血统中窄依赖,宽依赖计算。
  • (Checkpoint层)Checkpoint 缓存。

调度层

DAG生成层

Stage 输出失败,上层调度器DAGScheduler 会进行重试

详细源码详见 Spark大数据商业实战三部曲p58

Task计算层

Spark计算过程中,计算内部某个Task任务出现失败,底层调度器会对此Task进行若干次重试(默认4次)

详细源码详见 Spark大数据商业实战三部曲p58

        

血统层

        SparkRDD 实现基于Lineage的容错机制,基于RDD的各项transformation 构成compute chain, 在部分计算结果丢失的时候可以根据Lineage重新恢复计算。

窄依赖 

         在子RDD的分区丢失,需要重算父RDD分区时。父RDD相应分区的所有数据都是子RDD分区的数据,并不存在冗余计算。

宽依赖

        丢失一个RDD分区,重算的每个父RDD的每个分区的所有数据并不是都丢给丢失的RDD的子RDD分区用的,会有一部分数据相当于对应的是未丢失的子RDD分区中需要的数据,这样就会产生冗余计算开销和巨大的性能浪费。

Checkpoint层

        Spark checkpoint 通过将RDD写入Disk作为检查点,是Spark lineage容错的辅助,lineage过长会造成容错成本过高,这时在中间阶段做检查点容错,如果之后有节点出现问题而丢失分区,从做检查点的RDD开始重做Lineage, 就会减少开销。

checkpoint 主要适用于以下两种情况 :

  • DAG中的Lineage过长,如果重算,开销太大,如PageRank, ALS等
  • 尤其适合于在宽依赖上作checkpoint,这个时候就可以避免为Lineage重新计算而带来的冗余计算。

http://www.yayakq.cn/news/58489/

相关文章:

  • 珠宝行网站建设方案广西桂林自驾游攻略
  • 自己做的网站加载慢wordpress 表单验证
  • 益阳做网站怎么便宜应用开发用什么软件
  • 南京建站推广公司wordpress图片轮播
  • 亿星网站建设360网站在系统那里
  • 网站设计中主题有哪些作用免费推广网站平台
  • 工信部网站备案验证码网络 企业网站
  • 用什么网软件做网站静态网站需要数据库吗
  • 哪做网站比较好泰州企业网站建站模板
  • 产品外观设计网站智能建站制作
  • 能上国外网站的dns信息科技公司网站怎么做
  • 广州住房保障城市建设局网站网站开发是
  • 音乐网站开发分享易语言如何做浏网站
  • 优秀的电商设计网站有哪些内容织梦网站系统删除不了
  • 域名到网站上线小程序平台开发多少钱
  • 南昌做网站哪个公司好大气红色礼品公司网站源码
  • 网页制作专业个人职业生涯规划书邢台谷歌seo
  • 网站建设硬件设计方案青白江网站建设
  • 做个网站出来要多少钱给人做网站赚钱
  • 自适应式网站模板品牌策划公司取名
  • 鄂州网站建设网络公司开元酒店集团品牌建设
  • 发行商城小程序沈阳seo排名优化软件
  • 菜单网站图片素材python做直播网站
  • 手机网站免费建设中国营销咨询公司排名
  • 产品网站用什么软件做软件开发平台设计
  • 马云是做网站的百度联盟怎么加入赚钱
  • 如何做网站的的关键词仿站网站源码
  • 电子商务网站建设详细策划书十堰今天刚刚发生新闻
  • 网站建设未验收会计账务处理微问数据平台入口
  • 网站备案登记表品牌全网推广