当前位置: 首页 > news >正文

网站推广神器聊城专业网站建设制作

网站推广神器,聊城专业网站建设制作,装修公司网站建设的意义,零基础学wordpress pdf下载基本流程 用户编写的Spark应用程序最开始都要初始化SparkContext。 用户编写的应用程序中,每执行一个action操作,就会触发一个job的执行,一个应用程序中可能会生成多个job执行。一个job如果存在宽依赖,会将shuffle前后划分成两个…

基本流程

用户编写的Spark应用程序最开始都要初始化SparkContext。

用户编写的应用程序中,每执行一个action操作,就会触发一个job的执行,一个应用程序中可能会生成多个job执行。一个job如果存在宽依赖,会将shuffle前后划分成两个stage,前一个stage会将计算结果临时进行存储,后一个stage则进行读取,完成数据交换。

每个stage中,需要执行的计算过程会被划分成多个逻辑相同的一组Task,每个Task会被提交到Executor中运行。当Task运行完成后,会将运行结果返回至Driver中。 

主要组件

Driver端

  1. DAGScheduler:负责将Job划分为Stage,再将Stage划分为TaskSet;
  2. TaskScheduler:负责任务的调度;
  3. SchedulerBackend:负责资源的分配,并把Task提交给Executor中执行。

Executor端

  1. BlockManager:缓存RDD、缓存Task运行结果。

Job提交执行流程

Task提交

SparkContext将RDD的action操作转化为Job,并将Job交给DAGScheduler做进一步处理。

DAGScheduler首选根据shuffle划分stage,根据stage中分区的数量,生成一组Task(即TaskSet),生成Task时还会计算Task的最佳执行位置。DAGScheduler会根据RDD是否进行了缓存来确定是否具有最佳运行位置。

DAGScheduler将Stage生成TaskSet以后,会将TaskSet交给TaskScheduler进行处理,TaskScheduler负责将Task提交到集群中运行,并负责失败重试,为DAGScheduler返回事件信息等。

当有任务提交至TaskScheduler中时,TaskScheduler会通知SchedulerBackend分配计算资源。SchedulerBackend将所有可用的Executor的资源信息转换为WorkerOffer交给TaskScheduler。TaskScheduler负责根据这些WorkerOffer在相应的Executor分配TaskSet中的Task。

SchedulerBackend中通过使用Map结构记录每一个ExecutorData的映射,即可管理所有Executor的CPU使用的情况。为计算任务分配计算资源时,只需要遍历所有的ExecutorData,分配可用的资源即可。

TaskScheduler在接受到DAGScheduler提交的TaskSet以后,会为每个TaskSet创建一个TaskSetManager,用于管理该TaskSet中所有任务的运行。TaskSetManager会根据Task中的最佳运行位置计算TaskSet的所有本地运行级别,本地运行的级别决定了Task最终在哪个Executor中运行。Spark中本地运行级别从小到大可分为进程本地化、节点本地化、无优先位置、机架本地化、任意节点。

Task执行

Executor接收到SchedulerBackend提交的LaunchTask消息后,即可运行该消息中包含的Task。Executor将接收到的Task封装到TaskRunner中,TaskRunner是一个Runnable接口,从而可以将该任务提交到线程池中运行。

当在一个Executor中同时运行多个Task时,多个Task共享Executor中SparkEnv的所有组件,共用Executor中分配的内存。如使用Spark广播变量时,每个Executor中会存在一份,Executor中所有的任务会共享这一份变量。当Executor中的BlockManager缓存了某rdd某分区的数据时,在该Executor上调度使用这个RDD的这个分区的数据的Task执行,可以有效减少网络加载数据的过程,减少网络传输。

当Executor中Task运行完成时,需要将Task的运行结果返回Driver程序,Driver程序根据结果判断该Stage是否计算完成,或者该Job是否计算完成。

http://www.yayakq.cn/news/703339/

相关文章:

  • 内蒙古自治区生态文明建设网站wordpress 浮动div
  • 2017网站制作报价单阜阳网站建设fywzjs
  • 广州建设网站公司免费asp网站源码
  • asp.net做音乐网站建材建设网站
  • 北京上云科技网站建设网站外链建设可以提升网站权重吗
  • 网站地图生成代码紧急消息石家庄
  • 网站成功案例设计中小企业名录查询官网入口
  • 网站正在建设中 动态网络营销方式优势
  • 摄影网站cnu视觉联盟福清网站商城建设
  • 建立网站大概需要多长时间个人怎么做微信公众号和微网站吗
  • 西安网站建设瑞信wordpress下安装论坛 伪静态
  • 八冶建设集团有限公司网站连云港企业网站建设公司
  • 网站开发后端语言容桂均安网站建设
  • 宁波网站建设i sp.net域名申请好了 要怎么做网站
  • 手机网站调用分享莱芜做网站的商家有哪些
  • 电脑做网站服务器教程软件开发好做吗
  • 三合一网站建站网络营销外包要多少钱
  • 做家装的网站有哪些内容比较冷门的视频网站做搬运
  • ASP个人网站的建设优化营商环境建议
  • 阿里云建设网站步骤工程建设数字化管理平台app下载
  • 科技公司网站源码北京国税局网站官网入口
  • 中国网站优化公司万宁网站建设
  • 做网站要开发嘛服务营销案例
  • 有网站如何做直播什么公司需要建立网站吗
  • 做热饮店网站设计制作一个网站
  • 秦皇岛网站开发公司重庆建设岗位证书查询网
  • 怎么设置网站栏目电子商务网站建设教程 pdf
  • 网站支付宝接口付费怎样做自己的购物网站
  • 企业建设营销网站的基本步骤论坛源码哪个好
  • 深圳罗湖区网站建设公司wordpress 查询