当前位置: 首页 > news >正文

微信网站设计运营域名历史查询工具

微信网站设计运营,域名历史查询工具,代理注册公司要多少钱,网站怎么做下载链接当分区由多变少时,不需要shuffle,也就是父RDD与子RDD之间是窄依赖。 当分区由少变多时,是需要shuffle的。 但极端情况下(1000个分区变成1个分区),这时如果将shuffle设置为false,父子RDD是窄依赖关系&…

当分区由多变少时,不需要shuffle,也就是父RDD与子RDD之间是窄依赖

当分区由少变多时,是需要shuffle的。

但极端情况下(1000个分区变成1个分区),这时如果将shuffle设置为false,父子RDD是窄依赖关系,他们同处在一个Stage中,就可能造成spark程序的并行度不够,从而影响性能,如果1000个分区变成1个分区,为了使coalesce之前的操作有更好的并行度,可以将shuffle设置为true。

scala> val arr = Array(1,2,3,4,5,6,7,8,9)
arr: Array[Int] = Array(1, 2, 3, 4, 5, 6, 7, 8, 9)scala> sc.makeRDD(arr,3)
res12: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[14] at makeRDD at <console>:27scala> res12.coalesce(2)
res13: org.apache.spark.rdd.RDD[Int] = CoalescedRDD[15] at coalesce at <console>:26scala> res13.partitions.size 
res14: Int = 2scala> res12.coalesce(12)
res15: org.apache.spark.rdd.RDD[Int] = CoalescedRDD[16] at coalesce at <console>:26scala> res15.partitions.size
res16: Int = 3scala> res12.repartition(2)
res17: org.apache.spark.rdd.RDD[Int] = MapPartitionsRDD[20] at repartition at <console>:26scala> res17.partitions.size
res18: Int = 2scala> res12.repartition(12)
res19: org.apache.spark.rdd.RDD[Int] = MapPartitionsRDD[24] at repartition at <console>:26scala> res19.partitions.size
res20: Int = 12

repartition算子底层调用的是coalesce算子。且shuffle指定了值为true。一定会发生shuffle阶段。

repartition带有shuffle可以增加也可以减少。shuffle参数指定为true,即一定会发生shuffle阶段。

coalesce算子只能减少不能增加。由于coalesce的shuffle默认false。

例子:

如果说一个阶段中存在union或者是coalesce算子会出现rdd的分区数量变化,但是没有shuffle的情况,看最后的rdd的分区个数就是当前阶段的task任务的个数

coalesce算子并没有发生shuffle,没有划分stage。但reduceByKey产生了shuffle,所以应该划分stage。

http://www.yidumall.com/news/70431.html

相关文章:

  • 如何做类似千图网的网站营销自动化
  • 重庆营销型网站开发公司电话杭州网站运营十年乐云seo
  • 盐城大丰网站建设找哪家好陕西seo快速排名
  • 怎么做网站的需求网络推广合作协议范本
  • 网站建设 学习什么优化外包哪里好
  • 让家里的电脑做网站服务器百度外推排名代做
  • 网站关键词怎么做可以排名如何建造自己的网站
  • 购物网站css模板seo分析与优化实训心得
  • 成都b2c网站产品线上推广方式都有哪些
  • 泰安人才网官网登录百度关键词排名优化工具
  • 云平台网站优化佛山百度快照优化排名
  • 网站实现步骤及方法是qq推广工具
  • 在那个网站可以搜索做凉菜视频软文网站推广
  • 如何做网站banner北京it培训机构哪家好
  • 网站被取消备案重庆seo整站优化效果
  • 江门网站优化排名中国十大软件外包公司
  • 国内看网站 优帮云搜索百度网址网页
  • 手机排行榜2021前十名seo专员是干什么的
  • 一家只做家纺的网站企业网站推广的方法
  • 做网站用图片算侵犯著作权吗六年级下册数学优化设计答案
  • 网站怎么做啊seo牛人
  • 康巴什住房和城乡建设局网站seochinazcom
  • 群晖做网站服务器会卡吗徐州seo外包
  • 西安三桥网站建设宝安网站建设
  • 网站建设维护公司资质北京刚刚传来特大消息
  • 怎么做动态网站页面培训网站源码
  • wordpress ip security杭州seo公司哪家好
  • 注册网站的流程企业网站制作模板
  • 怎么选择网站模板网店代运营哪个好
  • 建立个大型网站需要多少投入软文营销策划方案