当前位置: 首页 > news >正文

旅游平台网站合作建设方案市场营销案例

旅游平台网站合作建设方案,市场营销案例,哪个网站做加盟的比较靠谱,网站开发与网页制作Spark 磁盘作用磁盘作用性能价值失败重试ReuseExchangeSpark 导航 磁盘作用 临时文件、中间文件、缓存数据,都会存储到 spark.local.dir 中 在 Shuffle Map 时, 当内存空间不足,就会溢出临时文件存储到磁盘上溢出的临时文件一起做归并计算…

Spark 磁盘作用

  • 磁盘作用
  • 性能价值
    • 失败重试
    • ReuseExchange

Spark 导航

磁盘作用

临时文件、中间文件、缓存数据,都会存储到 spark.local.dir

  • 在 Shuffle Map 时, 当内存空间不足,就会溢出临时文件存储到磁盘上
  • 溢出的临时文件一起做归并计算,得到 Shuffle 中间文件存储到磁盘上
  • 缓存分布式数据集 : DISK 的存储模式,会把内存中放不下的数据缓存到磁盘

在这里插入图片描述

性能价值

spark.local.dir 配置到 SDD 或访问高效的存储系统

磁盘复用 :

  • 给执行性能带来更好的提升
  • 磁盘复用 : Shuffle Write 产生的中间文件被多次利用

失败重试

一旦某个计算环节出错,就会触发失败重试。失败重试的触发点是距离最新的 Shuffle 的中间文件

当 RDD4 的计算任务失败时,会从 RDD4 向前回溯,回溯到 RDD3 (RDD2 输出的中间文件 ) ,并重新开始计算

在这里插入图片描述

ReuseExchange

ReuseExchange 是 Spark SQL 优化一种 : 相同或相似的物理计划能共享 Shuffle 中间文件

ReuseExchange 机制的触发条件:

  • 多个查询所依赖的分区规则要与 Shuffle 中间数据的分区规则保持一致
  • 多个查询所涉及的字段(Attributes)要保持一致

在这里插入图片描述

统计不同用户的 PV(Page Views,页面浏览量)、UV(Unique Views,网站独立访客),并把两项统计结果合并:

//版本1:分别计算PV、UV,然后合并
// Data schema (userId: String, accessTime: Timestamp, page: String)
val filePath: String = _
val df: DataFrame = spark.read.parquet(filePath)val dfPV: DataFrame = df.groupBy("userId").agg(count("page").alias("value"))
val dfUV: DataFrame = df.groupBy("userId").agg(countDistinct("page").alias("value"))val resultDF: DataFrame = dfPV.Union(dfUV)
// Result样例
| userId | metrics | value |
| user0 | PV | 25 |
| user0 | UV | 12 |

文件扫描/Shuffle 两次 :

在这里插入图片描述

以 userId 为分区 ,调用 repartition :

//版本2:分别计算PV、UV,然后合并
// Data schema (userId: String, accessTime: Timestamp, page: String)
val filePath: String = _
val df: DataFrame = spark.read.parquet(filePath).repartition($"userId")val dfPV: DataFrame = df.groupBy("userId").agg(count("page").alias("value"))
val dfUV: DataFrame = df.groupBy("userId").agg(countDistinct("page").alias("value"))val resultDF: DataFrame = dfPV.Union(dfUV)
// Result样例
| userId | metrics | value |
| user0 | PV | 25 |
| user0 | UV | 12 |

ReuseExchange :

  • 数据源只需扫描一遍
  • Shuffle 也只发生一次

在这里插入图片描述

http://www.yidumall.com/news/108279.html

相关文章:

  • 哪家网络公司做网站好经典广告推广词
  • 网站设计原型图怎么做网站运营策划书
  • 网站建设设计制作维护直通车官网
  • 自己做网站的流程视频教程网站建设是什么
  • 温州网站建设温州网站制作网店运营在哪里学比较好些
  • 开一家网络公司做网站前景如何注册网站怎么注册
  • 怎么查看网站有没有做ssl互联网营销师培训课程
  • 深圳注册公司代办张掖seo
  • 做网站行业的动态网络推广大概需要多少钱
  • ui网页设计介绍如何做好seo基础优化
  • 做网站和商城有什么好处上海短视频seo优化网站
  • 网站后台管理怎么做社区营销推广活动方案
  • 济南优化排名公司seo的基础优化
  • 西宁网站建设报价cu君博規范黄页推广2021
  • python做网站好不好网络推广最好的网站有哪些
  • 做h5页面网站有哪些搜索排名优化策划
  • 产品摄影网站推荐seo推广骗局
  • 做二手车网站需要什么手续优化大师有必要花钱吗
  • 会python做网站百度seo搜索引擎优化培训
  • 江苏省建设厅网站查询seo是做什么工作的
  • 做网站抄代码营销策划推广
  • 茂名网站开发公司推荐百度小说app
  • 网站开发人员要求一个网站可以优化多少关键词
  • 临沂网站建设和轶件安装抖音自动推广引流app
  • 网站内容的作用服务营销策略
  • 关于网站建设的名言seo网站优化培训多少价格
  • 网站推广目的关键词采集软件
  • 怎样做彩票投资网站系统优化软件哪个好
  • 网站推广公司转型方向share群组链接分享
  • 专业建设验收网站山东做网站