当前位置: 首页 > news >正文

专题网站开发 交互方法国际网站平台有哪些

专题网站开发 交互方法,国际网站平台有哪些,什么都能搜的浏览器,哈尔滨政府网站建设大数据系列之:读取parquet文件统计数据量 一、Spark读取parquet文件统计数据量二、parquet-tools统计parquet文件数据量三、实际应用案例 一、Spark读取parquet文件统计数据量 首先,创建一个 SparkSession 对象: val spark SparkSession.b…

大数据系列之:读取parquet文件统计数据量

  • 一、Spark读取parquet文件统计数据量
  • 二、parquet-tools统计parquet文件数据量
  • 三、实际应用案例

一、Spark读取parquet文件统计数据量

  1. 首先,创建一个 SparkSession 对象:
val spark = SparkSession.builder().appName("Parquet Data Count").getOrCreate()
  1. 然后,使用 SparkSession 读取 Parquet 文件并将其转换为 DataFrame:
val data = spark.read.format("parquet").load("/path/to/hdfs/parquet/file")
  1. 最后,使用 DataFrame 的 count 方法进行数据量统计:
val count = data.count()

二、parquet-tools统计parquet文件数据量

下载parquet-tools工具

使用 Hadoop 命令行工具:

  1. 首先,使用 Hadoop 命令行工具 hadoop 运行以下命令:
hadoop fs -cat /path/to/hdfs/parquet/file | parquet-tools rowcount
  1. 该命令将读取 Parquet 文件并使用 parquet-tools 工具来统计数据量,并输出结果。

三、实际应用案例

读取hdfs上的parquet文件:

%sparkval data = spark.read.format("parquet").load("/optics/ods_optics_prod/packing_data_item_1h_a/datetime=2023122514/part-00000-2675f81c-3c90-4af7-a489-bd8ce5cfec2c-c000.zstd.parquet")

查看数据量:

%spark
val count = data.count()count: Long = 433173
http://www.yidumall.com/news/20830.html

相关文章:

  • 大理网站建设谷歌seo搜索优化
  • ppt做的比较好的网站有哪些台州关键词优化平台
  • 网络营销顾问是什么长沙网站seo优化
  • 昆山移动网站建设网站创建流程
  • 广州网站制作温州云优化seo
  • 个人网站 商业线在成都网站推广公司
  • 网站建设低价建站损失在哪里全网推广成功再收费
  • 北京网络营销推广培训哪家好百度seo网络营销书
  • 做b2c网站还是平台互联网网站
  • 用asp.net做的网站模板下载百度电话客服24小时
  • 上海网站建设免费推荐移动营销
  • 织梦做网站如何套取别人网站的模板seo薪酬如何
  • 公司网站建设汇报硬件工程师培训机构哪家好
  • 领卷网站如何做代理wordpress seo教程
  • 一家专门做直销的网站广州百度关键词排名
  • 哈尔滨模板建站软件搜索引擎优化论文
  • 网站开发进度青岛seo霸屏
  • 精品网站开发公司湖北短视频seo营销
  • 网页设计与制作模板素材系统优化软件有哪些
  • 网站初期缺点南昌seo教程
  • 盘丝洞app破解无限盘币优化工具箱下载
  • 普通人做电商要多少钱seo平台代理
  • 电商沙盘seo裤子关键词长沙建站优化
  • 怎样做境外网站上赚钱百度seo快速排名优化软件
  • 硅谷电视剧他们做的是网站还是软件外包公司和劳务派遣
  • 现在帮人做网站赚钱吗semi final
  • 诸城网站建设电脑优化
  • 上传网站怎么安装公司官网制作多少钱
  • 大连网站建设找简维科技全网推广平台有哪些
  • 搜网站内容最成功的网络营销案例