当前位置: 首页 > news >正文

网站开发英文一般网络推广应该怎么做

网站开发英文,一般网络推广应该怎么做,html网站开发相关书籍,南阳网站建设哪家好1. 输出为Python对象 collect算子:将RDD各个分区内的数据,统一收集到Driver中,形成一个List对象 reduce算子:对RDD数据集按照传入的逻辑进行聚合 take算子:取RDD的前N个元素,组合成list返回给你 count…

1. 输出为Python对象 

collect算子:将RDD各个分区内的数据,统一收集到Driver中,形成一个List对象

reduce算子:对RDD数据集按照传入的逻辑进行聚合

take算子:取RDD的前N个元素,组合成list返回给你

count算子:计算RDD有多少条数据,返回值是一个数字

# collect算子:将RDD各个分区内的数据,统一收集到Driver中,形成一个List对象
# 语法:rdd.collect()  # 返回一个listfrom pyspark import SparkConf, SparkContext
import osos.environ['PYSPARK_PYTHON'] = "D:/Program Files/Python3.11.4/python.exe"
conf = SparkConf().setMaster("local[*]").setSparkHome("test_spark")
sc = SparkContext(conf=conf)rdd = sc.parallelize([1, 2, 3, 4, 5])
my_list = rdd.collect()
print(my_list)  # [1, 2, 3, 4, 5]
print(type(my_list))  # <class 'list'># reduce算子:对RDD数据集按照传入的逻辑进行聚合
# 语法:rdd.reduce(func)
#   func(T,T) - > T   # 两个参数,一个返回值,且类型一致
num = rdd.reduce(lambda a, b: a + b)
print(num)  # 15# take算子:取RDD的前N个元素,组合成list返回给你
take_list = rdd.take(3)
print(take_list)  # [1, 2, 3]# count算子:计算RDD有多少条数据,返回值是一个数字
num_count = rdd.count()
print(num_count)  # 5

2. 输出到文件中

saveAsTextFile算子:将RDD的数据写入文本文件中

修改RDD分区为1个

  • 方式1:SparkConf对象设置属性全局并行度为1
  • 方式2:创建rdd的时候设置(parallelize方法传入numSlices参数为1)
# Spark数据输出到文件中
# saveAsTextFile算子:将RDD的数据写入文本文件中
from pyspark import SparkConf, SparkContext
import osos.environ['PYSPARK_PYTHON'] = "D:/Program Files/Python3.11.4/python.exe"
conf = SparkConf().setMaster("local[*]").setSparkHome("test_spark")
sc = SparkContext(conf=conf)# 修改RDD分区为1个
# 方式1:SparkConf对象设置属性全局并行度为1
conf.set("spark.default.parallelism", "1")
# 方式2:创建rdd的时候设置(parallelize方法传入numSlices参数为1)
rdd1 = sc.parallelize([1, 2, 3, 4, 5], numSlices=1)
# rdd1 = sc.parallelize([1, 2, 3, 4, 5],1)# rdd1 = sc.parallelize([1, 2, 3, 4, 5])
rdd2 = sc.parallelize([("hello", 3), ("Spark", 5), ("Hi", 7)])
rdd3 = sc.parallelize([[1, 3, 5], [6, 7, 9], [11, 13, 11]])rdd1.saveAsTextFile("./output1")
rdd2.saveAsTextFile("./output2")
rdd3.saveAsTextFile("./output3")

http://www.yidumall.com/news/51284.html

相关文章:

  • 金融网站建设成功案例高质量关键词搜索排名
  • 做同城网站需要哪些刷赞业务推广网站
  • 做网站的滚动字幕怎么制作网站软件下载大全
  • 如何在第三方网站做推广建网站的流程
  • 福州市建设局职改办门户网站站长是什么职位
  • 亦庄网站开发公司百度账号购买网站
  • 专门做h网页游戏的网站推推蛙seo顾问
  • 做网站深圳谷歌手机网页版入口
  • 东华网站开发杭州seo排名公司
  • 如何做网站打广告网拍外宣怎么推广
  • 网站做打火机如何怎么做一个自己的网站
  • 做网站的如何找业务朋友圈广告推广代理
  • 期货直播室网站建设全媒体运营师培训费用
  • php网站模板开源女排联赛最新排行榜
  • 长沙做网站备案企业微信营销系统
  • 淄博网站建设有实力百度搜索排名优化哪家好
  • 宝山网站建设服务企业查询网
  • 网站收录问题seo优化知识
  • 浙江建设信息网港西安seo阳建
  • 百度招聘 网站开发阿里巴巴官网首页
  • 郑州主动营销网站2023年9月疫情又开始了吗
  • 做微信公众号的网站有哪些内容广州最新消息
  • 罗湖网站建设价格网站建设介绍ppt
  • robots网站地图黄页引流推广网站入口
  • 做淘宝推广开网站合适柏乡seo快排优化
  • 企业展厅设计效果图seo教程seo教程
  • 做网站反链无锡百度正规公司
  • 网站独享ip哪有卖的成功营销案例100例
  • 找做外墙油漆网站百度竞价优缺点
  • 信阳做网站 汉狮网络信息流推广渠道有哪些