当前位置: 首页 > news >正文

做网站的教学视频seo信息是什么

做网站的教学视频,seo信息是什么,企业网站策划案例,.net 微信网站开发这是仿真过程某图: 仿真实战kafka kafka消费sink端和StructuredStreaming集成通信成功 , 数据接收全部接收 数据落地情况: 全部接收到并all存入mysql 下面就简单分享一下StructuredStreaming代码吧 import org.apache.spark.sql.function…

          这是仿真过程某图:

仿真场景kafkaStream
仿真实战kafka
 

 kafka消费sink端和StructuredStreaming集成通信成功 , 数据接收全部接收

数据落地情况: 

全部接收到并all存入mysql

下面就简单分享一下StructuredStreaming代码吧

import org.apache.spark.sql.functions.{col, from_json}
import org.apache.spark.sql.streaming.{ OutputMode, Trigger}
import org.apache.spark.sql.types.{IntegerType, StringType,  StructType}
import org.apache.spark.sql.{DataFrame, Dataset, Row, SparkSession}val spark: SparkSession = SparkSession.builder().appName("kafkaConsumer").master("local[3]").getOrCreate()import spark.implicits._// 定义json字段类型格式val Jsonschmea: StructType = new StructType().add("id", dataType = IntegerType).add("name", dataType = StringType).add("sorce", dataType = IntegerType)val message: DataFrame = spark.readStream // message为从kafka读到的原数据.format("kafka").option("kafka.bootstrap.servers", "xxxxx:9092,xxxx:9092,xxxx:9092").option("subscribe", "xxxx").option("startingOffsets", "latest").load()// 将json字符串转化为结构化数据val streamData: DataFrame = message.selectExpr("cast(value as String) as message") .select(from_json($"message", Jsonschmea).alias("data"))// 将json结构化为新的df// 预加载mysql驱动// 实时写入 第二个参数预占位,want给每一批次加入唯一表示, but本次仅占位没有传参数def writeToMysql(batchDF: DataFrame, epochId: Long): Unit = {val sqlurl = "jdbc:mysql://localhost:xxxx/xxxx"val sqluser = "xxxx"val sqlpass = "xxxxx"Class.forName("com.mysql.cj.jdbc.Driver")  // mysql 8.0后得驱动,旧版本去掉cjbatchDF.foreachPartition {partitionOfRecords =>val connection = DriverManager.getConnection(sqlurl, sqluser, sqlpass)// 关闭自动提交以支持增量写入connection.setAutoCommit(false)// 创建预编译的插入语句val insertsql = "insert into jsonstream(id,name,sorce) values(?,?,?)"val preparedStatement = connection.prepareStatement(insertsql)partitionOfRecords.foreach {row =>
//              val id = row.getAs[Int]("data.id")
//              val name = row.getAs[String]("data.name")
//              val score = row.getAs[Int]("data.sorce")val id = row.getAs[Row]("data").getAs[Int]("id")val name = row.getAs[Row]("data").getAs[String]("name")val sorce = row.getAs[Row]("data").getAs[Int]("sorce")// 设置参数到预处理sql函数中preparedStatement.setInt(1, id)preparedStatement.setString(2, name)preparedStatement.setInt(3, sorce)// 执行添加到批次操作preparedStatement.addBatch()}preparedStatement.executeBatch()connection.commit() // 执行批处理后手动提交事务preparedStatement.close()  // 手动GCconnection.close()}}// 数据落地到数据库streamData.writeStream.outputMode(OutputMode.Append()).foreachBatch(writeToMysql _).trigger(Trigger.ProcessingTime("1 millisecond")) // 1 毫秒每个batch.start().awaitTermination()

存储按照一定批次量做存储   

友情提示 : 上述程序是经过脱敏处理的哦

----彩蛋----

如果你看到者你会知道scala在11更新之后也就是12版本如下:

batchDF.foreachPartition {partitionOfRecords => ... 这个位置

 Dataset的foreachPartition 里面不能处理 Row的Iterator, 所以需要转为rdd在做处理

所以更改后为

batchDF.rdd.foreachPartition { partitionOfRecords => ...

而且这里不能用foreach , 否则无法序列化就能存储到mysql, 不能被序列化的数据是不能在网络中进行传输的,通过二进制流的形式传出,在被反序列化回来转化为对象的形式存储

ok -----

http://www.yidumall.com/news/104316.html

相关文章:

  • 青海公路建设服务网站怎样宣传自己的品牌
  • 东莞医院网站建设口碑营销的特征
  • 自己网站开发百度快照网址
  • 个人博客网站实验报告学校seo推广培训班
  • 网站积分解决方案郑州seo哪家好
  • 什么语言开发网站百度的网址是什么
  • 简单的j网站建设方案书网络营销与策划试题及答案
  • 响应式营销网站百度排名优化专家
  • 销售部网站建设费牡丹江seo
  • 天眼查询企业信息官网电话抖音seo关键词排名技术
  • 射阳建设局网站东莞疫情最新消息今天中高风险区
  • 增城移动网站建设网站优化seo怎么做
  • 网站建设的模板最好用的搜索神器
  • 莱州市住房和规划建设管理局网站网络营销图片
  • 山东济宁网站建设抚顺网站建设
  • 石家庄做网站的公司有哪些品牌宣传的推广
  • 企业数字化管理seo官网优化
  • 做网站建设的电销南昌搜索引擎优化
  • 宝安区网站建设公司视频号排名优化帝搜软件
  • 常州网站建设效果seo公司网站推广
  • 怎么做网站301重定向公关服务
  • 政府部门网站建设怎么免费注册域名
  • 上海网站排名公司员工培训
  • java免费入门网站软文代写费用
  • 河北定制网站建设产业怎么申请域名建网站
  • 网页设计代码全过程网站优化联系
  • phpweb网站模板商品促销活动策划方案
  • 深圳网站设计兴田德润信任高网络营销的概念
  • 中企动力做过的网站2022适合小学生的简短新闻摘抄
  • wordpress 社区 插件windows优化大师是自带的吗