当前位置: 首页 > news >正文

佛山微网站建设 天博成人用品网店进货渠道

佛山微网站建设 天博,成人用品网店进货渠道,用.net做网站好 还是用php,有没有网站是免费做店招图片的场景: 今天接了一个需求,将测试环境的hive数据导入到正式环境中。但是不需要整个流程的迁移,只需要迁移ads表 解决方案: 拿到这个需求首先想到两个方案: 1、将数据通过insert into语句导出,然后运行脚本 …

场景:

今天接了一个需求,将测试环境的hive数据导入到正式环境中。但是不需要整个流程的迁移,只需要迁移ads表


解决方案:

拿到这个需求首先想到两个方案:

1、将数据通过insert into语句导出,然后运行脚本
2、数据导出成csv格式的数据,然后Load进hive

方案一的实践过程中,发现几个问题,然后果断进行了方案二。就讲讲方案一存在的问题

  1. ads数据量较大。存在18W的数据量,对于大集群而言不值一提,但是公司的堡垒机资源较小,且用DBServer不支持18WSQL执行
  2. DBServer hive不支持SQL脚本运行,只能粘贴复制,还是问题一一样资源太小
    最终采用方案二

实践过程:

这里就说说方案二遇到的问题以及解决方案

  1. hive查询结果导出CSV时间格式问题。下图就我设置了CSV导出格式,但是还是存在问题,且时间格式还存在引号的情况,所以将数据导出来之后,用WPS进行打开,对时间格式进行一个调整,然后在保存为CSV结构的数据,用nodepad++打开即可
    在这里插入图片描述

  2. hive导入成功但数据不存在。下面截图就展示了存在的问题。这个问题就是因为hive建表的问题,hive建表的格式不是文本格式导致的。我开始用的org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat,后续如果不指定格式,默认格式就是org.apache.hadoop.mapred.TextInputFormat即可导入进去
    在这里插入图片描述在这里插入图片描述

  3. hive数据导入之后一行的数据都存在某一个字段中。这个问题是因为hive没有指定数据导入后按照什么方式进行分割。SET SERDEPROPERTIES ('field.delim'=',', 'serialization.format'=' ')指定这个参数后,hive会将csv导入的数据按照逗号分隔。但是请注意,你的数据存在json数据或者别的逗号数据,导入后可能会产生数据错位的情况。在条件允许的情况下,将json和数据中的逗号,在WPS中用中文逗号替换即可。

  4. 其他的解决方案:其实这种类型的问题解决方案应该很多。例如:shell脚本执行hive insert语句、将数据插入到mysql用ETL的方式抽取到hive目标表。

总结:

导入数据考验一个细心的程度其实问题也不难,就是麻烦。如果其他网友有更好的解决办法,欢迎留言

http://www.yidumall.com/news/99864.html

相关文章:

  • wordpress设置网站主题产品软文范例
  • 个人求职网站源代码网络营销首先要进行
  • 企业网站 建设 外包九幺seo优化神器
  • 知名外贸网站建设公司如何用百度平台营销
  • 西部数码网站管理控制面板seo网络推广是干嘛的
  • 珠宝类网站建设世界网站排名查询
  • 天津品牌建站牛推网络
  • 自己做网站和外包百度信息流广告
  • 网站信息可以自有品牌如何推广
  • 网站定制seo免费培训
  • jetty网站开发店铺运营方案策划
  • 网站制作费用要多少钱北京债务优化公司
  • 做我的世界壁纸的网站如何免费建立一个网站
  • 17一起做网店普宁太原seo外包服务
  • 一站式服务包括哪些内容搜索引擎排名优化方案
  • 欢度春节web网页设计作业站内seo内容优化包括
  • 做商城网站需要的功能营销方法有哪些
  • 长沙建网站企业网络推广运营公司
  • 企业网站建设可以分为几个层次seo优化流程
  • 酒店宾馆客栈旅馆古典网站源码 asp源码带后台手机怎么做网站免费的
  • 开网络公司做网站挣钱么企业内训机构
  • 楚风网站建设工作室培训机构管理系统哪个好
  • 网站建设工资多少网课免费平台
  • 汕头搭建建站谷歌搜索引擎怎么才能用
  • 温州专业制作网站站长素材网站官网
  • 个人网站网页制作快速seo排名优化
  • 阿里云怎么放多个网站南京百度
  • 做网站的关键技术怎么制作网页设计
  • 成人用品网站怎么推广论坛推广软件
  • 哪些网站可以做兼职百度云资源搜索平台