当前位置: 首页 > news >正文

公司网站建设前期情况说明东莞网站推广策划

公司网站建设前期情况说明,东莞网站推广策划,西安建设银行网站,如何做电商网站设计锁屏面试题百日百刷,每个工作日坚持更新面试题。锁屏面试题app、小程序现已上线,官网地址:https://www.demosoftware.cn。已收录了每日更新的面试题的所有内容,还包含特色的解锁屏幕复习面试题、每日编程题目邮件推送等功能。让你…

  锁屏面试题百日百刷,每个工作日坚持更新面试题。锁屏面试题app、小程序现已上线,官网地址:https://www.demosoftware.cn。已收录了每日更新的面试题的所有内容,还包含特色的解锁屏幕复习面试题、每日编程题目邮件推送等功能。让你在面试中先人一步!接下来的是今日的面试题:

 

1.如何理解SMB Join

全称Sort Merge Bucket Join。

作用

大表对小表应该使用MapJoin来进行优化,但是如果是大表对大表,如果进行shuffle,那就非常可怕,第一个慢不用说,第二个容易出异常,此时就可以使用SMB Join来提高性能。SMB Join

基于bucket-mapjoin的有序bucket,可实现在map端完成join操作,可以有效地减少或避免shuffle的数据量。SMB join的条件和Map join类似但又不同。

条件

注意事项

hive并不检查两个join的表是否已经做好bucket且sorted,需要用户自己去保证join的表数据sorted,否则可能数据不正确。

有两个办法:

1)hive.enforce.sorting 设置为 true。开启强制排序时,插数据到表中会进行强制排序,默认false。

2)插入数据时通过在sql中用distributed c1 sort by c1 或者 cluster by c1

另外,表创建时必须是CLUSTERED且SORTED,如下:

create table test_smb_2(mid string,age_id string)

CLUSTERED BY(mid) SORTED BY(mid) INTO 500 BUCKETS;

综上,涉及到分桶表操作的齐全配置为:

--写入数据强制分桶

set hive.enforce.bucketing=true; --写入数据强制排序

set hive.enforce.sorting=true; --开启bucketmapjoin

set hive.optimize.bucketmapjoin = true; --开启SMB Join

set hive.auto.convert.sortmerge.join=true;

set hive.auto.convert.sortmerge.join.noconditionaltask=true;

开启MapJoin的配置

(hive.auto.convert.join和hive.auto.convert.join.noconditionaltask.size),

还有限制对桶表进行load操作(hive.strict.checks.bucketing)可以直接设置在hive的配置项中,无需在sql中声明。

自动尝试SMB联接(hive.optimize.bucketmapjoin.sortedmerge)也可以在设置中进行提前配置。

2.讲一讲Hive索引

Hive支持索引,但是Hive的索引与关系型数据库中的索引并不相同,比如,Hive不支持主键或者外键。

Hive索引可以建立在表中的某些列上,以提升一些操作的效率,例如减少MapReduce任务中需要读取的数据块的数量。

在可以预见到分区数据非常庞大的情况下,分桶和索引常常是优于分区的。而分桶由于SMB

Join对关联键要求严格,所以并不是总能生效。

Hive的索引目的是提高Hive表指定列的查询速度。

没有索引时,类似'WHERE tab1.col1 = 10' 的查询,Hive会加载整张表或分区,然后处理所有的rows,但是如果在字段col1上面存在索引时,那么只会加载和处理文件的一部分。

在每次建立、更新数据后,Hive索引不会自动更新,需要手动进行更新(重建索引以构建索引表),会触发一个mr job。

Hive索引使用过程繁杂,而且性能一般,在Hive3.0中已被删除,在工作环境中不推荐优先使用,在分区数量过多或查询字段不是分区字段时,索引可以作为补充方案同时使用。推荐使用ORC文件格式的索引类型进行查询。

http://www.yidumall.com/news/72330.html

相关文章:

  • 三级做视频网站有哪些优化设计单元测试卷答案
  • 个人网站备案怎么样才能简单的过网站关键词seo排名
  • 医院网站开发公司网推什么意思
  • 在线教育网站建设方案谷歌网页
  • 汕头做网站营销网络是啥意思
  • 网络营销哪家比较专业广州软件系统开发seo推广
  • 山西网站建设今日头条极速版官网
  • 郓城住房和城乡建设厅网站注册域名要钱吗
  • 矿产网站开发seo推广软件品牌
  • 山西响应式网站设计网站测试
  • wordpress评论去掉网址seo搜索引擎优化关键词
  • led灯网站建设案例手机网站制作软件
  • 深圳乐创网站建设常见的网络推广方式
  • 王也头像高清帅气网络推广seo是什么
  • 做初中物理题目的网站网络外贸推广
  • 淞南网站建设抚顺网站建设
  • 做网站赚钱 百度网盟推推蛙品牌策划
  • 做动态网站的用工具网络营销seo是什么意思
  • 电商网站建设如何厦门百度代理公司
  • 网站做自签发证书职业培训机构有哪些
  • 南京做中英文网站设计免费seo优化工具
  • 手机微网站怎么制作百度网首页官网
  • 阅文集团旗下哪个网站做的最好搜索广告
  • 灵山招聘网灵山英才网做灵山专业的招聘网站品牌推广策划方案怎么写
  • 宝洁公司网站做的怎么样直接打开百度
  • 我的网站没备案怎么做淘宝客推广一个网站的seo优化有哪些
  • java web网站开发文档今日头条搜索优化怎么做
  • 成都建设银行合作装修网站管理培训课程
  • 花桥网站建设网络营销的优势与不足
  • magento做的网站中国万网域名注册服务内容