当前位置: 首页 > news >正文

中国移动官方网站登录入口seo快速推广窍门大公开

中国移动官方网站登录入口,seo快速推广窍门大公开,加强烟草行业政府网站建设管理,前端网页设计流程文章目录 一. 问题描述二. 解决方案2.1 官方文档2.2 XML格式不规范 一. 问题描述 今天接到一个新需求&#xff0c;hive表里面有个字段存储的是XML类型数据 数据格式: <a><b>bb</b><c>cc</c> </a>二. 解决方案 2.1 官方文档 遇到不懂的…

文章目录

  • 一. 问题描述
  • 二. 解决方案
    • 2.1 官方文档
    • 2.2 XML格式不规范

一. 问题描述

今天接到一个新需求,hive表里面有个字段存储的是XML类型数据

数据格式:

<a><b>bb</b><c>cc</c>
</a>

二. 解决方案

2.1 官方文档

遇到不懂的问题,首先上官方文档查询相关文档,然后照着官网的demo改改,一般就能解决问题了

官方文档地址:
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+XPathUDF
丰富的XML相关函数及测试用例

代码:

-- 求路径 a/b下面的值
SELECT xpath_string ('<a><b>bb</b><c>cc</c></a>', 'a/b') LIMIT 1 ;

测试记录:

hive> > SELECT xpath_string ('<a><b>bb</b><c>cc</c></a>', 'a/b') LIMIT 1 ;
OK
bb
Time taken: 1.477 seconds, Fetched: 1 row(s)
hive> 

2.2 XML格式不规范

因为Hive不支持XML数据格式,后端写入数据库存的是一个String类型,此时格式就没那么规范了,会有一些特殊字符

解析xml报错,原来是有特殊字符
https://stackoverflow.com/questions/730133/what-are-invalid-characters-in-xml

xml不符合规范的字符
https://blog.csdn.net/u014589856/article/details/107151252
image.png

通过正则表达式删除特殊字符:

  1. 下面几个是常用的特殊字符
@&$#%
regexp_replace(the_gifts,'[@&$#%]','')
  1. 只保留 大小写字母 数字 及中文 以及 xml标签
regexp_replace(the_gifts,'(^[a-z]+|[A-Z]+|[0-9]+|[\\u4E00-\\u9FA5]+[</>])','')
http://www.yidumall.com/news/29428.html

相关文章:

  • 合肥网站建设 一浪搜狗友链交换
  • 做ppt兼职的网站百度快照收录入口
  • 移动网站尺寸百度电脑版
  • 淘客做网站怎么备案关键词分析工具网站
  • 我的世界外国做图网站外链代发2分一条
  • 上海松江网站设计公司怎么做好seo内容优化
  • 网站开发研发设计百度云在线登录
  • 一个公司可以做两个网站吗推广页面
  • 注册一个网站域名一年需要多少钱qq排名优化网站
  • 那些做兼职的小网站seo兼职怎么收费
  • 政府机构网站建设流程常熟网站建设
  • 东莞南城网站建设重庆网站建设软件
  • 如何用html在公司的网站上添加栏目路径免费的网络推广渠道有哪些
  • 深圳网站开发费用网络营销推广外包平台
  • 常州市建设工程质监站网站百度seo关键词工具
  • 宣城市住房和城乡建设局网站合肥关键词优化平台
  • 孝感企业做网站环球网
  • wordpress固定链接中文seo引擎优化方案
  • 个人网站免费空间开网店怎么推广运营
  • 南京网站建设咨询广州百度搜索优化
  • 建设网站建设工程信息泰州网1242低工程词百度浏览器电脑版
  • 浦东网站建设价格宁德市人民政府
  • 设计颜色搭配网站seo搜索引擎优化方法
  • 优化型网站建设铜仁搜狗推广
  • 做网站按页面收费网站排名怎么做上去
  • 网站seo优化有哪些网站排名优化外包
  • 网站建设如何在宣传部备案杭州seo百度关键词排名推广
  • 网站建设茂名近期国内新闻热点事件
  • PHP网站开发工程师b2b
  • vs做网站示例舆情信息网