当前位置: 首页 > news >正文

现在最长用的做网站软件是什么百度关键词搜索量排行

现在最长用的做网站软件是什么,百度关键词搜索量排行,专门做家具的网站,专业网站的建设设行吗文章目录 前言发现问题解决方案问题分析大致逻辑 show my code 前言 在使用pdfplumber读取PDF的过程中,由于加黑的内容会被莫名其妙的读取两次,带来了很大的困扰。这篇文章将给出解决方案。 发现问题 在在使用pdfplumber读取PDF的过程中,读…

文章目录

  • 前言
  • 发现问题
  • 解决方案
    • 问题分析
    • 大致逻辑
  • show my code

前言

在使用pdfplumber读取PDF的过程中,由于加黑的内容会被莫名其妙的读取两次,带来了很大的困扰。这篇文章将给出解决方案。

发现问题

在在使用pdfplumber读取PDF的过程中,读取普通内容是完全没有问题的。但是该公司早期PDF并未完全规范的过程中,有些标题加粗了,而有些却没有。加粗的标题将会被读取两次,比如好好的123456,加粗后将会被读取为112233445566。这可不太好。

解决方案

问题分析

首先我们需要明白,加粗的内容只会被连续读取,而不会被随机读取,这一点使得字符串具备了一定的规律。所以循环或者递归都是可行的,只是我们需要记住递归的最大深度为1000

其次我们需要明确,不是所有的连续内容都应该被删除。比如111被读成了111111,那可不能删的只剩下1,这就又和PDF上想要传达的内容不一致了。所以正则表达式也是不能乱用的。

大致逻辑

既然有这些要求,我们就好办了。

我们考虑极端场景:111111。我们就直接先数一数连续重复有几个,然后保留一半就好了。

然后再考虑一般场景:111111222222333333。在处理过程中,实际上也就是相当于把字符串拆成了3份,每份利用极端场景111111的做法去做。

show my code

知道该怎么办了就直接干吧。

虽然我们现在是针对加粗被重复读取的问题,字符串中的每一种字符一定是双数出现,所以简单一点的话就可以这么做:

def drop_duplicates(arr):result, i = [], 0while i < len(arr):count = 1# 计算连续相同元素的数量while i + count < len(arr) and arr[i] == arr[i + count]:count += 1# 保留一半result.extend([arr[i]] * count // 2)i += count  # 处理下一段return ''.join(result)

当然,考虑到并不一定具备跟现在一样完全理想的场景,所以这里也考虑了万一真的有一个数字落单的情况:

def drop_duplicates(arr):result, i = [], 0while i < len(arr):count = 1# 计算连续相同元素的数量while i + count < len(arr) and arr[i] == arr[i + count]:count += 1# 只有一个落单的话,1 // 2 = 0,这就不对了,所以上个保险,最低只能为1result.extend([arr[i]] * max(1, count // 2))i += count  # 处理下一段return ''.join(result)

解决。

http://www.yidumall.com/news/101172.html

相关文章:

  • 请人代做谷歌外贸网站网站开发的一般流程
  • 推荐大良营销网站建设磁力猫torrent kitty
  • 怎么做b2b网站免费发外链平台
  • 做自己的网站挣钱网络推广哪家做得比较好
  • 部队网站建设外贸营销型网站建设公司
  • 网站域名备案变更百度seo多久能优化关键词
  • 大连模板网站制作价格seo推广软件排名
  • 网站投稿系统怎么做全球最受欢迎的网站排名
  • 太原网站优化网页开发用什么软件
  • 福田做商城网站建设哪家公司便宜点百度sem
  • 电子商务公司建设网站方案设计北京营销型网站
  • 制作会员手机网站百度网盘搜索
  • 单一产品销售网站建设模板网站设计论文
  • 建设软件网站建网站建设
  • 网站开发项目策划书谷歌浏览器网页版入口
  • wordpress照片模糊无线网络优化是做什么的
  • wordpress建站教程阿里云百度最新收录方法
  • 视频网站怎么做压力测试seo优化服务商
  • 阿里做外贸是哪个网站专业营销团队外包公司
  • 免费b2b网站要怎么做百度网站提交入口网址
  • 成都网站建设优化推网络营销策划方案模板范文
  • 阿里云网站怎么备案域名怎么建网站详细步骤
  • 用c 做的网站怎么打开百度认证官网申请
  • 珠海网站建设q.479185700強软件外包平台
  • 网站开发做什么简单阿里指数数据分析平台
  • 建站之星做的网站如何导出微信客户管理系统
  • 化妆品网站建设思路室内设计师培训班学费多少
  • 常平镇仿做网站品牌推广与传播
  • 信息门户网站是什么市场营销师报名官网
  • 网站如何为关键词做外链seo自媒体运营技巧