当前位置: 首页 > news >正文

石家庄专门做网站的公司网站优化外包价格

石家庄专门做网站的公司,网站优化外包价格,wordpress英文主题变中文版,整合营销传播成功案例想将一份 pdf 论文中的所有参考文献都提取出来,去掉不必要的换行,放入一个 text 文件,方便复制。其引用是 ieee 格式的,形如: 想要只在引用序号(如 [3])前换行,其它换行都去掉&…

想将一份 pdf 论文中的所有参考文献都提取出来,去掉不必要的换行,放入一个 text 文件,方便复制。其引用是 ieee 格式的,形如:
ieee-ref
想要只在引用序号(如 [3])前换行,其它换行都去掉,即一行一条参考文献。

可用 pypdf[1],其主页有示例,加上 re 去除非序号前的换行(检测 [)。

Code

from pypdf import PdfReader
import re# 检测非 `[` 前的换行
pattern = r'\n(?!\[)'reader = PdfReader("paper.pdf")
n_pages = len(reader.pages)
print(n_pages)with open("ref.txt", "w", encoding="utf-8") as f:for i in range(23, 29): # 自己确定 reference 页码范围page = reader.pages[i]text = page.extract_text()text = re.sub(r'-\n', '', text) # hyphen 后换行:连 hyphen 一齐删text = re.sub(pattern, ' ', text) # 多余换行换成空格f.write(text)# + '\n')

References

  1. py-pdf/pypdf
http://www.yidumall.com/news/48176.html

相关文章:

  • 建设部执业资格注册中心网站查询提供搜索引擎优化公司
  • 付费网站做推广哪个好青岛新闻最新消息
  • 天津网站建设外包个人网站制作源代码
  • 为女朋友做网站网站友情链接是什么
  • 建网站多少钱可以卖货的营销策略有哪几种
  • 网站开发维护求职信网店营销策略有哪些
  • 可用的ftp网站搜索引擎优化是什么
  • 网站建设公司不赚钱郑州seo优化顾问热狗
  • 做旅游网站的写手手机网站自助建站系统
  • 如何自己做网站推广如何进行电子商务网站推广
  • php网站做代理服务器营销推广方案设计
  • 做网站用哪个预装系统优化关键词技巧
  • python 网站开发神器推广公司简介
  • 天津知名网站建设公司seo技术培训沈阳
  • 企业网站建设可以分为几个层次企业网站建设报价表
  • b2c商城网站建设公司开封网站seo
  • 建影楼网站多少钱企业官网seo
  • 网站开发 面试 适当吹牛深圳市网络seo推广平台
  • 潍坊网站建设推广公司合肥网站优化平台
  • 江津网站建设怎么样网站免费推广网站
  • 杭州制作企业公司网站免费推广途径与原因
  • 做汽车网站开题报告的意义网站流量分析
  • als冰桶挑战赛的网络营销方式山东网络优化公司排名
  • 模板做图 网站有哪些内容文案写作软件app
  • 厦门国外网站建设公司哪家好百度购物平台客服电话
  • 网站开发的发展百度智能建站平台
  • 学校网站建设企业百度一下电脑版首页
  • 邹平建设项目网站公示外包网络推广公司
  • 可以更改上传到网站的文件内容吗大数据营销案例分析
  • 高端营销型网站建设怎样做企业推广