当前位置: 首页 > news >正文

可以做微信游戏的网站有哪些b站推广在哪里

可以做微信游戏的网站有哪些,b站推广在哪里,学校网站设计图片,做网站建设销售工资前言 本篇pdf适用windows对视觉识别0基础的的纯小白用户。大佬请绕道~~ 注意: 本项目pdf的ocr对于表格、画图文字,水印等干扰没做任何处理,因此希望各位使用该功能的pdf尽量不要含有这些干扰项,以免影响翻译效果。 流程 1.构建…

在这里插入图片描述

前言

本篇pdf适用windows对视觉识别0基础的的纯小白用户。大佬请绕道~~
注意:
本项目pdf的ocr对于表格、画图文字,水印等干扰没做任何处理,因此希望各位使用该功能的pdf尽量不要含有这些干扰项,以免影响翻译效果。

流程

1.构建环境

用conda创建一个虚拟python环境

conda crate -n pp python==3.11

2.安装包

安装飞浆paddle 和paddleocr
gpu版本

pip install paddlepaddle-gpu paddleocr

cpu版本

pip install paddlepaddle paddleocr

pdf转图片工具

https://github.com/oschwartz10612/poppler-windows/releases

pip install pdf2image

3.具体代码

假设在我们有一堆pdf文件在pdfs文件夹中,我们需要将其每个pdf文件转成对应的txt文件。则可使用如下代码


from pdf2image import convert_from_path
import cv2
import numpy as np
from PIL import Image
import os
# 将 PDF 文件转换为图片列表
files = os.listdir('pdf')for file in files:if not file.endswith('.pdf'):print(file)continuetxt = file.replace('.pdf', '.txt')if os.path.exists('txt/'+txt):continuetxt_writer = open('txt/'+txt, 'w',encoding='utf-8')images = convert_from_path('pdf/'+file)# print(type(images))# print(images[0])# image = cv2.cvtColor(np.array(images[0]), cv2.COLOR_RGB2BGR)from paddleocr import PaddleOCR, draw_ocr# 创建 PaddleOCR 实例ocr = PaddleOCR(use_angle_cls=True, lang='ch',use_gpu=True)  # 默认使用英文模型,可以通过 lang 参数切换到中文模型# 遍历每一张图片并识别文字for i, image in enumerate(images):print('第{}张图片'.format(i+1))# 转换图片为可用于识别的格式# source = image.convert('RGB')image = cv2.cvtColor(np.array(image), cv2.COLOR_RGB2BGR)        # image.save(f'page_{i}.jpg')# 识别图片中的文字result = ocr.ocr(image, cls=True)# 打印识别结果try:for lines in result:for line in lines:# print(line[1][0])txt_writer.write(line[1][0]+'\n')except:print(file+'识别失败')txt_writer.close()

4.注意

由于本代码仅能简单提取pdf的文字,所以一旦出图片或者表格之类会导致该页识别效果变差,敬请谅解~

http://www.yidumall.com/news/65454.html

相关文章:

  • 保定网站建设事件营销
  • 柳市做网站的公司windows优化大师手机版
  • 做网站的收入百度知道网页版进入
  • 广告设计公司有什么岗位seo是什么部位
  • 外贸自己做网站阿里指数
  • 咸阳网站建设今日实时热点新闻事件
  • 虚拟主机建wordpress搜索引擎优化目标
  • 做网站网页设计网站大全
  • 南京今天的最新消息汕头网站建设方案优化
  • 强的网站建设公司百度平台投诉人工电话
  • iis配置网站优化大师在哪里
  • 泉州制作网页公司seo快排技术教程
  • 宝山区网站建设企业品牌推广
  • 上海网站设计联系方式网络推广的好处
  • 东方av网站的电影下载应该怎么做网站排名优化制作
  • mip网站建设石家庄关键词快速排名
  • vi视觉识别设计公司seo实战技术培训
  • 网站功能描述与分析app定制开发
  • 用java做电商网站优化seo是什么意思
  • 网网站开发做百度推广的网络公司广州
  • 滨州北京网站建设价格低石家庄最新疫情
  • dede怎么做双语网站国内广告联盟平台
  • 17网站一起做网批济南网站建设老威
  • 做网站要开发嘛企业seo外包公司
  • 网站开发质量屋广州网站优化费用
  • 怎么做外贸个人网站单词优化和整站优化
  • 石家庄网站建设联系电话百度问一问人工客服怎么联系
  • 网站备案 需要什么安卓优化大师老版本下载
  • 泉州建设网站制作网站统计数据分析
  • 有做医学手术视频的网站推广关键词优化