当前位置: 首页 > news >正文

洛阳网站建设联系方式有哪些网站可以免费推广

洛阳网站建设联系方式,有哪些网站可以免费推广,西安市免费做网站,网站整站下载器 下载后台为了实现所要求的功能,我们需要进一步完善代码,使其能够处理多种格式的输入文件,并生成符合要求的 JSON 格式的输出文件。具体来说,我们完善了以下内容: 增强 extract_qa_pairs_from_content 函数:使其能够识别和处理不同格式的 QA 对。 确保输出文件的格式正确:每个 Q…

为了实现所要求的功能,我们需要进一步完善代码,使其能够处理多种格式的输入文件,并生成符合要求的 JSON 格式的输出文件。具体来说,我们完善了以下内容:

增强 extract_qa_pairs_from_content 函数:使其能够识别和处理不同格式的 QA 对。
确保输出文件的格式正确:每个 QA 对占一行,且格式为 JSON。
以下是完善后的代码:

import os
import json
import fitz  # PyMuPDF
import docx
import re
import tkinter as tk
from tkinter import filedialog, messagebox, simpledialog
import logging# 设置日志记录
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')def clean_text(text):""" 清理文本,去除多余的空白字符和标点符号,替换影响数据集的特殊字符 """text = re.sub(r'\s+', ' ', text)  # 合并多个空白字符text = re.sub(r'[^\w\s]', '', text)  # 去除标点符号text = re.sub(r'"', "'", text)  # 替换双引号text = re.sub(r'\\', '/', text)  # 替换反斜杠return text.strip()def extract_qa_pairs_from_txt(file_path):with open(file_path, 'r', encoding='utf-8') as f:content = f.read()content = clean_text(content)qa_pairs = extract_qa_pairs_from_content(content)return qa_pairsdef extract_qa_pairs_from_docx(file_path):doc = docx.Document(file_path)content = []for para in doc.paragraphs:content.append(para.text)for table in doc.tables:for row in table.rows:for cell in row.cells:content.append(cell.text)for rel in doc.part.rels.values():if "textBox" in rel.target_ref:text_box = rel.target_partfor element in text_box.element.body:if element.tag.endswith('p'):content.append(element.text)content = '\n'.join(content)content = clean_text(content)qa_pairs = extract_qa_pairs_from_content(content)return qa_pairsdef
http://www.yidumall.com/news/4359.html

相关文章:

  • wordpress minty菜单淄博seo网站推广
  • wordpress08影院源码网站关键词优化
  • 做一个企业网站需要哪些技术东莞seo排名公司
  • 互联网金融p2p网站建设模板本周国内重大新闻十条
  • WordPress的黑色网站优化公司开始上班了
  • 一起做陶瓷的网站电商运营一天都干啥
  • 东莞 网站建设网络媒体推广方案
  • 怎么免费做一个网站做淘宝客湖南seo推广系统
  • 哪些网做网站比较好济南网站建设制作
  • 自主网站建设贵阳网站建设推广
  • 重庆网站建设 制作 设计 优惠价1688的网站特色
  • wordpress webim谷歌seo优化公司
  • 软件工程的定义如何做好关键词的优化
  • 成都网站建设 外包百度小说排行榜第一名
  • 青州哪里做网站做得好广州网站制作实力乐云seo
  • 淄博网站制作设计定制外贸新手怎样用谷歌找客户
  • 合肥比较靠谱的装修公司seo如何优化关键词排名
  • 做网站博彩代理违法吗灵感关键词生成器
  • 中国建设会计学会网站软文广告是什么意思
  • 兼职网站建设招聘信息域名服务器ip查询网站
  • 做一个小型网站多少钱网页是怎么制作的
  • wordpress 站点错误微指数官网
  • 南通网站建设祥云青岛网站快速排名优化
  • 温州网站建设有限公司真正免费的网站建站平台推荐
  • 微信网站制作教程深圳网络推广服务公司
  • 徐州最好网站建设东莞百度seo关键词优化
  • 网站制作 意向单seo查询软件
  • 网站积分方案宣传推广策略
  • 怎么做新浪网站seo综合查询国产
  • 做照片模板下载网站百度发布