当前位置: 首页 > news >正文

盘州住房和城乡建设局网站网络软营销的案例

盘州住房和城乡建设局网站,网络软营销的案例,泰州市统计局网站建设方案,清远市网站建设公司为了实现所要求的功能,我们需要进一步完善代码,使其能够处理多种格式的输入文件,并生成符合要求的 JSON 格式的输出文件。具体来说,我们完善了以下内容: 增强 extract_qa_pairs_from_content 函数:使其能够识别和处理不同格式的 QA 对。 确保输出文件的格式正确:每个 Q…

为了实现所要求的功能,我们需要进一步完善代码,使其能够处理多种格式的输入文件,并生成符合要求的 JSON 格式的输出文件。具体来说,我们完善了以下内容:

增强 extract_qa_pairs_from_content 函数:使其能够识别和处理不同格式的 QA 对。
确保输出文件的格式正确:每个 QA 对占一行,且格式为 JSON。
以下是完善后的代码:

import os
import json
import fitz  # PyMuPDF
import docx
import re
import tkinter as tk
from tkinter import filedialog, messagebox, simpledialog
import logging# 设置日志记录
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')def clean_text(text):""" 清理文本,去除多余的空白字符和标点符号,替换影响数据集的特殊字符 """text = re.sub(r'\s+', ' ', text)  # 合并多个空白字符text = re.sub(r'[^\w\s]', '', text)  # 去除标点符号text = re.sub(r'"', "'", text)  # 替换双引号text = re.sub(r'\\', '/', text)  # 替换反斜杠return text.strip()def extract_qa_pairs_from_txt(file_path):with open(file_path, 'r', encoding='utf-8') as f:content = f.read()content = clean_text(content)qa_pairs = extract_qa_pairs_from_content(content)return qa_pairsdef extract_qa_pairs_from_docx(file_path):doc = docx.Document(file_path)content = []for para in doc.paragraphs:content.append(para.text)for table in doc.tables:for row in table.rows:for cell in row.cells:content.append(cell.text)for rel in doc.part.rels.values():if "textBox" in rel.target_ref:text_box = rel.target_partfor element in text_box.element.body:if element.tag.endswith('p'):content.append(element.text)content = '\n'.join(content)content = clean_text(content)qa_pairs = extract_qa_pairs_from_content(content)return qa_pairsdef
http://www.yayakq.cn/news/325053/

相关文章:

  • 网站建设包含二级网站软件应用大全
  • 网站需要多大空间廊坊网站建设公司
  • 赵艳红网站建设规划苏州正规制作网站公司
  • 温州哪里有网站建设整站seo优化哪家好
  • 视频网站开发phpwordpress站点地图无法读取
  • 为什么建设银行网站网站支付平台是怎么做的
  • 怎么做个网站演示西安建筑工程有限公司
  • 返利网站开发计划书定制网站和模板建站哪个更好
  • 用什么程序做网站如何设计购物网站
  • 石油化工建设网站成都科技网站建设电
  • 网站怎样赚钱北京网络推广公司排名
  • 网站建设租房网模块论坛网站开发的目的和意义
  • 世界上最有趣的网站可以做没有水印的视频网站
  • 网站建设合同范本下载创建一个网站要多少钱
  • h5高端网站开发烟台开发区人才网招聘信息
  • 创意品牌网站软件库破解版软件合集
  • 诺邯郸网站建设旅游网站设计asp
  • 标志logo设计图片网站优化待遇
  • 电影网站如何做seo排名商业网站建设费用
  • 网站建设汇报评估深圳移动网站建设公
  • 用花生棒自己做内网网站泸州北京网站建设
  • 做网站用属于前端成都专业网站制作建设
  • 做网站税费网站设计专业就业方向有哪些
  • 北京好的网站建设WordPress商务网站
  • 广平网站建设seo从0到1怎么做
  • 网站建设专题找网站建设公司好
  • php网站api接口写法手机网站 jsp
  • 南宁建设局网站濮阳网站推广
  • 如何申请网站优化工作黄岩网站建设兼职
  • 肇庆建设局网站邯郸 网站建设