当前位置: 首页 > news >正文

广州网站制作企业wordpress php7 兼容

广州网站制作企业,wordpress php7 兼容,四川省查询建设证书的网站,如何利用影视网站做cpa为了实现所要求的功能,我们需要进一步完善代码,使其能够处理多种格式的输入文件,并生成符合要求的 JSON 格式的输出文件。具体来说,我们完善了以下内容: 增强 extract_qa_pairs_from_content 函数:使其能够识别和处理不同格式的 QA 对。 确保输出文件的格式正确:每个 Q…

为了实现所要求的功能,我们需要进一步完善代码,使其能够处理多种格式的输入文件,并生成符合要求的 JSON 格式的输出文件。具体来说,我们完善了以下内容:

增强 extract_qa_pairs_from_content 函数:使其能够识别和处理不同格式的 QA 对。
确保输出文件的格式正确:每个 QA 对占一行,且格式为 JSON。
以下是完善后的代码:

import os
import json
import fitz  # PyMuPDF
import docx
import re
import tkinter as tk
from tkinter import filedialog, messagebox, simpledialog
import logging# 设置日志记录
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')def clean_text(text):""" 清理文本,去除多余的空白字符和标点符号,替换影响数据集的特殊字符 """text = re.sub(r'\s+', ' ', text)  # 合并多个空白字符text = re.sub(r'[^\w\s]', '', text)  # 去除标点符号text = re.sub(r'"', "'", text)  # 替换双引号text = re.sub(r'\\', '/', text)  # 替换反斜杠return text.strip()def extract_qa_pairs_from_txt(file_path):with open(file_path, 'r', encoding='utf-8') as f:content = f.read()content = clean_text(content)qa_pairs = extract_qa_pairs_from_content(content)return qa_pairsdef extract_qa_pairs_from_docx(file_path):doc = docx.Document(file_path)content = []for para in doc.paragraphs:content.append(para.text)for table in doc.tables:for row in table.rows:for cell in row.cells:content.append(cell.text)for rel in doc.part.rels.values():if "textBox" in rel.target_ref:text_box = rel.target_partfor element in text_box.element.body:if element.tag.endswith('p'):content.append(element.text)content = '\n'.join(content)content = clean_text(content)qa_pairs = extract_qa_pairs_from_content(content)return qa_pairsdef
http://www.yayakq.cn/news/226975/

相关文章:

  • 东莞想做网站网站关键词推广哪家好
  • 城乡建设门户网站沛县网站建设
  • 企业营销型网站建设方案网页制作创建站点
  • 渭南市网站建设网站建设可上传视频的
  • 内容型网站wordpress常用插件汇总 知更鸟
  • 搭建网站找什么公司有哪些做农产品的网站有哪些
  • 制作网站培训西安市建设工程信息网官网
  • 网站开发 放大图片wordpress 去除右边
  • 网站建设数据库怎么选择钦州建设局网站
  • 知名自助建站平台网站系统名称
  • 颖灵信息科技网站建设品牌网站建设案例
  • 跨境电商建站公司app网站设计制作
  • 汽修网站怎么做wordpress ecommerce
  • 监利县建设局网站东莞营销专业网站建设
  • 旅行社网站营销建设档案馆建设网站
  • 静态html网址网站导航源码wordpress如何解压
  • 购物网站界面设计策划东莞网站自动化推广
  • wordpress可以做门户网站wordpress登陆维护
  • 公司网站建设的市场需求重庆市公共资源交易中心网站
  • 一个网站百度百科怎么做园林设计公司网站
  • 重庆网站制作公司 做服装设计兼职的网站
  • 慕课网网站建设目的用数字做域名的网站
  • 建设银行网站的目的江苏纬信网站建设
  • 东阿做网站多少钱李宁网站建设计划书
  • 海口企业建站系统模板酒店网站开发协议
  • 深圳建设执业注册中心网站南昌企业建设网站设计
  • 门户网站维护怎么做wordpress 打不开 怎么办
  • 常见的静态网站开发技术网站互动
  • 北京响应式网站建设报价wordpress支持空格键
  • 出售东西的网站怎么做女生做网站运营