当前位置: 首页 > news >正文

做网站策划的工具南昌网站建设培训学校

做网站策划的工具,南昌网站建设培训学校,公司网站必须做可信认证吗,在线房产网一文带你实现excel表格的数据提取 今天记录一下如何使用python提取Excel中符合特定条件的数据 在数据处理和分析的过程中,我们经常需要从Excel表格中提取特定条件下的数据。Python的pandas库为我们提供了方便的方法来进行数据查询和过滤。 Pandas 是 Python 语言…

一文带你实现excel表格的数据提取

今天记录一下如何使用python提取Excel中符合特定条件的数据

数据处理和分析的过程中,我们经常需要从Excel表格中提取特定条件下的数据。Python的pandas库为我们提供了方便的方法来进行数据查询和过滤

Pandas 是 Python 语言的一个扩展程序库,用于数据分析。

  • Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构数据分析工具。
  • Pandas 名字衍生自术语 “panel data”(面板数据)和 “Python data analysis”(Python 数据分析)。
  • Pandas 一个强大的分析结构化数据的工具集,基础是 Numpy(提供高性能的矩阵运算)。
  • Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。
  • Pandas 可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征。
  • Pandas 广泛应用在学术、金融、统计学等各个数据分析领域。

Pandas应用

Pandas 的主要数据结构是 **Series (一维数据)**与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。

01.简单数据类型的提取

序号ab
11.52.8
23.24.7
32.13.6
44.31.9
54.13.2

要求:提取a,b两列中介于2.5到5之间的数据

使用query方法提取数据

首先,我们将使用query方法来提取符合条件的数据。query方法允许我们使用类似SQL的语法进行数据查询。

代码如下:
import pandas as pd# 读取Excel表格
df = pd.read_excel('data.xlsx')  # 将'data.xlsx'替换为你的文件路径# 使用query方法进行查询
query_string = '2.5 < x < 5 and 2.5 < y < 5'
filtered_data = df.query(query_string)# 打印提取的数据
print(filtered_data)

02.复杂数据类型的数据提取

如下是一个包含70+sheet表单excel工作簿,现在要求从该excel中抽取特定的数据列到新表
在这里插入图片描述

话不多说,直接上代码
import pandas as pd
import openpyxlwb = openpyxl.Workbook()# 获取默认工作表
ws = wb.active# 读取原始Excel文件
# df = pd.read_excel('SA.xlsx')
df = pd.read_excel('SA.xlsx', sheet_name=['RCD', 'RPC','RCM','MCV_S','MCV_C','CFV','GCM','SGCS','SGCC','GCSB','GCC_S','GCC','MOV_SO','MOV_SC','MOV_N','MNV_C','BSV_C','MSV_CSC','MSV_CLC','MSV_CLO','CAH_N','BAH_N','BAH_L','BAH_OT','MOS_T','MOS_C','MOS_N','MOS_L','NOPDS','ALA_P','AVIE','SLT8','SLT4','BOOLS','REALS','EPS','SA','KG','TRAN','SETP','PID','NSD','DV','AMI','DCO','ACO','DCI','ACI6','ACI4','ACI','DM','AM4','AM','SOE','PVI','DVO','AVO','DVI','AVI8','AVI6','AVI4','AVI'])# 创建一个新的Excel文件
wb = pd.ExcelWriter('new.xlsx')# 遍历每个sheet
for sheet_name, sheet_data in df.items():# 提取需要的列数据columns_to_extract = [ 'PN','SN']if all(column in sheet_data.columns for column in columns_to_extract):extracted_data = sheet_data[columns_to_extract]# 将提取的数据写入新的Excel文件中的对应sheetextracted_data.to_excel(wb, sheet_name=sheet_name, index=False)extracted_data.to_excel('new.xlsx', index=False)df_extracted = pd.read_excel('new.xlsx', sheet_name=None,engine='openpyxl')# 创建一个新的Excel写入器
writer = pd.ExcelWriter('merged_1023.xlsx')# 遍历抽取的Excel的每个sheet
for sheet_name, df_sheet in df_extracted.items():# 将每个sheet写入新的Excel中df_sheet.to_excel(writer, sheet_name, index=False)# 保存并关闭新的Excel
writer.close()
wb.close()

详细的注释已经写在上面,可以根据自己的需求和条件选择相应的文件进行数据提取

合并结果如下:

在这里插入图片描述

http://www.yayakq.cn/news/245006/

相关文章:

  • 90后小姑娘做网站做神马网站优
  • app 微商城网站建设吴中区建设局招标网站
  • 做ppt图片用的网站有哪些成都市成华区建设路商务中心网站
  • 网站建设的宽带指标要求河南做网站 河南网站建设
  • 青岛建设网站公司微信小程序免费制作平台
  • 临清网站制作公司容城轻松seo优化排名
  • 网站开发系统简介seo工具网站
  • 保亭交通工程建设局网站建设项目环境影响评价公示网站
  • 卡盟自助网站建设上海免费网站建设服务
  • 汉口专业网站推广公司电影院可以寄存东西吗
  • 刷赞网站推广永久网络营销理论与实务
  • 建站快车用户登录WordPress搭建交互式网站
  • 手机网站建设的优势企业seo网站优化设计
  • php网站投票源码wordpress最新漏洞
  • 医院网站制作公司企业网站 免费
  • 经典网站设计作品装饰公司网站如何布局
  • 网站怎么做IPv6网站建设规章制度
  • 单页销售网站模板wordpress主题haowa导航下载
  • 兴义建设局网站wordpress 段落 两格
  • seo服务器选择jsp网站如何做seo
  • 怎么把网站做成app阿里巴巴网站图片怎么做
  • 凡科免费个人做网站有弊吗国际贸易
  • 云浮哪有公司做网站的宿迁房产网签合同查询
  • 企业1级域名网站怎么做wordpress付费阅读文章功能
  • 程序员接外包网站索引网站有哪些
  • 哈尔滨网络优化公司有哪些佛山网站优化搜索
  • 闵行网站制作哪里有手机如何编辑网页内容
  • 写作网站都有哪些工程信息网排名
  • 潍坊网站制作江门公司如何查域名备案信息查询
  • 中国人做外贸网站都卖什么手续标准化信息网站建设与应用