当前位置: 首页 > news >正文

鄂州网站建设网络公司开元酒店集团品牌建设

鄂州网站建设网络公司,开元酒店集团品牌建设,wordpress按照证书,运营培训班学费大概多少前言 我们在使用python的过程中,经常需要它完成一些数据处理的工作,其中尤以json/csv文件为常见。今天,博主针对UnicodeDecodeError异常进行试验,因为这个是新手最容易犯错的地方。 Q:如何应对 UnicodeDecodeError 读…

前言

我们在使用python的过程中,经常需要它完成一些数据处理的工作,其中尤以json/csv文件为常见。今天,博主针对UnicodeDecodeError异常进行试验,因为这个是新手最容易犯错的地方。

在这里插入图片描述

Q:如何应对 UnicodeDecodeError

读取 .csv 或 .json 文件时,我们可能会遇到诸如: 'gbk' codec can't decode byte xx: illegal multibyte sequence 或 incomplete multibyte sequence。通过直觉判断是字符编码的问题,那么又该如何解决?

一、csv文件

1. 现场还原

我们读csv文件时,有两种方式:

1.1 使用pathlib
from pathlib import Pathpath = Path("123.csv")
# 读取所有行
rows = path.read_text().splitlines()
print(rows)
1.2 使用csv库
import csvf = open("123.csv")
reader = csv.reader(f, delimiter=",")
# 第一种方法:遍历reader
rows = [row for row in reader]
print(rows)# 第二种方法:遍历reader
rows = enumerate(reader)
for index, row in rows:# 按索引返回每行,默认是list,需通过row[0]完成数据获取,tt为每列分隔符print(index, row[0].split("tt"))

上述两种方式均支持对csv文件进行数据解析。但是问题在于未指定字符编码,所以两种方式均会提示该异常,如下图所示:

在这里插入图片描述

2. 正确方式
2.1 使用pathlib
from pathlib import Pathpath = Path("123.csv")
# 读取所有行,并且指定字符编码
rows = path.read_text(encoding="utf-8").splitlines()
print(rows)

需要注意的是,我们在使用pathlib时,在Path()中也可以指定encoding="utf-8",但是很遗憾会获得一个warning并且并不会产生期望的结果:
DeprecationWarning: support for supplying keyword arguments to pathlib.PurePath is deprecated and scheduled for removal in Python 3.14

形如:

# 定义字符编码无效,直接放弃path = Path("123.csv", encoding="utf-8")
2.2 使用csv标准库
import csvf = open("123.csv", encoding="utf-8")
reader = csv.reader(f, delimiter=",")
# # 第一种方法:遍历reader
rows = [row for row in reader]
print(rows)# 第二种方法:遍历reader
rows = enumerate(reader)
for index, row in rows:# 按索引返回每行,默认是list,需通过row[0]完成数据获取,tt为分隔符print(index, row[0].split("tt"))

通过指定encoding实现处理时的字符编码与文件保持一致,可以避免不必要的犯错。总之一句话,“养成好习惯,学习美又欢”

二、json文件

我们在读取json文件时,也会遇到该问题,这里博主直接贴正确的写法:

import json# 同csv一样,指定encoding
f = open("data.json", encoding="utf-8")
# 将json字符串转为json对象
data_obj = json.loads(f.read())
# 根据key, 返回value
print(f"credit_code is: {data_obj["credit_code"]}")# 将json对象转为字符串
data_str = json.dumps(data_obj, indent=4)
print(f"type is: {type(data_str)}")

运行结果如下:
在这里插入图片描述

结语

针对UnicodeDecodeError,博主提供了错误和正确的示例,相信能够从中获取一些帮助。
在这里插入图片描述

http://www.yayakq.cn/news/58460/

相关文章:

  • 发行商城小程序沈阳seo排名优化软件
  • 菜单网站图片素材python做直播网站
  • 手机网站免费建设中国营销咨询公司排名
  • 产品网站用什么软件做软件开发平台设计
  • 马云是做网站的百度联盟怎么加入赚钱
  • 如何做网站的的关键词仿站网站源码
  • 电子商务网站建设详细策划书十堰今天刚刚发生新闻
  • 网站建设未验收会计账务处理微问数据平台入口
  • 网站备案登记表品牌全网推广
  • 改版一个网站多少钱wordpress安装插件无法创建目录
  • dw做的网站链接花生壳如何做网站
  • 学做网站要学什么新科网站建设
  • 网站的首页需要什么内容网站后台栏目管理
  • 封面型网页网站有哪些如何通过做网站赚钱
  • 广西网站建设设计广州网站设计营销公司
  • 网站建设维护员网站建设运营合作合同
  • 学做网站怎么样如何在网络上做广告
  • 免费开源的个人网站系统店铺推广引流
  • 网站建设找邓金平做三方网站多少钱
  • 大连金州代做网站公众号如何让wordpress百度霸屏
  • 深圳做兼职的网站设计济宁市兖州区建设局网站
  • 定海区住房和城乡建设局网站国之珍微站个人网站
  • 谁有人和兽做的网站?怎么做souq网站
  • 代码素材网站建设厅网站企业诚信分值
  • 网络技术培训班多少钱网站优化外包
  • 国外有哪些做服装的网站有哪些wordpress报名表单
  • 天津做网站找津坤科技专业网页设计模板图片高清
  • 网站建设198wordpress减肥网站采集规则
  • 在哪个网站做问卷好做运营需要知道素材网站
  • 国内做网站建设好的公司网站怎么更新维护