当前位置: 首页 > news >正文

盐城营销网站建设电子商务网站的建设步骤有

盐城营销网站建设,电子商务网站的建设步骤有,山东省住房和城乡建设厅举报电话,保定建站价格网络爬虫过程中三种中文乱码的处理方案,希望对大家的学习有所帮助 一、思路 其实解决问题的关键点就是在于一点,就是将乱码的部分进行处理,而处理的方案主要可以从两个方面进行出发。其一是针对整体网页进行提前编码,其二是针对…

网络爬虫过程中三种中文乱码的处理方案,希望对大家的学习有所帮助

一、思路

其实解决问题的关键点就是在于一点,就是将乱码的部分进行处理,而处理的方案主要可以从两个方面进行出发。其一是针对整体网页进行提前编码,其二是针对局部具体中文乱码的部分进行编码处理。

二、分析

1、当出现网页编码为gbk,获取到的内容在控制台打印类似如下情况的时候:

ÃÀÅ® µçÄÔ×À ¼üÅÌ »ú·¿ ¿É°® С½ã½ã4k±ÚÖ½

虽然看上去控制台输出正常,没有报错, 但是输出的中文内容,却不是普通人能看得懂的。

2、当出现网页编码为gbk,获取到的内容在控制台打印类似

�װŮ�� ��Ů ˮ СϪ Ψ��
 这种情况下的话,就可以通过使用本文给出的三种方法进行解决,屡试不爽!

三、具体实现

1)方法一:将requests.get().text改为requests.get().content
我们可以看到通过text()方法获取到的源码,之后进行打印输出的话,确实是会存在乱码的,如下图所示。
在这里插入图片描述
此时可以考虑将请求变为.content,得到的内容就是正常的了。
在这里插入图片描述
2)方法二:手动指定网页编码
#手动设定响应数据的编码格式

response.encoding = response.apparent_encoding

如果觉得上面的方法很难记住,或者你可以尝试直接指定gbk编码也可以进行处理,如下图所示:
在这里插入图片描述 这个方法稍微复杂一些,但是比较好理解,对于初学者来说,还是比较好接受的。
如果觉得上面的方法很难记住,或者你可以尝试直接指定gbk编码也可以进行处理,如下图所示:
在这里插入图片描述
上面介绍的两种方法都是针对网页进行整体编码,效果显著,接下来的第三种方法就是针对中文局部乱码部分使用通用编码方法进行处理。

3)方法三:使用通用的编码方法

img_name.encode('iso-8859-1').decode('gbk')

在这里插入图片描述

http://www.yayakq.cn/news/594391/

相关文章:

  • 做旅行网站黄骅港金沙滩门票价格
  • 个人做企业网站制作要多少钱个人信息管理系统
  • 自己制作网站需要什么广州做网站信息
  • 手机网站 文件上传北京海淀建设工程律师服务
  • 西部数码的vps云主机如何访问网站爱用建站下载
  • 杭州广众建设工程有限公司网站广告优化
  • dw做网站乱码深圳专业建站公司有哪些
  • wordpress当前页面id深圳做网站优化
  • 昆明网站开发公司电话简历模板 个人简历
  • wordpress首页添加站点统计显示网店装修步骤
  • 网站建设 服务内容 费用百度 门户网站
  • php搭建网站后台wordpress侧边栏加图片
  • 口腔网站设计图手表排行榜
  • 公司年前做网站好处一键生成小程序免费制作平台
  • 毕设做购物网站只做水果的网站
  • 网站开发准备流程图WordPress的网外无法访问
  • 关注济南网站建设如何利用某个软件做一个网站
  • 旅游小镇网站建设方案网站原创页面
  • 许昌住房城乡建设局网站有关大数据的网站及网址
  • 小说网站开发技术实现怀化网络推广哪家服务好
  • 网站下载的app删除了怎么找到织梦cms网站迁移
  • 如何做好网站seo优化电子商务网站建设与维护ppt
  • 雄安智能网站建设方案锦州制作网站公司
  • 绵阳做网站的wordpress demo数据
  • 公司网站phpwordpress签到用户中心插件
  • 网站 手机兼容html代码大全及详解
  • 北京网站建设亿玛酷出名5cms系统使用教程
  • 基础微网站开发价位苏州建设网站电话
  • 江门建站模板哈尔滨百度关键词优化
  • 网站建设及优化 赣icpwordpress 自己的html