当前位置: 首页 > news >正文

设计网站公司免费网站风格

设计网站公司,免费网站风格,做网站推广常识题库及答案,配置网站开发环境在使用爬虫获取维基百科数据时看到了一个很好的项目: 博客:https://blog.51cto.com/u_15919249/5962100 项目地址:https://github.com/wjn1996/scrapy_for_zh_wiki 但在使用过程中遇到若干问题,记录一下: The more_it…

在使用爬虫获取维基百科数据时看到了一个很好的项目:
博客:https://blog.51cto.com/u_15919249/5962100
项目地址:https://github.com/wjn1996/scrapy_for_zh_wiki

但在使用过程中遇到若干问题,记录一下:
The 'more_itertools' package is required; normally this is bundled with this package so if you get this warning, consult the packager of your distribution.:

1.解决方案:

或许并不是环境本身的问题。
1. pip show more_itertools没有则安装,有则下一步
2. 把queue.py 文件及该文件中的Queue类均重命名分别为myqueue.py 与 MyQueue。
3. 将重命名后的myqueue.py放到spiders文件夹下,
4. 将spider下单wiki.py 中的from queue import  Queue修改为from .myqueue import MyQueue
原因可能是Python中自带queue库,而博主这里是想调用自己的queue。

2.后面同样要把filter_words.py文件拿到spider下,并修改wiki中的from filter_words import filter_url 为from .filter_words import filter_url

3.在wiki.py繁简转换中加判断,避免输入为空

def Traditional2Simplified(sentence):'''将sentence中的繁体字转为简体字:param sentence: 待转换的句子:return: 将句子中繁体字转换为简体字之后的句子'''# sentence = Converter('zh-hans').convert(sentence)# return sentenceif sentence:sentence = Converter('zh-hans').convert(sentence)return sentenceelse:return sentence

4. 在wiki.py中修改

'''
content_entity = search.xpath("//h1[@id='firstHeading']/text()").extract_first()
为
content_entity = search.xpath("//h1[@id='firstHeading']/span/text()").extract_first()
'''



 

http://www.yayakq.cn/news/423389/

相关文章:

  • h5免费模板网站呼和浩特最好的互联网公司
  • 网站建设主要包括前台和后台网站开发软件下载
  • 外国有没有中国代做数学作业的网站wordpress多重筛选页面
  • php网站制作商品结算怎么做百度网站建设制作公司
  • 动态表白网站制作做印刷去哪个网站找工作
  • 61制作工厂网站长沙官网优化推广
  • 科技网站备案防伪查询网站
  • 小程序开发教程画画关键词快速排名seo怎么优化
  • 网站一级域名申请工作作风方面对照检查材料
  • 快速建站公司有哪些网页设计培训班哪里好
  • 深圳建设局网站注册结构师培训附件做图表的网站推荐
  • iis 网站 优化网站建设电商考试
  • 专做特卖的网站昆明网站建设yn119
  • 网站仿静态和静态的区别网站建设投标ppt模板下载
  • 自己电脑建设网站免费域名申请哪个最好
  • 网站设计这个专业怎么样wordpress.3.5
  • 南阳做网站公司免费字体设计
  • 登录全球最大的域名注册商网站网站发帖做业务
  • 无锡网站网站建设公司注册网站入口
  • 靖安建设局网站注册一个个人网站
  • 辽宁省建设厅科技中心网站上海网站制作科技公司
  • 行业网站设计师招聘网站建设业务流程
  • 自定义表单网站发布网站域名设置
  • 如何选择网站开发语言营业执照网上查询官网
  • led设计网站建设海淀网站建设价格
  • phpcms校园网站python线上培训班学费一般多少
  • 做网店有哪些网站宿迁房产网官方网站
  • 个人网站建设计划表建设网站怎么备案
  • 课程网站建设方案产品推广方式都有哪些
  • 返利网站怎么做网站准确的定位