当前位置: 首页 > news >正文

平安河南建设网站网页版游戏大全在线玩

平安河南建设网站,网页版游戏大全在线玩,ps软件手机版,有那些app开发公司通过输入搜索的关键字,和搜索页数范围,爬出指定文本内内容并存入到txt文档。代码逐行讲解。 使用re、res、BeautifulSoup包读取,代码已测,可以运行。txt文档内容不乱码。 import re import requests from bs4 import BeautifulS…

通过输入搜索的关键字,和搜索页数范围,爬出指定文本内内容并存入到txt文档。代码逐行讲解。

使用re、res、BeautifulSoup包读取,代码已测,可以运行。txt文档内容不乱码。

import re
import requests
from bs4 import BeautifulSouptitles = []                                                             #存放文档标题
urls = []                                                               #存放每个文档链接keyword = input("请输入想要查找的关键字:")                              
pagenum = input("请输入想要查找的页数:")                                        
txt_name = keyword + ":前" + pagenum + "页内容.txt"                        with open(txt_name,'w',encoding='utf-8') as f:                             # 创建txt文件f.write(txt_name + '\r')                                               # 将文件名写入f.close()# 每页内容单独爬取
for i in range(1, int(pagenum)+1):                               html = "http://www.ofweek.com/newquery.action?keywords="+keyword+"&type=1&pagenum=" + str(i)         # 根据关键词和页数生成链接resp = requests.get(html)                             # get获取数据,访问拼接后的url                                    resp.encoding = 'gb18030'                             # 读取中文时不会出现乱码content = resp.text                  # 拿到网站的数据,捕获到的网页内容给content变量# html文件解析,解析响应的文件内容,html.text 是 HTML 文档的源代码,# 'html.parser' 是解析器,用于指定如何解析 HTML 文档bs = BeautifulSoup(content,'html.parser')#每个标题都存在类名为no-pic的li标签里面for news in bs.select('div.zx-tl'): url = news.select('a')[0]['href']                     # 提取文章链接urls.append(url) title = news.select('a')[0].text                      # 提取文章标题titles.append(title)for i in range(len(urls)):                                    # 遍历每篇文章的链接resp = requests.get(urls[i])resp.encoding='gb18030'content = resp.textbs = BeautifulSoup(content,'html.parser')#文章的内容是存在类名为artical-content的div块里面page_content = bs.select('div.artical-content')[0].textwith open(txt_name,'a',encoding='utf-8') as f:            # 写入txt文件f.write("\n"+titles[i]+page_content)f.close()print("文件保存成功!")

http://www.yayakq.cn/news/924246/

相关文章:

  • 制作一个购物网站需要多少钱a站在线观看人数在哪
  • 请人建网站应注意什么wordpress 模板开发
  • 济南富腾网站建设中国工厂网网址
  • 营销网站如何建设如何为自己的店铺做网站
  • 免费建站网站一级大录像不卡在线看作品怎么推广
  • 如何做网站子页做水处理药剂的公司网站
  • 网站中的公司地址怎么做怎么让织梦网站适合手机
  • 网站建设设计作品怎么写电商网站建设方案模板
  • 美食网网站建设目的百度免费发布信息平台
  • 桂林网站建设服务电话太原网站优化技术
  • 公司网站可以用个人备案吗企业网站导航设计
  • 网站怎样做优化调整培训班学员培训心得
  • 百度网站安全检测平台公司网站seo怎么做
  • 淘宝网站建设可行性分析报告wordpress 评论排序
  • 郑州网站建设熊掌号wordpress没有加载图片
  • 网站运营可以转行做网站设计吗wordpress视频
  • 北京建设企业网站中信建设有限责任公司杨峰
  • 石家庄建设局seo的基本步骤包括哪些
  • vps可以用了做网站吗新注册网站
  • 东莞建站模板公司筹划建设协会网站的方案
  • 怎样运营推广网站厦门电子商务网站建设
  • 电子商务网站建设 教学大纲国外刺绣图案设计网站
  • 楚雄自助建站系统安卓编程入门自学
  • 个人服务器网站备案wordpress grace7 破解
  • 平度建设网站简约大方自助建站模板
  • 一个域名怎么做两个网站兰州免费网站建设
  • 网站开发算互联网公司吗做网站如何选择数据源
  • 个人网站怎么做平面设计作品欣赏官网
  • 展示互动企业网站搜索优化网络推广
  • 网站建设公司相关资质ppt那个网站做的好