当前位置: 首页 > news >正文

dw网站模板免费下载哪个大学的网站做的最好看

dw网站模板免费下载,哪个大学的网站做的最好看,电子商务就业岗位有哪些,广州网站制作怎么选需求: 1.爬取情话网站中表白里面的所有句子(表白词_表白的话_表白句子情话大全_情话网) 2.利用XPath来进行解析 3.使用面向对象形发请求——创建一个类 4.将爬取下来的数据保存在数据库中 写出对应解析语法 //div[class"box labelbo…

需求:

1.爬取情话网站中表白里面的所有句子(表白词_表白的话_表白句子情话大全_情话网)

2.利用XPath来进行解析

3.使用面向对象形发请求——创建一个类

4.将爬取下来的数据保存在数据库中

8282f421d831464da90687bc3ab0a034.png

c1eef08bee8f4953bc89d9d2ab7611f4.png

c075da74c46b4e3aa86e4a7c841e8eea.png

74141cffdc364ee48287b7ca55db0dfc.png

b6a051b68ba847e68f7a7d031f8a8c8b.png

702a27b6ded643829edee5bf12d65171.png

b78c5f13c9c74c7cba32ac8ae8ccde80.png

写出对应解析语法

//div[@class="box labelbox"]/h4/a/@href

1e464526bf2d4c19b668b1f8c4298037.png

如此照推,详情页文本对应的解析语法

//div[@class="stbody "]//p[1]/text()|//div[@class="stbody first"]//p[1]/text()

b68c938feda74f909c73356958c25b8e.png示例代码:

import requests
from lxml import etree
import pymysql
#面向对象发请求 1.创建一个类
class Spiderqinghua():def __init__(self):self.url ='http://www.ainicr.cn/qh/t8.html'self.headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'}#建立与MySQL的连接self.db = pymysql.connect(user='root',password='wx990826',database='pingping')self.cursor=self.db.cursor()#获取操作游标def get_data(self,url):r = requests.get(url=url,headers=self.headers)return r.textdef get_list_data(self,data):#列表页#//div[@class="box labelbox"]/h4/a/@hrefxml=etree.HTML(data)hrefs = xml.xpath('//div[@class="box labelbox"]/h4/a/@href')# print(hrefs)return hrefsdef parse_data(self,data):#详情页xml=etree.HTML(data)content = xml.xpath('//div[@class="stbody "]//p[1]/text()|//div[@class="stbody first"]//p[1]/text()')for contents in content:print('文本:',contents)print('=====================')self.save_data(contents)def save_data(self,qinghua):sql = 'insert into qinghua_data(text) value ("%s")'self.cursor.execute(sql,[qinghua])#执行sql语句self.db.commit()#提交def main(self):html_data=self.get_data(self.url)hrefs = self.get_list_data(html_data)for href in hrefs:print('详情页连接:',href)x_data = self.get_data(href)# print(x_data)self.parse_data(x_data)
#//div[@class="stbody "]//p[1]/text()|//div[@class="stbody first"]//p[1]/text()if __name__ == '__main__':spider=Spiderqinghua()spider.main()# h = spider.get_data()# # print(h)# spider.get_list_data(h)

运行结果:

dc1ff20b0bdc4e12bd995ab08d0c72a7.png

cdc903e90ed54574945aacca9ff486eb.png

 

http://www.yayakq.cn/news/894757/

相关文章:

  • PHP网站开发简单实例蓝色 网站
  • 网站接入变更黄页网络的推广网站有哪些软件
  • 免费发布网站建设的平台wordpress大淘客采集
  • 如何做网站标题不含关键词的排名嵌入式硬件开发
  • php网站开发哪个培训学校好iphone怎么开通互联网
  • wordpress 系统找不到指定的文件.seo外包顾问
  • 网站分为哪几个部分网络营销与推广方案
  • 网站vpswordpress固定链接设置静态链接
  • 网站删除期查询网站建设中字样图片
  • 绍兴市建设银行网站新品发布会结束语
  • 网站上的地图导航怎么做的wordpress外链论坛
  • 如何给网站增加关键词女装网站建设规划
  • 广州教育学会网站建设南宁高端网站
  • 厦门 网站建设公司电话网站建设交互效果
  • 公司电子商务网站建设策划书精美企业网站
  • 2003配置网站与2008的区别4大门户网站
  • 怎么在百度搜到自己的网站网站制作推广需要多少钱
  • 网站建设公司做销售好不好客户网站建设需要什么资料
  • 哪里有做响应式网站的做那种网站
  • 如何创办网站万能浏览器官方免费版
  • 北京公司网站建工体做网站的公司
  • 深圳高端做网站公司济南网站建设第六网建
  • 网站建设优惠券临汾网站建设 吕梁网站建设
  • 网站打开速度慢优化centos yum wordpress
  • 网站设计错误seo外链友情链接
  • wamp做的网站上传用vs2008做网站
  • 建设银行网站怎么查自己账号做选择网站
  • 潍坊建设厅网站墨刀可以做网站原型图吗
  • 新手建设网站的步骤百度竞价软件哪个好
  • 网站开发建设价格附件专注移动网站建设