当前位置: 首页 > news >正文

网站备案多个域名备案单上填几个软件项目管理案例分析

网站备案多个域名备案单上填几个,软件项目管理案例分析,免费素材网有哪些,天津做手机网站建设虽说现在大环境不太好,很多人面临着失业再就业风险,包括企业则面临着招人人,找对口专业难得问题。想要找到适合自己公司的人员,还要得通过爬虫获取筛选简历才能从茫茫人海中找到公司得力干将。废话不多说,直接开整。 1…

虽说现在大环境不太好,很多人面临着失业再就业风险,包括企业则面临着招人人,找对口专业难得问题。想要找到适合自己公司的人员,还要得通过爬虫获取筛选简历才能从茫茫人海中找到公司得力干将。废话不多说,直接开整。

在这里插入图片描述

1、导入所需的库:

import requests
from bs4 import BeautifulSoup
import re

这行代码导入了requests库,该库用于向网站发出HTTP请求;BeautifulSoup库,该库用于解析HTML文档;re库,该库用于处理正则表达式。

2、设置代理信息:

proxy_host = 'www.duoip.cn'
proxy_port = 8000
proxy = {'http': 'http://{}:{}'.format(proxy_host, proxy_port),'https': 'https://{}:{}'.format(proxy_host, proxy_port)'获取免费ip:jshk.com.cn/mb/reg.asp?kefu=xjy&csdn)
}

这行代码定义了代理的主机名和端口号,并将它们存储在proxy字典中。然后,我们使用format()函数将这些值拼接为代理URL。

3、发出HTTP请求:

response = requests.get('https://www.zhaopin.com/', proxies=proxy)

这行代码使用requests.get()函数向www.zhaopin.com发送GET请求。 proxies参数指定了代理服务器。

4、解析HTML文档:

soup = BeautifulSoup(response.text, 'html.parser')

这行代码使用BeautifulSoup库解析response.text(即HTTP响应的文本内容)。

5、获取招聘信息的HTML元素:

job_info = soup.find_all('div', attrs={'class': 'job-item'})

这行代码使用BeautifulSoup库的find_all()函数查找所有class为’job-item’的div元素(即招聘信息的HTML元素)。

6、循环遍历招聘信息:

for info in job_info:job_title = info.find('h2', attrs={'class': 'job-title'}).textcompany_name = info.find('span', attrs={'class': 'company'}).textlink = info.find('a')['href']print('职位名称:', job_title)print('公司名称:', company_name)print('链接:', link)print('-------------------------')

这行代码循环遍历job_info列表中的每一个元素,并使用find()函数查找职位名称、公司名称和链接。text参数用于获取元素的文本内容,而[‘href’]参数用于获取链接。然后,我们打印出这些信息。

7、整个爬虫程序的运行:

if __name__ == '__main__':proxy_host = 'www.duoip.cn'proxy_port = 8000proxy = {'http': 'http://{}:{}'.format(proxy_host, proxy_port),'https': 'https://{}:{}'.format(proxy_host, proxy_port)}response = requests.get('https://www.zhaopin.com/', proxies=proxy)soup = BeautifulSoup(response.text, 'html.parser')job_info = soup.find_all('div', attrs={'class': 'job-item'})for info in job_info:job_title = info.find('h2', attrs={'class': 'job-title'}).textcompany_name = info.find('span', attrs={'class': 'company'}).textlink = info.find('a')['href']print('职位名称:', job_title)print('公司名称:', company_name)print('链接:', link)print('-------------------------')

这行代码为整个爬虫程序的入口。当程序运行时,它会首先设置代理信息,然后发出HTTP请求,解析HTML文档,获取招聘信息的HTML元素,循环遍历招聘信息,并打印出这些信息。

以上就是爬取智联、无忧简历采集系统内容的Python代码。请注意,这只是一个基本的爬虫程序,实际的爬虫程序需要处理更多的复杂情况,例如处理网站的反爬虫策略、处理可能存在的网页结构变化、处理可能存在的错误等。因此,在编写实际的爬虫程序时,需要根据实际情况进行适当的调整和优化。

上面就是有关爬虫获取招聘信息的一些简易的代码,虽说过程很复杂,一旦跑通了,使用还是非常的方便。如果各位大佬有更好的建议,欢迎评论区交流讨论。

http://www.yayakq.cn/news/754253/

相关文章:

  • 什么网站可以接活在家做上海智能网站建设设计
  • 深圳品牌网站建设服务费用网站备案要到哪里下载
  • 做论坛网站数据库需多大做救助流浪动物网站的产生背景
  • 怎么优化网站关键词的方法淘宝网页设计报告
  • 6617网址导航彩票网站大全企业所得税核定征收办法
  • 网站建设与维护实训心得巴中建设银行网站
  • 深圳制作网站建设网站开发技术与开发环境
  • 余杭区网站建设设计公司网站建设服务器价格
  • 石家庄外贸公司网站设计公司旅游网站做seo
  • 网站建设技术团队有多重要网站构建计划
  • 图片网站seo招商网站建设定做
  • 网站建设设计目的成都花园设计公司
  • 旅行社应做哪些网站汕头网站建设托管
  • 给人做logo的网站做京东网站采购的工作内容
  • 太原市建设局网站外贸销售模式
  • 企业网站建设前网站目的需明确node网站开发需要学什么
  • 北京seo网站优化公司计算机类十大含金量证书
  • 查看网站的外链网站开发及技术路线
  • 高端的深圳网站页面设计百度指数首页
  • 男女直接做的视频视频网站免费设计室内装修软件
  • 内部网站链接怎么做wordpress iis 伪静态
  • 网站开发通用流程石家庄专业制作网站
  • 网站模板 餐饮代理充值平台网站
  • 马鞍山网站建设方案vue做公司网站
  • 如何做单网页网站平面设计创意作品欣赏
  • 做家教一般在哪个网站免费广告制作
  • 网站没有做301的后果是什么徐州网站建设开发
  • 做推广比较好的网站慈溪网页设计
  • 一级域名做网站的好处wordpress 子主题
  • wordpress里的主题怎么购买长沙网站seo推广公司