当前位置: 首页 > news >正文

网站建设方案多少钱自己做视频类网站用哪个cms

网站建设方案多少钱,自己做视频类网站用哪个cms,wordpress侧边栏显示单个分类列表,网站设计会计分录怎么做先来说实现逻辑,首先我要获取到这个网站上所有的信息,那么我们就可以开始对元素进行检查 我们发现他的每一个学校信息都有一个对应的属性,并且是相同的,那么我们就可以遍历这个网页中的所有属性一样的开始爬取 在来分析&#xff0…

 先来说实现逻辑,首先我要获取到这个网站上所有的信息,那么我们就可以开始对元素进行检查

 我们发现他的每一个学校信息都有一个对应的属性,并且是相同的,那么我们就可以遍历这个网页中的所有属性一样的开始爬取

在来分析,我们会发现,是不是我们不只是要获取到一页的数据,我们要获取这个网站上所有的大学数据对吧,那么我们就要获取到这个按钮然后通过模拟用户操作webdriver,来模拟用户点击执行,然后在对这个数据来进行保存,当然这个数据是保存到数据库中的

import timefrom selenium import webdriver
from selenium.common.exceptions import TimeoutException, NoSuchElementException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as ECdriver = webdriver.Chrome()url = "https://www.gaokao.cn/lineschool"
driver.get(url)try:# 等待直到元素加载完成element = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CLASS_NAME, "ant-btn-primary")))# 点击按钮element.click()
except TimeoutException:pass# 提取学校信息
school_infos = driver.find_elements(By.CLASS_NAME, "line-school_schoolInfo__1sdvn")
# 初始化列表用于存储提取的信息
school_data = []# 循环执行点击操作
for i in range(3):print("第" + str(i))# # 将页面滚动到最底部# driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")# 点击下一页next_page_element = driver.find_element(By.CLASS_NAME, "ant-pagination-next")next_page_element.click()try:driver.find_element(By.CLASS_NAME, "login-popup_wordIcon__ljiP9").click()password_login_element = driver.find_element(By.XPATH, "//div[@class='login-popup_passwordItem__OouFG']")password_login_element.click()time.sleep(2)name = driver.find_element(By.CSS_SELECTOR, ".login-popup_inputItem__29c36 .undefined ")name.send_keys("15573491551")password_input_element = driver.find_element(By.XPATH, "//input[@type='password']")password = "Tjt987666"password_input_element.send_keys(password)# 找到复选框并点击选中checkbox_element = driver.find_element(By.XPATH, "//input[@type='checkbox']")checkbox_element.click()# 获取到点击按钮driver.find_element(By.CLASS_NAME, "login-popup_loginBtn__3buCc ").click()except TimeoutException:print("没有继续下一步")school_infos = driver.find_elements(By.CLASS_NAME, "line-school_schoolInfo__1sdvn")# 遍历每个学校信息for school_info in school_infos:print("数据执行")# 提取学校名称和所在城市信息name_element = school_info.find_element(By.CSS_SELECTOR, ".line-school_schoolName__1Zk8b em")city_element = school_info.find_element_by_class_name("line-school_cityName__VnOjC")school_name = name_element.textcity_name = city_element.text# 提取标签信息tags_elements = school_info.find_elements_by_class_name("line-school_tagName__1Hr9k")tags_text = [tag.text for tag in tags_elements]# 获取最后一个 span 标签的文本值last_span_text = school_info.find_element(By.XPATH,".//div[@class='line-school_tags__3Cdah']//span[last()]").text# 提取数字部分score_value = last_span_text.split(":")[-1]# 存储学校信息为元组school_tuple = (school_name, city_name, tags_text, score_value)# 将元组添加到列表中school_data.append(school_tuple)for school_tuple in school_data:print(school_tuple)
http://www.yayakq.cn/news/597043/

相关文章:

  • 网站开发模块化开发织梦网站地图在线生成
  • 新闻源网站做黑帽seo企业微信app下载安装官方版
  • dtcms怎么做自己网站怎么学php网站开发
  • 天塔网站建设公司网站制作郑州
  • 网站建设与运营实训总结织梦网站源码下载
  • 南宁网站seo推广优化公司上海百度首页优化
  • 反馈网站怎么做人才网站app建设建议
  • 网站由哪几个部分组成湖北省住房和城乡建设厅
  • 专门做投票的网站有哪些买房网站怎么做
  • 做网站困难嘛天河网站建设开发
  • wordpress子目录多站点设置大连建设局网站地址
  • 合肥建设集团招聘信息网站wordpress 重新安装
  • 株洲做网站渠道电话shopify与wordpress
  • 建设企业网站就等于开展网络营销建网站公司浩森宇特
  • 网站设计策划书案例网站org免费注册
  • 承德公司做网站门户网站作用
  • 北京建设网站的射阳做企业网站多少钱
  • 贵州网站建设套餐wordpress获取文章图片
  • 网站平台搭建要多少钱城乡建设网站 资料员
  • 公司做网站的价格江阴建设银行网站邮箱
  • 百度站长联盟网站站内推广怎么做
  • 网站建设首页wordpress扁平化风格主题
  • 用vs做购物网站下载宁夏住房和建设厅网站
  • 网站建设文件夹布局wordpress 虎嗅网
  • 电子商务网站搜索引擎设计网站开发服务商
  • wordpress建网站视频网站建设 体会
  • 如何自建网站服务器东阿县住房和城乡建设局网站
  • 网站后台更新前台不显示wordpress twig
  • 做购物网站有什么要求吗个人 备案 多个网站吗
  • 向公司申请建设网站申请书网址转app