当前位置: 首页 > news >正文

上海商场网站开发装修设计公司取名

上海商场网站开发,装修设计公司取名,郑州网约车官网,安徽外经建设集团有限公司网站准备工作 selenium安装 Selenium是广泛使用的模拟浏览器运行的库,用于Web应用程序测试。 Selenium测试直接运行在浏览器中,就像真正的用户在操作一样,并且支持大多数现代 Web 浏览器。 #终端pip安装 pip install selenium #清华镜像安装 p…

准备工作

selenium安装

Selenium是广泛使用的模拟浏览器运行的库,用于Web应用程序测试。 Selenium测试直接运行在浏览器中,就像真正的用户在操作一样,并且支持大多数现代 Web 浏览器。

#终端pip安装
pip install selenium
#清华镜像安装
pip install selenium -i https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/win-64/

安装Chrome driver

查看Google版本,并下载对应版本的驱动

下载路径

安装在anaconda的Scripts文件夹中

测试

from selenium import webdriver
# 初始化WebDriver
browser = webdriver.Chrome()

如果弹出Chrome浏览器,则说明安装成功 

 

爬虫

示例:爬取【AppleiPhone 13】Apple/苹果 iPhone 13 (A2634)128GB 绿色 支持移动联通电信5G 双卡双待手机【行情 报价 价格 评测】-京东

先导入所用的包,这样一步一步跟着做不会出错

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
import time

 初始化并访问

# 初始化WebDriver
browser = webdriver.Chrome()
# 访问商品页面
browser.get('https://item.jd.com/100034710036.html')
# 等待页面加载完成
time.sleep(5)

登录 

QQ、微信登录或扫码登陆均可

正常登录后的界面如下

 控制点击商品评价按钮

# 点击“商品评价”按钮
try:# 等待“商品评价”按钮可点击WebDriverWait(browser, 10).until(EC.element_to_be_clickable((By.XPATH, '//*[@id="detail"]/div[1]/ul/li[5]'))).click()
except Exception as e:print(f"Error clicking the '商品评价' button: {e}")browser.quit()exit()

正则表达式要通过F12检查页面源码去看!!!

爬取评论数据

# 设置要爬取的页数
num_pages_to_scrape = 5# 循环爬取多页评论
for page_num in range(1, num_pages_to_scrape + 1):print(f"Scraping page {page_num}...")# 等待评论加载完成try:WebDriverWait(browser, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, '.comment-item .comment-con')))except Exception as e:print(f"Error waiting for comments to load on page {page_num}: {e}")break# 获取页面源码html = browser.page_source# 使用BeautifulSoup解析HTMLsoup = BeautifulSoup(html, 'html.parser')# 提取评论数据comments = soup.select('.comment-item .comment-con')# 检查是否有评论if comments:for comment in comments:# 提取评论内容content = comment.get_text(separator='\n')print(content)else:print("No comments found on page {page_num}.")

检查是否有下一页(不是必要操作) 

因为测试时报错找不到下一页,因此添加检查是否有下一页的操作。如果上述操作没有错误,就可以不加。

# 检查是否还有下一页if page_num < num_pages_to_scrape:# 点击“下一页”按钮try:# 等待“下一页”按钮可点击next_page_button = WebDriverWait(browser, 10).until(EC.element_to_be_clickable((By.CLASS_NAME, 'ui-pager-next')))# 点击下一页按钮next_page_button.click()# 等待Ajax请求完成WebDriverWait(browser, 10).until(EC.invisibility_of_element_located((By.CLASS_NAME, 'loading-indicator')))except Exception as e:print(f"Error clicking the '下一页' button or waiting for Ajax request on page {page_num}: {e}")break

结果

爬取结果如下,每爬一页都会显示是第几页

http://www.yayakq.cn/news/6802/

相关文章:

  • 福州网站设计十年乐云seo百度关键词排名
  • 淄博手机网站开发公司在线学习建设网站
  • 智慧团建网站pc端在哪个网站做一照一码
  • 江门网站定制多少钱网站模板套用湖南岚鸿
  • 防止服务器上的网站被进攻站长工具收录查询
  • 淄博网站seo价格邢台信息港首页
  • 苏州住房与城乡建设网站网站推广塔山双喜
  • 聊城网站建设信息提高seo排名
  • 网站备案单位的联系方式做网站卖流量
  • 广州化妆品网站建设公司做任务 网站
  • 一个网站做数据分析要多少钱龙岩网红景点
  • 有情怀的网站设计呼伦贝尔建设工程检测网站
  • 行业网站建设教程佛山seo外包平台
  • 哪些网站可以做图片链接invoker wordpress
  • 徐州建站公司模板凡科网小程序
  • 商城购物网站设计内容Gzip 网站 能够压缩图片吗
  • 上海好的网站设计公司网站备案时间
  • 宁波建设网站制作小程序制作公司选卓越华网天下
  • 流量查询中国移动官方网站不会写代码如何做网站
  • 一学一做教育视频网站网站制作者
  • 沈阳酒店团购网站制作邢台市桥西住房建设局网站
  • 网站开发补充合同国内大的做网站的公司
  • 网站建设开发方式网站建设图片如何优化
  • 单位网站的作用珠海附近交友平台软件
  • 马鞍山网站建设价格表格制作
  • 网站运营谁都可以做吗1688网站首页
  • 快递网站制作福田企业网站建设
  • 网站推广是做什手机全屋定制设计app
  • 网站后台更新文章 前台不显示兰州网站设计公司有哪些
  • 凉州区新农村建设网站烟台制作网站的公司简介