当前位置: 首页 > news >正文

济南建网站seo课程哪个好

济南建网站,seo课程哪个好,163企业邮箱登陆入口,WordPress 付费文章插件文章目录 需求爬取星巴克产品以及图片#xff0c;星巴克菜单 python爬虫爬取结果 需求 爬取星巴克产品以及图片#xff0c;星巴克菜单 网页分析#xff1a; 首先#xff0c;需要分析星巴克官方网站的结构#xff0c;了解菜单栏的位置、布局以及菜单项的标签或类名等信息… 文章目录 需求爬取星巴克产品以及图片星巴克菜单 python爬虫爬取结果 需求 爬取星巴克产品以及图片星巴克菜单 网页分析 首先需要分析星巴克官方网站的结构了解菜单栏的位置、布局以及菜单项的标签或类名等信息。发送 HTTP 请求 使用 Python 的 requests 模块发送 HTTP GET 请求获取星巴克网页的 HTML 内容。解析 HTML 使用一个 HTML 解析库如 BeautifulSoup解析网页的 HTML 内容以便从中提取出菜单栏的数据。定位菜单栏元素 使用解析库的选择器功能如 CSS 选择器或 XPath定位菜单栏所在的 HTML 元素。提取菜单数据 从菜单栏元素中提取菜单项的信息可能包括菜单项名称、图片等。数据存储 将提取的菜单数据存储到适合的数据结构中。 python爬虫 获取网页源码这里没有反爬手段不需要添加其他参数 import urllib from bs4 import BeautifulSoup import requestsbase_url https://www.starbucks.com.cn/menu/ response urllib.request.urlopen(base_url) content response.read().decode(utf-8)soup BeautifulSoup(content, lxml)方法一soup的select方法 # 方法一select方法 import os# 文件保存路径 save_path ./practice_071_星巴克/ if not os.path.exists(save_path): os.makedirs(save_path)name_list soup.select(ul[classgrid padded-3 product]) # name_list[0].select(li div)[0][style] for name in name_list:submenu_pic name.select(li div)submenu_name name.select(li strong)for pic_url,name in zip(submenu_pic, submenu_name):suffix pic_url[style].split(()[-1].split())[0]# 文件地址 和 名称picture_url https://www.starbucks.com.cn suffixpicture_name name.get_text() .jpg# 文件不支持名称中含有字符 /, picture_name picture_name.strip().replace(/, or)# 方法1urlretrieve# urllib.request.urlretrieve(urlpicture_url, filenameos.path.join(save_path,picture_name))# 方法2写入文件形式src_response urllib.request.urlopen(picture_url)pic_content src_response.read()with open(os.path.join(save_path,picture_name), wb) as fp:fp.write(pic_content)print({} 完成地址为 {}.format(picture_name, picture_url)) 方法二soup的find\find_all方法 # 方法二find/find_all方法 menu_list soup.find(div, class_wrapper fluid margin page-menu-list).find_all(li)for name in menu_list:suffix name.find(div)[style].split(()[-1].split())[0]# 文件地址 和 名称picture_url https://www.starbucks.com.cn suffixpicture_name name.find(strong).get_text() .jpg# 文件不支持名称中含有字符 /, picture_name picture_name.strip().replace(/, or)urllib.request.urlretrieve(urlpicture_url, filenameos.path.join(save_path,picture_name))print({} 完成地址为 {}.format(picture_name, picture_url))爬取结果
http://www.yayakq.cn/news/2410/

相关文章:

  • 上海 松江 网站制作湖州 外贸网站建设
  • 舟山城乡建设培训中心网站seo5
  • 网站模板定制微信下滑小程序怎么关
  • 网站开发的项目流程佛山微网站
  • 服装门户系统网站免费建站网站一站式
  • 用php做美食网站有哪些茂名营销型网站建设
  • 买保险网站网站备案是需要去哪里做
  • 制作网站需要怎么做c 网站开发需要的技术
  • 苏州网站建设哪里好办公室装修流程
  • 怎么利用云盘建设网站推荐聊城做网站
  • 棋牌网站代理精品简历模板网站
  • 青岛美容化妆品外贸网站建设网站公司怎么做的好
  • 做网站的合作案例京津冀协同发展英文
  • 营销型网站建设课程培训现场网址大全怎么卸载
  • 永兴网站开发电子商务网站建设与管理程序设计题6
  • 优秀企业网站建设公司一流的赣州网站建设
  • 山东联迪建设集团网站为企业做贡献的句子
  • 什么叫响应式网站wordpress开发ide
  • wap网站前景如何不要钱做网站
  • 网站信息发布制度建设哪一个网站是专门做兼职的
  • 公司网站建设基本流程图腾讯云如何建设网站首页
  • 池州市建设管理处网站wordpress 添加子菜单
  • 西安广告公司排名top10seo技巧分享
  • html格式的网站地图做网站和做app有什么不同
  • 如何办网站 论坛中关村在线app下载
  • 产品毕业设计代做网站seo 360
  • 网站聊天系统怎么做网站兼容手机
  • 乐营销网站服务好的企业建站
  • 云主机建网站个人备案网站可以做产品推广
  • 国内优秀的网站自己做网站可以赚钱吗