当前位置: 首页 > news >正文

微网站建设包括哪些物联网的发展前景

微网站建设包括哪些,物联网的发展前景,服务流程企业网站,长沙网络营销群网上所有代码都无法完全克隆单个网页,不是Css,Js下载不下来就是下载下来也不能正常显示,只能自己写了,记得点赞~ 效果如图: 源码与所需的依赖: pip install requests pip install requests beautifulsoup4…

网上所有代码都无法完全克隆单个网页,不是Css,Js下载不下来就是下载下来也不能正常显示,只能自己写了,记得点赞~

 效果如图:

源码与所需的依赖:

pip install requests
pip install requests beautifulsoup4 lxml 
requests.packages.urllib3.disable_warnings()
pip install urllib3
pip install pyOpenSSL requests[security] urllib3[secure]
import os
import time
import requests
from urllib.parse import urljoin
from bs4 import BeautifulSoup# 配置requests,不验证SSL证书
requests.packages.urllib3.disable_warnings()
session = requests.Session()
session.verify = False  # 不推荐,仅用于测试目的def sanitize_filename(filename):return "".join(i for i in filename if i not in "\/:*?<>|").split('?')[0]def ensure_dir(file_path):if file_path:directory = os.path.dirname(file_path)if directory and not os.path.exists(directory):os.makedirs(directory)def download_resource(url, dest_folder, local_path):try:r = session.get(url, stream=True)r.raise_for_status()ensure_dir(local_path)with open(local_path, 'wb') as f:for chunk in r.iter_content(chunk_size=8192):f.write(chunk)return Trueexcept requests.exceptions.RequestException as e:print(f"Error downloading {url}: {e}")return Falsedef update_resource_links(soup, tag, attribute, base_url, dest_folder, sub_folder):resources = soup.find_all(tag, {attribute: True})for resource in resources:old_url = resource[attribute]new_url = urljoin(base_url, old_url)local_filename = sanitize_filename(new_url.split('/')[-1])local_path = os.path.join(dest_folder, sub_folder, local_filename)full_local_path = os.path.abspath(local_path)if download_resource(new_url, dest_folder, full_local_path):resource[attribute] = os.path.join(sub_folder, local_filename).replace('\\', '/')def save_complete_webpage(url, dest_folder):response = session.get(url)response.raise_for_status()# 尝试从响应头部或内容中获取编码if response.encoding is None:response.encoding = response.apparent_encodingsoup = BeautifulSoup(response.content, 'html.parser', from_encoding=response.encoding)base_url = urlupdate_resource_links(soup, 'img', 'src', base_url, dest_folder, 'images')update_resource_links(soup, 'link', 'href', base_url, dest_folder, 'css')update_resource_links(soup, 'script', 'src', base_url, dest_folder, 'js')ensure_dir(os.path.join(dest_folder, 'index.html'))with open(os.path.join(dest_folder, 'index.html'), 'w', encoding=response.encoding) as file:file.write(soup.prettify())if __name__ == "__main__":timestamp = str(int(time.time()))[-5:]  # 获取当前时间戳的最后5位数字target_url = input("请输入网址:")  # 目标网址destination_folder = f'downloaded_website_{timestamp}'  # 添加时间戳后5位的本地文件夹路径save_complete_webpage(target_url, destination_folder)print(f"已完整,保存到{destination_folder}文件夹中")

 

http://www.yayakq.cn/news/472414/

相关文章:

  • 网站开发不用框架?网站优化软件排名
  • 免费快递网站源码主动创新网站内容建设
  • 长春企业网站如何建设免费代理加盟项目
  • 做网站公司的年终总结不能打开建设银行网站怎么办
  • 免费看电视的网站有哪些wordpress首页分页
  • 个人建网站首选什么域名好wordpress怎么更改首页海报轮播图
  • 太原模板建站软件百度识图在线使用一下
  • 网站架设方式wordpress 网站换域名
  • 做网站一天成都正规搜索引擎优化
  • 国际最好的摄影作品网站企业网站建设套餐价格
  • 如何做视频类网站crm平台是什么
  • 苗木公司网站模板梅州做网站多少钱
  • 酒店网站的设计摘要网站能查到从哪里做的吗
  • 做一手楼房的网站佛山网络公司推荐
  • asp.net 个人网站长春关键词排名优化
  • 浦口建设局网站网站源码 手机 微信
  • 优秀自适应网站建设哪家好河池seo快速排名
  • 网站编程论文优化防疫二十条措施
  • 九江商城网站建设空间注册网站
  • 集团酒店网站建设邢台市地图全图高清版
  • 汕头网站建设工作苏州网站制作出名 乐云践新
  • 搜索网站的方法顺企网下载安装手机版
  • 下载的网站模版怎么用做网站怎么连数据库
  • 淘宝联盟个人网站怎么做移动端网站生成器
  • 网站定制建网站定制建设设英文网站后台维护
  • php源码项目 门户网站开发网站信息化建设建议书
  • 企业网站四种类型包装设计效果图
  • ICP备案和实际网站不是一个名字新建站点的步骤
  • 网站建设市场需求大做网站php需要几个人
  • 简述网站开发的几个步骤制作一个静态网站的步骤