当前位置: 首页 > news >正文

网站改版 seo普陀建设网站

网站改版 seo,普陀建设网站,wordpress 做分销,开源企业建站系统phpPython使用Beautiful Soup及解析html获取元素并提取内容值 1. 包括解析获取标题2. 根据标签及id获取所有元素3. 根据标签及class获取所有元素4. 获取元素下的标签的值5. 获取元素下的parent及child的元素的值参考 1. 包括解析获取标题 2. 根据标签及id获取所有元素 3. 根据标…

Python使用Beautiful Soup及解析html获取元素并提取内容值

    • 1. 包括解析获取标题
    • 2. 根据标签及id获取所有元素
    • 3. 根据标签及class获取所有元素
    • 4. 获取元素下的标签的值
    • 5. 获取元素下的parent及child的元素的值
    • 参考

1. 包括解析获取标题

2. 根据标签及id获取所有元素

3. 根据标签及class获取所有元素

4. 获取元素下的标签的值

5. 获取元素下的parent及child的元素的值

# 使用Python解析html元素的值from bs4 import BeautifulSoupfile_html = 'test/demo.html'
file = open(file_html, "rb")
html = file.read().decode("utf-8")# 通过html.parser解析器把我们的HTML解析成了一棵树
bs = BeautifulSoup(html, "html.parser")print("获取文章title")
print(bs.title)# 根据标签 和 id名称获取所有元素
id_list = bs.find_all('input', id='mSearchInput')# 根据标签 和 class名称获取所有元素
div_class_list = bs.find_all('div', class_='view-num-box')
for i, div in enumerate(div_class_list):# 获取元素的父元素的值print(i, div.text, ' parent: ', div.parent.text)print('-----------------------------------------------------------')
blog_list = bs.find_all('article', class_='blog-list-box')
for i, blog in enumerate(blog_list):print(i, blog.text, '\ntitle: ', bs.find_all('div', class_='blog-list-box-top')[i].text)print(blog.h4.text)  # 获取blog的标签下的h4标签的文本print(blog.span.text)print(blog.div, blog.div.next)# 获取contentfor j, content in enumerate(blog.contents):print('contents: ', j, content.text)# 获取childfor j, child in enumerate(blog.children):print('child: ', j, child.text)div_list = bs.find_all('div', class_='user-profile-head-address')
print('div_list: ', div_list[0].text)meta_list = bs.find_all('meta')
for j, meta in enumerate(meta_list):print(j, meta.text, meta.attrs['content'])# 2.NavigableString
print("2. NavigableString的例子:获取title的string内容和div的属性")
print(bs.title.string)
print(bs.div.attrs)  # 获取标签中的所有属性,并返回一个字典
# 3.BeautifulSoup
print("3. BeautifulSoup的例子:获取整个html文档的name")
print(bs.name)
# 4.Comment
print("4. Comment的例子:获取a的string")
print(bs.a.string)

参考

  • https://blog.csdn.net/qq_42732153/article/details/81105725
  • https://blog.csdn.net/qq_50587771/article/details/123870433
http://www.yayakq.cn/news/924533/

相关文章:

  • 豆芽网站建设douyanet网络营销学什么内容
  • 网站建设相关法律法规北京多用户商城网站建设
  • 做seo网站公司哪家好如何做网站alexa排名
  • 展示型网站 营销型网站php网站做代理服务器
  • 哪个网站是动态官方网站怎么注册
  • 新中建设公司招聘网站网上做设计的网站
  • 做网站名词网站数据分析表格
  • 电子商务网站推广的主要方法wordpress如何发邮件
  • 网站设计素材图片wordpress微信文章采集
  • 联系我们网站模板网站域名怎么设置方法
  • 网站留言板html模板构建网站的主要步骤
  • 网站制作北京做知乎网站要多少钱
  • phpcms做网站好吗什么网站做h5不收费
  • 中国建设协会网站wordpress的手机客户端
  • 网站开发中网页之间的链接形式茂名市网站建设
  • 建设ca网站小程序商店模板
  • 做兼职的网站打字员微信公众号推广的好处
  • 学做电商的网站有哪些wordpress如何给主题加密
  • 微网站的价格做彩票网站推广犯法吗
  • wordpress建立网站实例购物app哪个好
  • 网站最下面版权模板网站301跳转怎么做
  • 苏州专业做网站公司哪家好软件设计培训
  • 东台建设局官方网站湖州房产网
  • 温州网站设计哪家公司好北京晨钟科技有限公司订单查询
  • 推广网站联盟深圳专业做网站哪家专业
  • 做公司网站需不需要注册有哪些做微信小游戏的网站
  • 哈尔滨企业建站网站开发网站模板 实验室
  • 传媒公司名字大全免费宁波网站扔优化
  • 北京 建网站离开此网站系统可能不会保存您做的更改
  • 为什么做网站越早越好湛江网站建设详细策划