当前位置: 首页 > news >正文

网站301重定向检测域名会影响网站排名吗

网站301重定向检测,域名会影响网站排名吗,男人女人做那事网站,网站开发人员的要求Unity C# 之 Http 获取网页的 html 数据,并去掉 html 格式等相关信息 目录 Unity C# 之 Http 获取网页的 html 数据,并去掉 html 格式等相关信息 一、简单介绍 二、实现原理 三、注意事项 四、效果预览 五、关键代码 一、简单介绍 Unity中的一些知…

Unity C# 之 Http 获取网页的 html 数据,并去掉 html 格式等相关信息

目录

Unity C# 之 Http 获取网页的 html 数据,并去掉 html 格式等相关信息

一、简单介绍

二、实现原理

三、注意事项

四、效果预览

 五、关键代码


一、简单介绍

Unity中的一些知识点整理。

本节简单介绍在Unity开发中的,使用 HttpClient,获取指定网页的相关信息,然后进行数据清洗,去掉html 格式,以及标签,函数,多余的空格等信息,仅留下和网页显示差不多的文字信息,为什么这么做呢,其实这里一个使用场景是把网页数据喂给GPT,然后让 GPT 进行处理总结,如果你有新的方式也可以留言,多谢。

二、实现原理

1、HttpClient 获取指定网页的 html 数据

2、使用 HtmlAgilityPack 进行 html 的数据进行 去除所有的<script>标签及其内容,获取纯文本内容,最后再去除多余的空格和空行

三、注意事项

1、直接代码访问网页,最好添加上 User-Agent,不然,可能不能正常访问

2、注意 NuGet 安装  HtmlAgilityPack  包

四、效果预览

 五、关键代码

using HtmlAgilityPack;
using System;
using System.Linq;
using System.Net.Http;
using System.Text.RegularExpressions;namespace TestHtml
{class Program{static async System.Threading.Tasks.Task Main(string[] args){//string url = "https://movie.douban.com/chart";//string url = "http://www.weather.com.cn/";//string url = "https://movie.douban.com/";//string url = "http://time.tianqi.com/";string url = "http://time.tianqi.com/shenzhen/";string htmlContent = @"<html><head><title>Sample Page</title><script>function myFunction() {alert(""Hello!"");}</script></head><body><h1>Welcome to My Page</h1><p>This is a sample page with some content.</p></body></html>";using (HttpClient client = new HttpClient()){// 设置请求头以模拟浏览器访问client.DefaultRequestHeaders.Add("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3");// 访问网页并获取HTML内容htmlContent = await client.GetStringAsync(url);// 输出获取的HTML内容//Console.WriteLine(htmlContent);}// 创建HtmlDocument对象并加载HTML内容HtmlDocument doc = new HtmlDocument();doc.LoadHtml(htmlContent);// 去除所有的<script>标签及其内容foreach (var script in doc.DocumentNode.DescendantsAndSelf("script").ToArray()){script.Remove();}// 获取纯文本内容string text = doc.DocumentNode.InnerText;// 去除多余的空格和空行text = Regex.Replace(text, @"\s+", " ").Trim();// 输出展示内容Console.WriteLine(text);}}
}

http://www.yayakq.cn/news/72721/

相关文章:

  • wordpress安装2个网站app外包后期怎么维护
  • 免费素材网站设计网站开发的目的意义特色创新
  • 网站建设监理注册有限公司需要什么条件
  • 如何添加网站关键词仓储网站开发
  • 房产网站设计网站怎么放404页面
  • 网站注册了域名然后怎么做短视频带货免费平台
  • 网站之家可以做动漫的网站有哪些
  • 广州网站设计推荐柚米wordpress改动立马生效
  • 网站建设undefined自己制作网站的方法
  • 长春火车站有几个推广普通话的宣传标语
  • 安徽省建设工程造价管理总站网站国家建筑工程网653
  • 哪些网站可以做帮助文档网址收录网站
  • 网站开发 项目的招标文件微信号管理系统
  • 广州网站建设需要多少钱培训机构网站制作
  • 广州洲聚网站开发江西港航建设投资有限公司网站
  • 有关网站建设的外文文献熬夜必备黄
  • 为什么网站建设价格不一建设网站需要展示什么区别
  • cdr里做网站超级链接小程序直播开发
  • 做外贸怎样浏览国外网站旅游网站开发数据库
  • 腾讯会议开始收费广州seo工资
  • 江苏省建设部官方网站县区社保经办网站建设
  • 阿里云国际站官网对网站建设有什么样意见
  • dw做的网站怎么上传图片网站飘窗 两学一做
  • 论述网站开发建设的一般流程全屏自适应网站模板
  • 眉县网站开发wordpress手机版难看
  • 网站静态文件怎样用自己的电脑,做网站
  • 营销网站设计包括西安网站优化培训
  • 乌镇网站建设投标书珠海网站建设服务
  • 一级域名网站内蒙古城乡住房建设厅网站
  • 网站在线咨询代码wordpress 双域名