当前位置: 首页 > news >正文

郑州网站推广价格上海网站建设公司网站建设

郑州网站推广价格,上海网站建设公司网站建设,语文答题模板高中,如何做网站个人文章目录 1 Meta Robots 标签(控制单页索引行为)支持的指令HTML示例 🌐 2 HTTP 头:X-Robots-Tag (服务器级控制)服务端配置示例💎 根据场景选择方案 近期文章: 建站SEO优化之站点地…

文章目录

    • 1 Meta Robots 标签(控制单页索引行为)
      • 支持的指令
      • HTML示例
    • 🌐 2 HTTP 头:`X-Robots-Tag` (服务器级控制)
      • 服务端配置示例
      • 💎 根据场景选择方案

近期文章

  • 建站SEO优化之站点地图sitemap
  • 个人建站做SEO网站外链这一点需要注意,做错了可能受到Google惩罚
  • 一文搞懂SEO优化之站点robots.txt
  • 网页常见水印实现方式
  • Node.js中那些常用的进程通信方式
  • 浅谈微前端沙箱机制
  • 实现篇:二叉树遍历收藏版
  • 实现篇:LRU算法的几种实现
  • 从底层视角看requestAnimationFrame的性能增强
  • Nginx Upstream了解一下
  • 实现篇:一文搞懂Promise是如何实现的
  • 一文搞懂 Markdown 文档规则

在一些网站中,通过robots.txt可以控制哪些站点资源或目录能被搜索引擎索引,但是随着站点页面增加,之前允许的索引页面常常不希望被索引,如果直接修改 robots.txt,影响会比较大,所以页面级的控制就很有必要。


原文链接:如何通过 noindex 阻止网页被搜索引擎编入索引?

前一篇有提到通过在站点根目录 robots.txt 文件中添加 Disallow 指令来阻止整站级别的某些资源被搜索引擎索引或不被索引,一文搞懂SEO优化之站点robots.txt。为了精细化控制被索引的页面,有时也需要通过noindex处理。

为让 noindex 生效,网页或资源需要不被 robots.txt 文件的规则屏蔽,并且必须能被访问。如果被 robots.txt 文件屏蔽或无法访问该网页,那么爬虫就永远看不到 noindex 规则,所以该网页可能仍会显示在搜索结果中,例如有其他网页链接到该网页。

有两种方式配置 noindex :一是作为 <meta> 标记,二是作为 HTTP 响应标头。这两种方法的效果相同,根据网站实际情况选择合适的方法即可。

1 Meta Robots 标签(控制单页索引行为)

在HTML的<head>中添加,精准控制单个页面是否被索引或跟踪链接。

支持的指令

指令说明
all无限制,为默认值
noindex不在搜索结果中显示此网页、媒体或资源
nofollow不追踪该网页上的链接
none等同于 noindex, nofollow
nosnippet不在搜索结果中显示该网页的摘要或视频预览
indexifembedded如果网页通过 iframes 嵌入到其他网页,该网页内容也会被编入索引
max-snippet: [number]最多只能使用 [number] 个字符作为搜索结果的文字摘要。为0时,不显示摘要。等同于 nosnippet;为-1时,不限制
max-image-preview: [setting]设置网页的图片预览在搜索结果中的尺寸上限。为none时,不显示图片预览;为standard时,可能会显示默认图片预览;为large时,可能显示较大图片预览
max-video-preview: [number]设置网页的视频预览在搜索结果中的最长秒数。为0时最多显示静态图;为-1时无显示;
notranslate不在搜索结果中提供该网页的译文
noimageindex不将该网页上的图片编入索引
unavailable_after: [date/time]在指定日期/时间过后,不在搜索结果中显示该网页

HTML示例

<!-- 禁止所有爬虫 -->
<meta name="robots" content="noindex, nofollow">
<!-- 仅禁止Google -->
<meta name="googlebot" content="noindex"><!-- 阻止在搜索结果中显示摘要 -->
<meta name="robots" content="max-snippet:0">
<!-- 摘要最多显示20个字符 -->
<meta name="robots" content="max-snippet:20">
<!-- 不限制 -->
<meta name="robots" content="max-snippet:-1"><!-- 不显示预览图 -->
<meta name="robots" content="max-image-preview:standard"><!-- 2025-08-01之后不在结果中显示该网页 -->
<meta name="robots" content="unavailable_after: 2025-08-01">

🌐 2 HTTP 头:X-Robots-Tag (服务器级控制)

通过服务器配置HTTP响应头X-Robots-Tag,其值为 noindexnone动态控制索引行为 可用于非HTML文件(如PDF、视频文件或图片等)。

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex, nofollow
(...)

或指定爬虫引擎

HTTP/1.1 200 OK
(...)
X-Robots-Tag: googlebot: nofollow
X-Robots-Tag: otherbot: noindex, nofollow
(...)

服务端配置示例

以nginx配置为例,比如希望所有pdf文件禁止被索引:

location ~* \.pdf$ {add_header X-Robots-Tag "noindex, nofollow";
}

✅ 优势:无需修改页面代码,适合批量管理或程序化生成的内容。

💎 根据场景选择方案

需求场景推荐方案
整站/目录禁止抓取robots.txt
精准控制单页索引/链接跟踪Meta Robots 标签
动态文件或服务器级批量控制X-Robots-Tag HTTP 头

实际业务中,建议同时使用 robots.txt + noindex 组合。

http://www.yayakq.cn/news/259008/

相关文章:

  • 个人网站wordpress响应式电影资讯网站
  • 网站没内容可以备案吗国外购物网站app
  • logo网站设计阳江招聘网最新招聘信息网
  • 网站第二次备案生产管理网站开发
  • 网站建设建立好如何盈利徐州网站无障碍建设
  • 网站建设提成方案商丘互联网公司
  • 9e做网站如何制作网址二维码
  • 高端网站建设制作官网招聘平台
  • 网站搭建策划书电子商务前景怎么样
  • 如何免费创建一个个人网站360搜索引擎
  • 网站 建设需求微信网站收钱吗
  • 制作英文网站东昌府企业做网站推广
  • 网站排名如何上升三星网上商城退款
  • 微网站工程案例展示免费制作网站模板
  • 有什么网站可以做编程题怎么建自己的销售网站
  • 什么官网比较容易做网站昆明医院网站建设
  • 大淘客网站建设app使用网站效果图
  • 合肥网页设计培训班旺道网站优化
  • 网站开发技术介绍企业网站改版项目描述
  • 南桥网站建设外包做一个app多少钱
  • 网站开发价格明细百度企业查公司名录
  • 做pc端网站什么开头宁海做网站
  • 北京360建筑网杭州seo招聘
  • 手机新机价格网站企业管理培训课程感想
  • 在哪些网站可以发布推广信息建筑模板规格一览表
  • 个人网站如何建设dw网页制作下载
  • php网站开发电子书东莞招聘信息
  • 温州市城乡建设厅网站首页WordPress使用两个模板
  • 自助网站建设公司深圳网站关键词排名
  • 网站建设先进个人事迹东光网站建设