网站robots.txt文件简要说明

1、robots.txt文件是用来指示搜索引擎的爬虫哪些页面可以爬取，哪些页面不能爬取的。
2、robots.txt（统一小写）

文件路径：

网站根目录/robots.txt 或者 public/robots.txt

关键指令解释：

User-agent: 指定搜索引擎爬虫（如 Googlebot、Bingbot 等），*代表所有爬虫。

Disallow: 禁止访问的路径，/代表根目录，后面跟随的路径表示要禁止爬取的目录或文件。

Allow: 明确允许访问的路径（仅用于与 Disallow 搭配）。

Sitemap: 提供站点地图的 URL。

1、允许所有爬虫爬取所有内容：

写法一：

User-agent: *
Disallow:

写法二：

User-agent: *
Allow:/

2、禁止所有爬虫访问整个网站：

User-agent: *
Disallow: /

3、禁止所有爬虫访问特定目录或文件：

User-agent: *
Disallow: /admin/
Disallow: /private/
Disallow: /secret.html

4、允许所有爬虫访问某个目录或文件，但禁止其他部分：

User-agent: *
Disallow: /private/
Allow: /public/
Allow: /index.html

周一	周二	周三	周四	周五	周六	周日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

网站robots.txt文件简要说明

文件路径：

关键指令解释：

1、允许所有爬虫爬取所有内容：

写法一：

写法二：

2、禁止所有爬虫访问整个网站：

3、禁止所有爬虫访问特定目录或文件：

4、允许所有爬虫访问某个目录或文件，但禁止其他部分：

admin 

相关推荐

评论抢沙发

评论前必须登录！

作者介绍

admin

时光机

可爱的狗狗

个人名片

文章目录

热门文章

网站统计

活跃读者

最新评论

热门标签

更好的WordPress主题

支持快讯、专题、百度收录推送、人机验证、多级分类筛选器，适用于垂直站点、科技博客、个人站，扁平化设计、简洁白色、超多功能配置、会员中心、直达链接、文章图片弹窗、自动缩略图等...

觉得文章有用就打赏一下文章作者

非常感谢你的打赏，我们将继续提供更多优质内容，让我们一起创建更加美好的网络世界！

支付宝扫一扫

微信扫一扫

切换注册登录

切换登录注册

文件路径：

关键指令解释：

1、允许所有爬虫爬取所有内容：

写法一：

写法二：

2、禁止所有爬虫访问整个网站：

3、禁止所有爬虫访问特定目录或文件：

4、允许所有爬虫访问某个目录或文件，但禁止其他部分：

admin

相关推荐

评论 抢沙发

评论前必须登录！

作者介绍

admin

时光机

可爱的狗狗

个人名片

文章目录

热门文章

网站统计

活跃读者

最新评论

热门标签

更好的WordPress主题

支持快讯、专题、百度收录推送、人机验证、多级分类筛选器，适用于垂直站点、科技博客、个人站，扁平化设计、简洁白色、超多功能配置、会员中心、直达链接、文章图片弹窗、自动缩略图等...

觉得文章有用就打赏一下文章作者

非常感谢你的打赏，我们将继续提供更多优质内容，让我们一起创建更加美好的网络世界！

支付宝扫一扫

微信扫一扫

切换注册登录

切换登录注册

admin 

评论抢沙发