别让网站的robots成为最大的安全漏洞

张俊SEM seo优化87字数 1389阅读4分37秒阅读模式

你的网站信息安全吗?树大招风,一些公司往往再收到攻击之后,才想起网站安全。网站注册的个人信息能被黑客们轻易的拿下,对用户造成的损失无法估量。没有100%安全而完美的系统,黑客们乐此不彼的研究着这些网站的安全漏洞,总有一天会被攻破。

网站根目录下的robots.txt文件告诉搜索引擎的访问范围,使用方法很简单,但是搜索引擎还是个人来说都是可以访问的, 很多新人不知道这个文件的重要性,对于渗透测试人员或黑客,可以通过robots.txt文件发现敏感信息,比如猜测这是什么后台用什么数据库等,意味着自己的网站是真空上阵。文章源自张俊SEM-https://zhangjunsem.com/27611.html

文章源自张俊SEM-https://zhangjunsem.com/27611.html

如何防止别人访问呢?

网上有人这么做:在IIS中,选中robots.txt,右键属性里,选中重定向到URL,输入任意一个非本站的URL路径,勾选“上面准确的URL”以及“资源的永久重定向”,有点基础的童鞋知道,访问 http://域名/robots.txt 时,是自动跳转到指定的那个非本站URL路径。 这个方法在Apache环境中可以借助.htaccess达到这个重定向的目的。文章源自张俊SEM-https://zhangjunsem.com/27611.html

但是对于蜘蛛来说,这样的跳转意味着站内不存在这个文件,那蜘蛛就不会遵守这个规则,把能发现的URL都抓了。文章源自张俊SEM-https://zhangjunsem.com/27611.html

为防止别人利用robots文件泄露了网站的结构,做其他手脚,站长们是绞尽脑汁。不让搜索引擎来抓这个文件,那就不遵从抓取范围,都会放进索引库,对不想让搜索引擎建立索引的方法参考:页面不让搜索引擎建立索引。文章源自张俊SEM-https://zhangjunsem.com/27611.html

实用的防护措施,推荐采用通配符(*)替换敏感文件或文件夹

比如某个重要文件夹为admin,可以这样写robots文章源自张俊SEM-https://zhangjunsem.com/27611.html

User-agent:
Disallow:/a*/

意思是禁止所有搜索引擎索引根目录下a开头的目录,一般的网站的比较通用的命名有admin,include,templets,plus等,这些都是重要的文件夹,可以修改文件名,但是其他关联一并修改,否则系统会出错。文章源自张俊SEM-https://zhangjunsem.com/27611.html

用.htaccess禁止垃圾蜘蛛访问

一搜YisouSpider   #无视robots规则
宜搜EasouSpider   #无视robots规则
易查   #无视robots规则
MSNmsnbot-media
有道youdao
必应bingbot

当然你也要看流量来源,如果有,那就不要屏蔽,实在是少得很有每天很勤快的来访的话,可以屏蔽。文章源自张俊SEM-https://zhangjunsem.com/27611.html

robots屏蔽蜘蛛文章源自张俊SEM-https://zhangjunsem.com/27611.html

User-agent: YisouSpider
Disallow: /
User-agent: EasouSpider
Disallow: /
User-agent: msnbot-media
Disallow: /
User-agent: YoudaoBot
Disallow: /
User-agent: bingbot
Disallow: /

.htaccess屏蔽蜘蛛文章源自张俊SEM-https://zhangjunsem.com/27611.html

SetEnvIfNoCase User-Agent "^Yisou" bad_bot
SetEnvIfNoCase User-Agent "^Easou" bad_bot
SetEnvIfNoCase User-Agent "^Youdao" bad_bot
SetEnvIfNoCase User-Agent "^msn" bad_bot
Deny from env=bad_bot

或者如下写法,中间加就行了

RewriteCond %{HTTP_USER_AGENT} (jikeSpider|easouSpider|YisouSpider|bingbot|YoudaoBot|) [NC]

声明:转载此文是出于传递更多学习交流目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。本站部分图文来源于网络,仅供学习交流,发表作品观点仅代表作者本人,本站仅提供信息存储空间服务,不承担连带责任。如有侵权,请及时联系管理员删除。

weinxin
ynxtwl
加个微信
交个朋友
张俊SEM
  • 本文由 张俊SEM 发表于 2024年12月24日12:13:32
  • 转载请务必保留本文链接:https://zhangjunsem.com/27611.html
  • 搜索引擎
  • robots
  • 个人
新站在百度审核期间的操作指南(如何让新站尽快通过百度审核)
新站在百度审核期间的操作指南(如何让新站尽快通过百度审核) SEO技术

新站在百度审核期间的操作指南(如何让新站尽快通过百度审核)

对于刚刚建立的新站来说,通过百度的审核是非常重要的一步。然而,百度的审核机制也相对复杂,需要站长们具备一定的知识和技能。本篇文章将为大家详细介绍新站在百度审核期间的操作指南,希望对站长们有所帮助。 一...
网站运营 2 年没见效果?3 步搞定流量低、权重不高难题
网站运营 2 年没见效果?3 步搞定流量低、权重不高难题 seo优化

网站运营 2 年没见效果?3 步搞定流量低、权重不高难题

不少站长投入时间精力搭建网站,可运营 2 年后却发现:流量始终上不去,搜索引擎权重也没明显提升,既没带来预期转化,也慢慢磨灭了运营热情。其实,网站流量与权重不佳,并非 “运营时间不够”,而是忽略了核心...
WordPress页面
WordPress页面 WordPress主题

WordPress页面

在WordPress中添加页面类似于在博客中发布文章。页面是静态内容,通常不会更改其显示的信息。 一、添加页面 首先点击【页面】-【新建页面】如下面的屏幕截图所示; 然后将获得如下面屏幕截图所示的编辑...