通过IP反查(nslookup)判断百度蜘蛛IP真假

张俊SEM seo优化94字数 1329阅读4分25秒阅读模式

我们经常会碰到黑客利用伪装蜘蛛扫描网站,今天我们介绍下如何利用IP反查方法,判断蜘蛛是否为百度搜索引擎蜘蛛。

以百度为例,通常我们判断是否是百度蜘蛛抓取看用户代理字符串也就是User-Agent,但是User-Agent是可以模拟的,所以很多时候也会有虚假的模拟伪装成百度蜘蛛来抓取,这时候我们就需要学会分辨真伪。文章源自张俊SEM-https://zhangjunsem.com/27317.html

文章源自张俊SEM-https://zhangjunsem.com/27317.html

首先是百度User-Agent代理字符串,百度官方公布的有如下User-Agent:

移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)文章源自张俊SEM-https://zhangjunsem.com/27317.html

PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)文章源自张俊SEM-https://zhangjunsem.com/27317.html

新增渲染UA:文章源自张俊SEM-https://zhangjunsem.com/27317.html

移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)文章源自张俊SEM-https://zhangjunsem.com/27317.html

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)文章源自张俊SEM-https://zhangjunsem.com/27317.html

需要注意的是百度新增了一个移动的User-Agent,和一个PC的User-Agent。我们知道了百度蜘蛛的User-Agent,如何正确识别和判断某条抓取是否是真实的百度蜘蛛。文章源自张俊SEM-https://zhangjunsem.com/27317.html

如何识别百度蜘蛛

1、首选我们需要通过关键词找User-Agent中是否包含Baiduspider;文章源自张俊SEM-https://zhangjunsem.com/27317.html

2、如果想区分移动和PC的蜘蛛的话,我们还需要在结果中再进行关键词过滤,移动端的User-Agent包含:Android 、iPhone、Mobile等三个中至少一个。文章源自张俊SEM-https://zhangjunsem.com/27317.html

3、通过上述操作我们可以分辨出哪些抓取是百度蜘蛛抓取,但并不能分辨真伪。

判断百度蜘蛛真伪

1、验证百度蜘蛛真伪我们一般使用的是DNS反查IP的方式来进行判断,首选我们需要找到上述抓取记录中蜘蛛的IP。

2、以windows操作系统为例,开始运行中输入cmd 弹出窗口中输入 nslookup (上述IP地址),判断百度蜘蛛的真伪,真是百度蜘蛛结果中会返回以*.baidu.com 或*.baidu.jp 的格式命名hostname,如不包含则为假百度蜘蛛。

常见HTTP状态码解读:

1、200代码,表示蜘蛛爬取正常

2、404代码,访问的这个链接是错误链接

3、301代码,永久重定向

4、302代码,表示临时重定向

5、304代码,客户端已经执行了GET,但文件未变化。

6、500代码,表示网站内部程序或服务器有错

声明:转载此文是出于传递更多学习交流目的。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,谢谢。本站部分图文来源于网络,仅供学习交流,发表作品观点仅代表作者本人,本站仅提供信息存储空间服务,不承担连带责任。如有侵权,请及时联系管理员删除。

weinxin
ynxtwl
加个微信
交个朋友
张俊SEM
  • 本文由 张俊SEM 发表于 2024年12月11日11:41:10
  • 转载请务必保留本文链接:https://zhangjunsem.com/27317.html
新手如何利用内部链接优化SEO(从内部链接开始,为您的网站带来更多流量)
新手如何利用内部链接优化SEO(从内部链接开始,为您的网站带来更多流量) seo优化

新手如何利用内部链接优化SEO(从内部链接开始,为您的网站带来更多流量)

SEO对于每个网站都是非常重要的,因为它可以帮助网站获得更多的流量。然而,对于新手来说,SEO可能是一个非常困难的问题。本文将介绍如何利用内部链接来优化SEO,并为您的网站带来更多的流量。 什么是内部...
网站运营 2 年没见效果?3 步搞定流量低、权重不高难题
网站运营 2 年没见效果?3 步搞定流量低、权重不高难题 seo优化

网站运营 2 年没见效果?3 步搞定流量低、权重不高难题

不少站长投入时间精力搭建网站,可运营 2 年后却发现:流量始终上不去,搜索引擎权重也没明显提升,既没带来预期转化,也慢慢磨灭了运营热情。其实,网站流量与权重不佳,并非 “运营时间不够”,而是忽略了核心...
如何通过网站SEO优化提升网站流量和转化?
如何通过网站SEO优化提升网站流量和转化? seo优化

如何通过网站SEO优化提升网站流量和转化?

中小企业预算有限时做网站SEO优化,核心是“聚焦核心需求、放弃无效投入、用最小成本抓高转化节点”。无需追求全量关键词覆盖或复杂技术优化,重点围绕 “用户找得到、页面留得住、转化接得住” 三个环节落地,...