您好!欢迎访问宇玄文杰网络公司网站!
创办十年,专注网站建设网站制作/小程序开发/APP开发/手机网站开发/网站推广优化
办理业务联系电话:17683226251
建站资讯
更多资讯
宇玄文杰
您的位置: 首页 > 建站资讯

鉴别真假网络爬虫

作者:小白爱吃肉夹馍 浏览量: 来源:宇玄文杰 时间:2022-04-11

信息摘要:

实际上,我们的日志中,有很多的baiduspider是他人伪装的,要想解决这个问题,我们必须在验证baiduspider真伪上下功夫

  实际上,我们的日志中,有很多的baiduspider是他人伪装的,要想解决这个问题。我们必须在验证baiduspider真伪上下功夫。

  今天小白详细的介绍了爬虫的鉴别方法。我们在根据网站日志分析搜索引擎蜘蛛抓取网页的记录时,实际上很多站点都是有一些伪装称baiduspider的到访者的。这些数据会严重影响我们对日志分析后的判断。这些到访者,为什么会伪装为baiduspider来访问我们的网站呢?

  最典型的就是采集你内容的那些人。他们知道很多工具是能够看到哪些ip访问网站的量过大的。

百度pc端的爬虫UA是这样的:

  Mozilla/5.0 (compatible;Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

  Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

百度移动端的爬虫UA是这样的:

  Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible;Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

  Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

  那么如何鉴别假的网络爬虫呢?

1、windows电脑反查ip,判断爬虫真伪:

  点击“开始”菜单,-> 点击“运行”按钮,-> 然后弹出cmd窗口。输入“nslookup 要查询的ip地址”,点击回车键,会有结果输出出来。判断是否来自Baiduspider的抓取。回车后的结果如果包含x x.baidu.com 或x x.baidu.jp 这两种格式,就说明是真的baiduspider

2、liunx系统反查ip,判断爬虫真伪:

  liunx系统验证爬虫的逻辑与windows没有什么区别,只是查询的方式不同。毕竟系统不一样了。

  liunx使用的命令是“host 要查询的ip地址”,其判断逻辑与windows系统一样。

  好了,今天的文章分享到这里。赶紧去拿你的日志看看哪些访客是伪装的爬虫吧!

在线客服
联系方式

热线电话

13173994126

上班时间

周一到周五

公司电话

17683226251

二维码
线