最近,有位客户联系上主机吧,网站被假百度蜘蛛疯狂采集怎么办?
主机吧登陆用户宝塔网站日志查看后,发现对方是通过模拟百度蜘蛛UA请求的,如果不认真看的话,还以为是真的百度蜘蛛请求呢。比如宝塔日志显示:
114.239.118.251 – – [19/Mar/2023:16:26:31 +0800] "GET /daikuangonglue/68783.html HTTP/1.1" 200 117 "https://zhujib.com/daikuangonglue/68783.html" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)"
而Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)就是百度蜘蛛的UA,如果通过封禁UA的方式,是会连百度真实蜘蛛也拦截。
解决办法是使用京东云星盾进行拦截,成功进入后,进入安全规则-托管规则-开启Web应用程序防火墙
点OWASP核心规则集-防御规则等级:高 操作:阻止
京东云星盾防火墙规则里有我们拦截假蜘蛛的规则
进入安全功能防火墙设置-开启BOT识别模式,浏览器完整检查
操作完成,我们进入数据分析-日志分析-安全事件
成功拦截假蜘蛛,而且不用担心拦截到真蜘蛛。
京东云星盾真的强大,有需要的同学可以联系主机吧购买。