最近,一位做文库的站长反馈,网站服务器经常无缘无故的宕机,CPU被占满。
主机邦查询后发现客户网站出现大量爬虫访问,最多的是gptbot、amazonbot、PanguBot、BLEXBot、DataForSeoBot、SemrushBot这几个访问最多,一天能请求进来几十万次,简直疯狂。
这些爬虫大多是一些AI爬虫或者数据分析网站的爬虫,对网站没有任何用处,因此,可以利用百度云防护进行拦截。
操作方法如下:
1.登陆Web防护规则-创建Web防护规则

2.开启自定义防护策略,并添加策略

3.策略如
User-Agent 包含 gptbot 拦截并追加封禁 1440分钟

把上面的爬虫名字全添加上去

然后保存,并关联相关域名。
我们再来看效果:


成功拦截,客户服务器恢复稳定!