今天接入到一位深受黑客攻击影响的客户求助,网站经常被CC攻击,还有大量爬虫,还有采集等情况,服务器CPU、带宽总是不够用,想要找解决办法。
在了解情况后,我们推荐客户使用百度云防护企业版:
企业版
- DDOS防护:支持
- CC攻击防护:支持
- WEB应用防火墙:支持
- WAF自定义规则:20条
- Bot防护:支持(爬虫防护)
- 威胁情报: 支持设备情报+IP情报
- API安全:支持
- 动静态智能加速:支持
- 自定义缓存策略:支持
- HTTPS:支持
- IPV6:支持
- 防护域名额度:1个(10个子域名)
- 泛域名解析:支持
- 套餐每月流量:30TB
这个套餐拥有一个非常强大的功能bot防护功能,对付CC攻击、网站采集、恶意爬虫效果非常好。
现在我们来看实际操作:
成功接入并解析百度云防护哦,我们先做静态文件缓存。
开启缓存,缓存文件:
bmp,ejs,jpeg,pdf,ps,ttf,class,eot,jpg,pict,svg,webp,css,eps,js,pls,svgz,woff,csv,gif,mid,png,swf,woff2,doc,ico,midi,ppt,tif,xls,docx,jar,otf,pptx,tiff,xlsx

这样做是可以尽量减少图片等静态文件回源影响服务器带宽。
创建web防护规则,自定义访问策略,把已知的恶爬虫UA封禁,主机帮主要设置封禁:
gptbot、amazonbot、PanguBot、BLEXBot、DataForSeoBot、SemrushBot、curl、python、MJ12bot、Bullet、Go-http-client、Java、Scrapy
如下图:

虽然一般情况下百度云防护并不会误杀搜索引擎蜘蛛的请求,不过以防万一我们还是针对蜘蛛设置了白名单

然后进入关键功能-bot规则,对应域名开启防护

具体操作如下 :
生效路径:/*
Web SDK集成:手动集成
BOT行为识别: AI智能防护-拦截

自定义策略:
名称:gaowei 条件:IP动态情报-属于-高危IP 黑
名称:pacong 条件:IP动态情报-属于-搜过引擎 黑
名称:IDC 条件:地域情报-属于-IDC IP 黑
处置动作:拦截

Bot 特征识别
勾选 简单脚本过滤(Javascript挑战)确定。

再复制创建一条规则

生效路径:/*.html (客户网页是纯静态页或者伪静态页)
修改bot特征:开启高级bot防御 如下图:

确后点确认,我们再把验证JS代码加入到网页</head>前面
<script src=”https://sec-captcha-waf-test.bj.bcebos.com/static/wb/1.0/nox_20241203.js”></script>
<script>window.__toxCfg = {ht: 1, hc: 1};</script>
<script src=”https://sec-captcha-waf-test.bj.bcebos.com/static/wb/1.0/tox_20241203.js”></script>

这样每次请求都需要签名验证,如果没验证对的,就会拦截。
完成设置,等待查看效果。
BOT防护成功拦截

