防垃圾询盘
任何公开询盘表单都会被机器人攻击——每天上千条垃圾询盘塞满后台。本节讲怎么防。
垃圾询盘的种类
Section titled “垃圾询盘的种类”| 类型 | 特征 | 危害 |
|---|---|---|
| 机器人 SEO 垃圾 | 内容含赌博 / 色情链接 | 销售时间被浪费 |
| 群发广告 | 内容是其他公司服务推销 | 通知邮件爆 |
| 测试 / 探测 | 字段都填 “test” | 占用列表 |
| 恶意攻击 | 大量提交占用资源 | 性能下降 |
| 竞品骚扰 | 假装客户、套你信息 | 商业风险 |
多层防御——单一手段不够:
访客提交 ↓① 蜜罐字段(隐藏字段)→ 机器人会填,人类不会 ↓ 拦截 70-80%② CAPTCHA 验证(人机识别) ↓ 拦截 80-90%③ 频率限制(同 IP 限流) ↓ 拦截 95%④ 关键词黑名单(特定词的拒收) ↓ 拦截 99%⑤ 后端 AI 分类(学习真实 vs 垃圾) ↓ 拦截 99.5%通常前 3 层就够 —— 第 4-5 层是高级。
1. 蜜罐字段
Section titled “1. 蜜罐字段”原理:表单里加一个隐藏字段(CSS display: none)。
- 真实用户:看不到这个字段 → 提交时为空
- 机器人:扫描 HTML 看到字段 → 自动填上 → 暴露身份
实现:默认 BangNiCMS 已内置蜜罐——不需要运营做什么。
效果:拦截 70-80% 简单机器人。
2. CAPTCHA / hCaptcha
Section titled “2. CAPTCHA / hCaptcha”主流方案:
| 服务 | 特点 | 费用 |
|---|---|---|
| reCAPTCHA v3(Google) | 无打扰,后端打分 | 免费 |
| hCaptcha | 隐私友好 | 免费基础版 |
| Cloudflare Turnstile | 速度快、隐私好 | 免费 |
| 极验(中国) | 中国大陆访问稳定 | 收费 |
实现:
-
让运维注册 reCAPTCHA / hCaptcha 账号
-
拿到 Site Key + Secret
-
后台「询盘 → 表单设置 → 防垃圾」配置:
- 服务商
- Site Key(前端用)
- Secret(后端用)
-
测试:
- 正常提交 → 应该通过
- 机器人模拟(可用 Headless Chrome 测)→ 应该被拦
待补充截图 选服务商 + 填 SiteKey / Secret + 阈值滑块(reCAPTCHA v3 的分数线)
注意:
- reCAPTCHA v3 是后台无感 —— 用户不用点击 / 选图,提升体验
- v2(“我不是机器人”勾选)影响转化率,不推荐
3. 频率限制
Section titled “3. 频率限制”原理:同一 IP 在短时间内只能提交 N 次。
典型配置:
1 分钟 ≤ 1 次1 小时 ≤ 5 次1 天 ≤ 20 次
超出 → 拒绝并返回错误:"请求过于频繁,请稍后再试"默认 BangNiCMS 已内置基础限流——更严格的策略让运维在反向代理(Nginx / Cloudflare)层加。
4. 关键词黑名单
Section titled “4. 关键词黑名单”原理:检查询盘内容包含某些词 → 自动标”垃圾”。
典型黑名单:
赌博类:casino, gambling, 博彩, 赌场, slots色情类:porn, sex, escort, 色情SEO 垃圾:buy backlinks, SEO services群发推销:crypto, bitcoin, NFT, ICO明显的测试:test, asdf, qwerty配置:
- 后台「询盘 → 表单设置 → 关键词过滤」
- 每行一个关键词
- 不区分大小写
匹配策略:
- 包含即匹配 → 严格但可能误伤
- 整词匹配 → 宽松(如 “test” 不会误伤 “the latest”)
- 正则匹配 → 高级用法
5. 国家 / 地区拒收
Section titled “5. 国家 / 地区拒收”原理:根据 IP 地理识别,拒收特定国家。
适合场景:
- 业务只服务特定地区(如只做欧美,俄罗斯 / 北朝鲜来源直接拒)
- 高垃圾来源国(部分国家是机器人聚集地)
怎么配:
- 通过 Cloudflare Geo Block(运维配)
- 或 BangNiCMS 询盘表单的”允许 / 拒收国家”设置
后端 AI 分类(高级)
Section titled “后端 AI 分类(高级)”原理:用 AI 模型学习”真实询盘 vs 垃圾询盘”的特征 → 自动分类。
优势:
- 能识别新型垃圾(关键词黑名单未覆盖的)
- 学习业务特定(你的产品询盘 vs 别的)
劣势:
- 需要训练数据(标注 100+ 真实 + 100+ 垃圾)
- 模型维护成本
当前 BangNiCMS 不内置 —— 让开发者扩展插件实现。
监控 + 优化
Section titled “监控 + 优化”每周看一次「询盘 → 状态过滤”垃圾”」:
- 总垃圾数 / 总询盘数 = 垃圾比
- 比例 < 30% → 防护有效
- 比例 30-50% → 需要加强
- 比例 > 50% → 严重,立刻补防护
学习样本:
- 看一遍最近的”垃圾”询盘
- 找出关键词模式
- 加到黑名单
如果防护误判真实客户为垃圾:
- 后台”垃圾”列表里仍可看到
- 销售点 恢复 → 改为”待处理”
- 总结特征 → 调整防护规则
防得太严会把真实客户挡掉吗?
Section titled “防得太严会把真实客户挡掉吗?”会——尤其是:
- reCAPTCHA v3 阈值太高
- 关键词黑名单包含常见词
- 频率限制太严
怎么平衡:
- 每月看一次”垃圾”列表 → 找误伤
- 逐步调整阈值(不要一次大改)
- A/B 测试:阈值 0.5 vs 0.7,对比真实询盘数
我开了防护但还是有大量垃圾?
Section titled “我开了防护但还是有大量垃圾?”可能:
- 防护没真正生效(让运维测试)
- 是人工垃圾(外包人工填表的)— 这种 CAPTCHA 也挡不住
人工垃圾的应对:
- 加更复杂的字段(如”上传公司营业执照”)
- 内容风控(AI 分类)
- 销售人工二次过滤
中国大陆访问 reCAPTCHA 慢怎么办?
Section titled “中国大陆访问 reCAPTCHA 慢怎么办?”问题:reCAPTCHA 由 Google 提供,中国大陆访问有时慢 / 失败。
方案:
- 用 hCaptcha 或 Cloudflare Turnstile(中国大陆访问较稳定)
- 用国产极验 / 腾讯防水墙
- 让运维做地区分流:海外用 reCAPTCHA、中国大陆用极验
防护对 SEO 有影响吗?
Section titled “防护对 SEO 有影响吗?”没有——搜索引擎爬虫不需要填询盘表单,所以防护不影响 SEO 抓取。
但爬虫提交了询盘怎么办?罕见,但有时会发生:
- Google 爬虫不会主动填表单
- 部分恶意爬虫会 → 应该被防护拦下
我能让防护针对部分页面更严格吗?
Section titled “我能让防护针对部分页面更严格吗?”可以——主题 / 插件层面实现。比如:
- 首页询盘表单:基础防护
- 高价值产品页表单:额外加 CAPTCHA + IP 限流
- 价格表 / 资料下载页:防护更严
让开发者实现”按页面差异化”防护。