跳转到内容

防垃圾询盘

任何公开询盘表单都会被机器人攻击——每天上千条垃圾询盘塞满后台。本节讲怎么防。

类型特征危害
机器人 SEO 垃圾内容含赌博 / 色情链接销售时间被浪费
群发广告内容是其他公司服务推销通知邮件爆
测试 / 探测字段都填 “test”占用列表
恶意攻击大量提交占用资源性能下降
竞品骚扰假装客户、套你信息商业风险

多层防御——单一手段不够:

访客提交
① 蜜罐字段(隐藏字段)→ 机器人会填,人类不会
↓ 拦截 70-80%
② CAPTCHA 验证(人机识别)
↓ 拦截 80-90%
③ 频率限制(同 IP 限流)
↓ 拦截 95%
④ 关键词黑名单(特定词的拒收)
↓ 拦截 99%
⑤ 后端 AI 分类(学习真实 vs 垃圾)
↓ 拦截 99.5%

通常前 3 层就够 —— 第 4-5 层是高级。

原理:表单里加一个隐藏字段(CSS display: none)。

  • 真实用户:看不到这个字段 → 提交时为空
  • 机器人:扫描 HTML 看到字段 → 自动填上 → 暴露身份

实现:默认 BangNiCMS 已内置蜜罐——不需要运营做什么。

效果:拦截 70-80% 简单机器人。

主流方案

服务特点费用
reCAPTCHA v3(Google)无打扰,后端打分免费
hCaptcha隐私友好免费基础版
Cloudflare Turnstile速度快、隐私好免费
极验(中国)中国大陆访问稳定收费

实现

  1. 让运维注册 reCAPTCHA / hCaptcha 账号

  2. 拿到 Site Key + Secret

  3. 后台「询盘 → 表单设置 → 防垃圾」配置:

    • 服务商
    • Site Key(前端用)
    • Secret(后端用)
  4. 测试

    • 正常提交 → 应该通过
    • 机器人模拟(可用 Headless Chrome 测)→ 应该被拦
待补充截图 选服务商 + 填 SiteKey / Secret + 阈值滑块(reCAPTCHA v3 的分数线)
询盘表单的防垃圾配置面板

注意

  • reCAPTCHA v3 是后台无感 —— 用户不用点击 / 选图,提升体验
  • v2(“我不是机器人”勾选)影响转化率,不推荐

原理:同一 IP 在短时间内只能提交 N 次。

典型配置

1 分钟 ≤ 1 次
1 小时 ≤ 5 次
1 天 ≤ 20 次
超出 → 拒绝并返回错误:
"请求过于频繁,请稍后再试"

默认 BangNiCMS 已内置基础限流——更严格的策略让运维在反向代理(Nginx / Cloudflare)层加。

原理:检查询盘内容包含某些词 → 自动标”垃圾”。

典型黑名单

赌博类:casino, gambling, 博彩, 赌场, slots
色情类:porn, sex, escort, 色情
SEO 垃圾:buy backlinks, SEO services
群发推销:crypto, bitcoin, NFT, ICO
明显的测试:test, asdf, qwerty

配置

  • 后台「询盘 → 表单设置 → 关键词过滤」
  • 每行一个关键词
  • 不区分大小写

匹配策略

  • 包含即匹配 → 严格但可能误伤
  • 整词匹配 → 宽松(如 “test” 不会误伤 “the latest”)
  • 正则匹配 → 高级用法

原理:根据 IP 地理识别,拒收特定国家。

适合场景

  • 业务只服务特定地区(如只做欧美,俄罗斯 / 北朝鲜来源直接拒)
  • 高垃圾来源国(部分国家是机器人聚集地)

怎么配

  • 通过 Cloudflare Geo Block(运维配)
  • 或 BangNiCMS 询盘表单的”允许 / 拒收国家”设置

原理:用 AI 模型学习”真实询盘 vs 垃圾询盘”的特征 → 自动分类。

优势

  • 能识别新型垃圾(关键词黑名单未覆盖的)
  • 学习业务特定(你的产品询盘 vs 别的)

劣势

  • 需要训练数据(标注 100+ 真实 + 100+ 垃圾)
  • 模型维护成本

当前 BangNiCMS 不内置 —— 让开发者扩展插件实现。

每周看一次「询盘 → 状态过滤”垃圾”」:

  • 总垃圾数 / 总询盘数 = 垃圾比
  • 比例 < 30% → 防护有效
  • 比例 30-50% → 需要加强
  • 比例 > 50% → 严重,立刻补防护

学习样本

  • 看一遍最近的”垃圾”询盘
  • 找出关键词模式
  • 加到黑名单

如果防护误判真实客户为垃圾

  • 后台”垃圾”列表里仍可看到
  • 销售点 恢复 → 改为”待处理”
  • 总结特征 → 调整防护规则

防得太严会把真实客户挡掉吗?

Section titled “防得太严会把真实客户挡掉吗?”

——尤其是:

  • reCAPTCHA v3 阈值太高
  • 关键词黑名单包含常见词
  • 频率限制太严

怎么平衡

  • 每月看一次”垃圾”列表 → 找误伤
  • 逐步调整阈值(不要一次大改)
  • A/B 测试:阈值 0.5 vs 0.7,对比真实询盘数

我开了防护但还是有大量垃圾?

Section titled “我开了防护但还是有大量垃圾?”

可能:

  • 防护没真正生效(让运维测试)
  • 人工垃圾(外包人工填表的)— 这种 CAPTCHA 也挡不住

人工垃圾的应对:

  • 加更复杂的字段(如”上传公司营业执照”)
  • 内容风控(AI 分类)
  • 销售人工二次过滤

中国大陆访问 reCAPTCHA 慢怎么办?

Section titled “中国大陆访问 reCAPTCHA 慢怎么办?”

问题:reCAPTCHA 由 Google 提供,中国大陆访问有时慢 / 失败。

方案

  • 用 hCaptcha 或 Cloudflare Turnstile(中国大陆访问较稳定)
  • 用国产极验 / 腾讯防水墙
  • 让运维做地区分流:海外用 reCAPTCHA、中国大陆用极验

没有——搜索引擎爬虫不需要填询盘表单,所以防护不影响 SEO 抓取。

爬虫提交了询盘怎么办?罕见,但有时会发生:

  • Google 爬虫不会主动填表单
  • 部分恶意爬虫会 → 应该被防护拦下

我能让防护针对部分页面更严格吗?

Section titled “我能让防护针对部分页面更严格吗?”

可以——主题 / 插件层面实现。比如:

  • 首页询盘表单:基础防护
  • 高价值产品页表单:额外加 CAPTCHA + IP 限流
  • 价格表 / 资料下载页:防护更严

让开发者实现”按页面差异化”防护。