跳到主要内容

IPFlex

技术教程

代理总被封?一篇讲清楚封禁率怎么降(附可执行参数)

很多团队不是代理不够贵,而是请求行为太像机器。本文从真实业务场景出发,给出封禁率优化的可执行参数和排障顺序。

很多团队第一次做数据采集时,都会遇到同一个问题:

  • 代理池看起来很大
  • 请求也跑起来了
  • 结果三天后封禁率一路上升,业务直接不可用

最后得出的错误结论是:“是不是代理质量不行?”

实际上,大多数情况下,真正的问题不是“有没有代理”,而是请求行为太容易被识别

这篇文章不讲空话,只讲你今天就能执行的优化方法。


先判断:你遇到的是哪种“被封”

先别急着换供应商,先把错误类型分开看。

1)硬封禁(403 / 429 急剧上升)

典型表现:

  • 某个接口突然几乎全红
  • 重试也无效
  • 同一批 IP 快速失效

这通常是并发和节奏问题,或者风控命中阈值。

2)软封禁(验证码比例上升)

典型表现:

  • 请求还能成功,但成功率持续下滑
  • 页面开始频繁出现 challenge
  • 某些地区明显比别的地区更容易触发

这是“即将全面被封”的前兆,越早处理越省成本。

3)会话失效(登录/账号链路先挂)

典型表现:

  • 公开页还能抓
  • 登录态接口、购物车、账户页先掉

这通常是你把“该粘性会话”的流量做成了“每请求换IP”。


常见误区(90% 团队至少中一个)

误区 A:每个请求都换 IP 一定更安全

错。对登录链路来说,这通常更危险。

因为服务端会看到同一账号在很短时间里跨多个 IP 切换,风险分直接拉满。

误区 B:并发拉高再说,封了再降

错。你看到“速度快”的那几小时,可能是在透支可用窗口。

误区 C:把所有流量都丢给同一种代理

错。不同流量风险不同,应该做池子分层,而不是一锅煮。


一套能落地的优化顺序(建议按这个顺序做)

下面这套顺序是为了让你在不大改系统的情况下,先把封禁率拉下来。

第一步:先把流量分层

至少拆成两类:

  • 高风险链路:登录、账号、结算、个人化页面
    • 用:住宅代理(建议粘性会话)
  • 低风险链路:公开列表、公开详情、静态资源
    • 用:数据中心代理(可控并发)

这一步做完,通常就能先止血一部分。

第二步:把“轮换策略”从按请求改成按会话目标

建议:

  • 登录/账号流程:5~20 分钟粘性会话
  • 列表抓取流程:按批次轮换(例如 20~50 请求后换)

不要用“一刀切每请求换IP”。

第三步:调并发,不调“总请求数”

很多人只看 QPS,不看“每域名并发”。

先设一个安全初值:

  • 每目标域名并发:3~8(按站点强度)
  • 每IP并发:1~3

先稳 24 小时,再逐步加,不要一次拉满。

第四步:加随机抖动(Jitter)

哪怕你总请求量不高,固定节奏也很容易被识别。

可执行建议:

  • 请求间隔基础值:800ms ~ 2500ms
  • 抖动范围:±30%

例如:base=1200ms, jitter=0.3,实际每次随机 840~1560ms。

第五步:把监控指标补齐(至少四个)

每 5 分钟采样:

  1. 成功率(2xx)
  2. 封禁率(403/429)
  3. 验证码率(challenge)
  4. P95 延迟

如果你现在只看“成功/失败”,你会错过验证码率这个关键预警信号。


一组可直接参考的阈值

指标健康预警严重
成功率> 92%85% ~ 92%< 85%
封禁率(403/429)< 4%4% ~ 8%> 8%
验证码率< 3%3% ~ 7%> 7%
P95 延迟< 2.5s2.5s ~ 4s> 4s

当进入“严重区间”,建议自动触发

  • 全局并发下调 30%
  • 高风险链路切到住宅粘性会话
  • 重试次数从 3 次降到 1~2 次(防止放大异常)
  • 启动 15 分钟冷却窗口

一个可复用的排障流程

假设你今天看到封禁率从 3% 涨到 11%,怎么排?

  1. 先看是否全站上升还是只某些接口上升
  2. 如果是账号链路先涨,优先检查会话策略(是不是换 IP 太频繁)
  3. 如果是公开页也一起涨,优先降每域名并发和节奏
  4. 看验证码率是否先于 403 上升(如果是,说明风控在预热)
  5. 切流:高风险走住宅,低风险走数据中心
  6. 观察 2 个采样周期(10 分钟)再决定下一步

重点是:先止损,再优化。别在高压状态下同时改 10 个参数。


你可能会问

Q1:是不是代理越贵越不容易被封?

不绝对。高质量代理是基础,但行为模型同样关键。

Q2:数据中心代理是不是一定不行?

不是。低风险、批量、成本敏感场景里,数据中心代理很有优势。

Q3:什么时候必须上住宅代理?

账号/登录链路、强反爬目标站、对地理真实性要求高的场景。


最后给一个务实建议

如果你现在已经在“高封禁率 + 高成本”状态,不要再追求“立刻翻倍吞吐”。

先把这三件事做对:

  1. 流量分层(住宅 vs 数据中心)
  2. 会话策略(粘性 vs 轮换)
  3. 监控与阈值(验证码率必须单独看)

把封禁率从 10% 拉回 4% 以下,通常比你盲目扩 IP 池更省钱,也更稳。


进一步优化可继续建立“代理类型选型决策表”,按业务目标、风险等级和预算区间,匹配静态住宅、动态住宅与数据中心代理方案。

返回博客

合作伙伴