用量管理功能可帮助你保障已部署项目的服务稳定性、安全性并控制成本。通过设置请求速率上限、项目预算和开启 DDoS 防护,你可以有效拦截恶意流量、避免预期外的积分消耗,确保服务在安全、可控的范围内高效运行。
执行以下操作:
在扣子编程左侧导航栏选择项目管理,筛选带有 New 标签的项目,单击目标项目。
在 AI 编程开发界面,在右侧单击➕打开新的标签页,在弹出的标签页中选择部署。
在用量管理页签中,设置限流和用量策略,并单击保存配置。
说明
设置项目的 QPM、QPS 等速率限制,防止爬虫或恶意刷量。默认未开启用量管理,如需开启,打开模块右侧的开关,填写数值后保存即可生效。
|
限制项 |
说明 |
配置方式 |
|---|---|---|
|
请求速率上限 |
控制项目线上访问的 QPM(每分钟请求数)和 QPS(每秒请求数),防止恶意流量攻击导致服务中断或资损。 |
|
|
AI 模型接口速率上限 |
AI 模型接口按积分计费,建议设置速率限制,避免积分被快速消耗。建议模型 Token 消耗较多的项目按需开启,例如提供生图、生视频的项目。 |
设置模型接口的 QPS,对当前项目的每个模型均生效,不支持针对某个模型单独设置 QPS。 |
|
项目积分预算上限 |
限制本项目每月消耗的积分上限,防止超出预算。达到阈值时通过站内信和短信通知,分别在 50%、75%、100% 时触发。
|
|
自动识别并拦截异常高频请求、慢速攻击,防止恶意流量攻击导致服务中断或资损,目前支持设置 DDos 防护策略。
自动识别并拦截异常高频请求与慢速攻击,防止服务不可用或积分被恶意消耗。由平台自动处理,无需配置规则。你可以实时查看当前的防护状态、今日已拦截的请求数。
此外,你也可以设置 DDos 防护的 IP 白名单。白名单内的 IP 不受 DDos 拦截限制,适用于内部系统、可信服务调用场景,例如办公网络、CI/CD服务器、合作伙伴IP第。支持单个 IP 和 CIDR 网段。