vincent
|
4b31322be3
|
fix(BIZ-26): 限流范围收窄到 NVIDIA 网关
- 新增网关识别逻辑:只识别 nvidia / nvidiavx18088980513 为限流目标
- volcengine-plan、siliconflow、deepseek 等非 NVIDIA 网关默认不进入令牌桶
- RequestScheduler 增加 gateway/model 参数与 _should_rate_limit 判断
- 未知网关默认不限流,避免误伤其他通道
- 补充网关范围测试与使用文档说明
Co-authored-by: multica-agent <github@multica.ai>
|
2026-06-23 16:12:02 +08:00 |
|
vincent
|
7f1edfb2fd
|
feat(BIZ-26): 实现 API 请求优先级队列 + 令牌桶限流器
- 新增 scripts/rate_limiter.py 核心模块
- TokenBucket: 令牌桶限流器(40 RPM 上限)
- RequestScheduler: 四级优先级请求队列调度器
- CacheManager: 查询结果缓存(分 TTL 策略)
- retry_with_backoff: 指数退避重试装饰器
- CoordinatedPoller: COO 统一轮询器
- 新增 scripts/test_rate_limiter.py 测试套件
- 覆盖令牌桶、缓存、队列、重试、轮询、压力测试
- 所有测试通过 ✅
- 新增 docs/BIZ-26-限流器使用文档.md
- API 参考、使用示例、集成指南
- 缓存策略、降级策略、监控调试
实现参考:plans/BIZ-13_运行稳定性保障方案.md
Co-authored-by: multica-agent <github@multica.ai>
|
2026-06-23 07:09:39 +08:00 |
|
vincent
|
dc00661a34
|
BIZ-17: QMD和Wiki工具链测试报告与检索指南
- docs/qmd-verification-report.md: QMD功能验证(技能可用,CLI需修复Node.js原生模块兼容性)
- docs/wiki-toolchain-test-report.md: Wiki 5工具完整测试(4通过/1需注意前置条件)
- docs/agent-kb-retrieval-guide.md: Agent知识库检索决策指南(含工具选择/查询构造/缺口上报)
- scripts/wiki-lint-check.sh: Wiki质量自动化检查脚本
Co-authored-by: multica-agent <github@multica.ai>
|
2026-06-22 20:20:59 +08:00 |
|