ModelScope API Inference 使用限制详解

正文内容

文档来源：ModelScope 官方文档

什么是 API Inference？

ModelScope（魔搭社区）通过 API Inference 将开源模型服务化，通过标准化 API 接口免费提供给广大开发者体验。

⚠️ API Inference 本身是非商业化、非盈利产品。

📋 使用限制总览

限制类型	配额
每用户每日总调用次数	2,000 次
单个模型每日调用次数	500 次
大模型（如 DeepSeek-R1）每日	100 次

平台会根据实际资源利用情况进行实时动态调整。

🔧 详细使用规则

1. 账户要求

✅ 必须绑定阿里云账号
✅ 阿里云账号必须完成实名认证

未完成实名认证的用户将无法正常使用 API Inference。

2. 调用限制

每用户每日总限额：2,000 次
单个模型每日限额：500 次
并发限制：平台会根据负载动态限流，确保开发者正常单并发使用

3. 特殊模型限制

部分大型模型有更严格的限制：

模型	每日限额
deepseek-ai/DeepSeek-R1-0528	100 次
deepseek-ai/DeepSeek-V3.2-Exp	100 次

其他模型也可能随时有类似限制，请以平台实时调整为准。

4. 模型下线

随着新模型发布，旧模型会逐渐从 API Inference 中移除，移除过程中配额会逐步降低直至完全下线。

📊 如何查看配额？

可以通过 HTTP 响应头查看您的 API 调用配额：

响应头	说明	示例值
`modelscope-ratelimit-requests-limit`	用户每日总限额	2000
`modelscope-ratelimit-requests-remaining`	用户每日剩余配额	500
`modelscope-ratelimit-model-requests-limit`	当前模型每日限额	500
`modelscope-ratelimit-model-requests-remaining`	当前模型剩余配额	20

示例

curl -I https://api.modelscope.cn/v1/chat/completions \
  -H "Authorization: Bearer YOUR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"model":"qwen-plus","messages":[{"role":"user","content":"Hello"}]}'

响应头示例：

modelscope-ratelimit-requests-limit: 2000
modelscope-ratelimit-requests-remaining: 1500
modelscope-ratelimit-model-requests-limit: 500
modelscope-ratelimit-model-requests-remaining: 450

🎨 支持的模型类型

API Inference 目前支持以下类型的模型：

类型	说明
LLM	大语言模型
MLLM	多模态大模型
AIGC	文生图模型

支持的模型范围主要取决于模型在 ModelScope 社区的受欢迎程度（点赞数、下载量等）。支持 API Inference 的模型会在模型页面显示「蓝绿色闪电」图标。

⚠️ 重要提醒

请勿用于商业高并发场景
免费推理 API 由阿里云计算资源提供，不适用于需要高并发或 SLA 保障的在线任务。如有商业使用需求，建议使用商业平台的 API。
AIGC 模型额外限制
AIGC 文生图模型有额外的限流策略。如果 AIGC 模型配额用完，只要总配额未用完，仍可继续使用其他支持 API Inference 的模型。
动态调整
配额和限制可能会随时调整，请以平台实时情况为准。

ModelScope API Inference 使用限制详解

正文内容

什么是 API Inference？

📋 使用限制总览

🔧 详细使用规则

1. 账户要求

2. 调用限制

3. 特殊模型限制

4. 模型下线

📊 如何查看配额？

示例

🎨 支持的模型类型

⚠️ 重要提醒

📖 相关链接