ModelScope API Inference 使用限制详解
正文内容
文档来源:ModelScope 官方文档
什么是 API Inference?
ModelScope(魔搭社区)通过 API Inference 将开源模型服务化,通过标准化 API 接口免费提供给广大开发者体验。
⚠️ API Inference 本身是非商业化、非盈利产品。
📋 使用限制总览
| 限制类型 | 配额 |
|---|---|
| 每用户每日总调用次数 | 2,000 次 |
| 单个模型每日调用次数 | 500 次 |
| 大模型(如 DeepSeek-R1)每日 | 100 次 |
平台会根据实际资源利用情况进行实时动态调整。
🔧 详细使用规则
1. 账户要求
- ✅ 必须绑定阿里云账号
- ✅ 阿里云账号必须完成实名认证
未完成实名认证的用户将无法正常使用 API Inference。
2. 调用限制
- 每用户每日总限额:2,000 次
- 单个模型每日限额:500 次
- 并发限制:平台会根据负载动态限流,确保开发者正常单并发使用
3. 特殊模型限制
部分大型模型有更严格的限制:
| 模型 | 每日限额 |
|---|---|
| deepseek-ai/DeepSeek-R1-0528 | 100 次 |
| deepseek-ai/DeepSeek-V3.2-Exp | 100 次 |
其他模型也可能随时有类似限制,请以平台实时调整为准。
4. 模型下线
随着新模型发布,旧模型会逐渐从 API Inference 中移除,移除过程中配额会逐步降低直至完全下线。
📊 如何查看配额?
可以通过 HTTP 响应头查看您的 API 调用配额:
| 响应头 | 说明 | 示例值 |
|---|---|---|
modelscope-ratelimit-requests-limit |
用户每日总限额 | 2000 |
modelscope-ratelimit-requests-remaining |
用户每日剩余配额 | 500 |
modelscope-ratelimit-model-requests-limit |
当前模型每日限额 | 500 |
modelscope-ratelimit-model-requests-remaining |
当前模型剩余配额 | 20 |
示例
1 | curl -I https://api.modelscope.cn/v1/chat/completions \ |
响应头示例:
1 | modelscope-ratelimit-requests-limit: 2000 |
🎨 支持的模型类型
API Inference 目前支持以下类型的模型:
| 类型 | 说明 |
|---|---|
| LLM | 大语言模型 |
| MLLM | 多模态大模型 |
| AIGC | 文生图模型 |
支持的模型范围主要取决于模型在 ModelScope 社区的受欢迎程度(点赞数、下载量等)。支持 API Inference 的模型会在模型页面显示「蓝绿色闪电」图标。
⚠️ 重要提醒
请勿用于商业高并发场景
免费推理 API 由阿里云计算资源提供,不适用于需要高并发或 SLA 保障的在线任务。如有商业使用需求,建议使用商业平台的 API。AIGC 模型额外限制
AIGC 文生图模型有额外的限流策略。如果 AIGC 模型配额用完,只要总配额未用完,仍可继续使用其他支持 API Inference 的模型。动态调整
配额和限制可能会随时调整,请以平台实时情况为准。
📖 相关链接
- Title: ModelScope API Inference 使用限制详解
- Author: 清夏晚风
- Created at : 2026-04-02 18:35:49
- Updated at : 2026-05-29 14:43:35
- Link: https://blog.yuil.cn/2026/04/02/AI相关工具/API平台/魔搭社区(ModelScope)/ModelScope API Inference 使用限制详解/
- License: This work is licensed under CC BY-NC-SA 4.0.
Comments