qwen-flash

qwen-flash

text Qwen
API文档

描述

Qwen3系列Flash模型,实现思考模式和非思考模式的有效融合,可在对话中切换模式。复杂推理类任务性能优秀,指令遵循、文本理解等能力显著提高。支持1M上下文长度,按照上下文长度进行阶梯计费。


规格

类型 文本
模型厂商 Qwen
模型调用ID
qwen-flash
上下文大小 1000000
最大输入长度 995000
最大输出长度 32000
每分钟请求数 600
每分钟token处理数 5000000

价格

0<Token<=128K

按输入输出收费
输入基础价格 0.00015043 / 1000 tokens
输出基础价格 0.00147699 / 1000 tokens

256K<Token<=1M

按输入输出收费
输入基础价格 0.00118296 / 1000 tokens
输出基础价格 0.01176803 / 1000 tokens

128K<Token<=256K

按输入输出收费
输入基础价格 0.0005949 / 1000 tokens
输出基础价格 0.00588743 / 1000 tokens