qwen-flash
text
Qwen
描述
Qwen3系列Flash模型,实现思考模式和非思考模式的有效融合,可在对话中切换模式。复杂推理类任务性能优秀,指令遵循、文本理解等能力显著提高。支持1M上下文长度,按照上下文长度进行阶梯计费。
规格
类型
文本
模型厂商
Qwen
模型调用ID
qwen-flash
上下文大小
1000000
最大输入长度
995000
最大输出长度
32000
每分钟请求数
600
每分钟token处理数
5000000
价格
0<Token<=128K
按输入输出收费
输入基础价格
0.00015043 / 1000 tokens
输出基础价格
0.00147699 / 1000 tokens
256K<Token<=1M
按输入输出收费
输入基础价格
0.00118296 / 1000 tokens
输出基础价格
0.01176803 / 1000 tokens
128K<Token<=256K
按输入输出收费
输入基础价格
0.0005949 / 1000 tokens
输出基础价格
0.00588743 / 1000 tokens