qwen3.5-flash

text Qwen

描述

Qwen3.5原生视觉语言系列Flash模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步；响应速度快，兼具推理速度和性能。

类型文本

模型厂商 Qwen

模型调用ID

qwen3.5-flash

上下文大小 1000000

最大输入长度 991000

最大输出长度 64000

每分钟请求数 15000

每分钟token处理数 5000000

按输入输出收费

输入基础价格 0.0001983 / 1000 tokens

输出基础价格 0.00196248 / 1000 tokens

按输入输出收费

输入基础价格 0.00078636 / 1000 tokens

输出基础价格 0.00784307 / 1000 tokens

按输入输出收费

输入基础价格 0.00117612 / 1000 tokens

输出基础价格 0.01176119 / 1000 tokens