qwen3.5-flash

qwen3.5-flash

text Qwen
API文档

描述

Qwen3.5原生视觉语言系列Flash模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步;响应速度快,兼具推理速度和性能。


规格

类型 文本
模型厂商 Qwen
模型调用ID
qwen3.5-flash
上下文大小 1000000
最大输入长度 991000
最大输出长度 64000
每分钟请求数 15000
每分钟token处理数 5000000

价格

0<Token<=128K

按输入输出收费
输入基础价格 0.0001983 / 1000 tokens
输出基础价格 0.00196248 / 1000 tokens

128K<Token<=256K

按输入输出收费
输入基础价格 0.00078636 / 1000 tokens
输出基础价格 0.00784307 / 1000 tokens

256K<Token<=1M

按输入输出收费
输入基础价格 0.00117612 / 1000 tokens
输出基础价格 0.01176119 / 1000 tokens