模型档案
DeepSeek: DeepSeek V3.2
现 #8reasoningdeepseek/deepseek-v3.2 · 厂商 DeepSeek
DeepSeek-V3.2 是一个大型语言模型,旨在协调高计算效率与强大的推理和智能体工具使用性能。它引入了 DeepSeek Sparse Attention (DSA),一种细粒度稀疏注意力机制,可降低训练和推理成本,同时在长上下文场景中保持质量。一个可扩展的强化学习后训练框架进一步提升了推理能力,据报道其性能达到 GPT-5 级别,该模型在 2025 年 IMO 和 IOI 上展示了金牌级的结果。V3.2 还使用大规模智能体任务合成流水线,将推理更好地融入工具使用场景,提升了交互环境中的遵从性和泛化能力。 用户可以通过 `reasoning` `enabled` 布尔值控制推理行为。[在文档中了解更多](https://openrouter.ai/docs/use-cases/reasoning-tokens#enable-reasoning-with-default-config)
输入价 / M token
$0.25
输出价 / M token
$0.38
上下文窗口
131K
tokens
本周 tokens
693.60B
综合榜
能力
输入模态
text
输出模态
text