模型档案

DeepSeek: DeepSeek V3.2

现 #8reasoning

deepseek/deepseek-v3.2 · 厂商 DeepSeek

DeepSeek-V3.2 是一个大型语言模型，旨在协调高计算效率与强大的推理和智能体工具使用性能。它引入了 DeepSeek Sparse Attention (DSA)，一种细粒度稀疏注意力机制，可降低训练和推理成本，同时在长上下文场景中保持质量。一个可扩展的强化学习后训练框架进一步提升了推理能力，据报道其性能达到 GPT-5 级别，该模型在 2025 年 IMO 和 IOI 上展示了金牌级的结果。V3.2 还使用大规模智能体任务合成流水线，将推理更好地融入工具使用场景，提升了交互环境中的遵从性和泛化能力。用户可以通过 `reasoning` `enabled` 布尔值控制推理行为。[在文档中了解更多](https://openrouter.ai/docs/use-cases/reasoning-tokens#enable-reasoning-with-default-config)

输入价 / M token

$0.25

输出价 / M token

$0.38

上下文窗口

131K

tokens

本周 tokens

693.60B

综合榜

能力

输入模态

text

输出模态

text

← 返回总榜