8.1.20251201 DeepSeek 发布 V3.2 和 V3.2-Speciale 模型，强化 Agent 能力并融入思考推理

DeepSeek 发布 V3.2 和 V3.2-Speciale 模型，强化 Agent 能力并融入思考推理

DeepSeek 近日发布了 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 两款正式版模型 DeepSeek-V3.2-Speciale输出长度，适用于问答和通用 Agent 任务。DeepSeek-V3.2-Speciale 则致力于提升开源模型的推理能力，结合了 DeepSeek-Math-V2 的定理证明能力，具备指令跟随、数学证明与逻辑验证能力。

DeepSeek-V3.2 是首个将思考融入工具使用的模型，支持思考模式与非思考模式下的工具调用。该模型通过大规模 Agent 训练数据合成方法，提高了泛化能力。在智能体评测中，DeepSeek-V3.2 达到了当前开源模型的水平。

DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 已在 HuggingFace 和 ModelScope 开源。官方网页端、app 和 API 已更新为正式版 DeepSeek-V3.2。DeepSeek-V3.2-Speciale 目前以临时 API 服务形式开放，供社区评测与研究。API 更新支持了 DeepSeek-V3.2 思考模式下的工具调用能力，并增加了对 Claude Code 的支持。

推荐文章

5.1.20250816 DeepSeek (1.000)
8.0.20250822 DeepSeek V3.1：混合架构与128K上下文 (1.000)
8.1.20251023 DeepSeek开源OCR模型采用上下文光学压缩技术提升长文本处理效率 (1.000)
8.1.20260102 DeepSeek发布mHC新架构解决大模型训练不稳定问题 (1.000)
8.1.20221221 知识管理工具 (0.500)
8.1.2410 周刊V2410：渐进式阅读探索 (RANDOM - 0.500)