DeepSeek 发布 V3.2 和 V3.2-Speciale 模型,强化 Agent 能力并融入思考推理
DeepSeek 近日发布了 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 两款正式版模型 DeepSeek-V3.2-Speciale输出长度,适用于问答和通用 Agent 任务。DeepSeek-V3.2-Speciale 则致力于提升开源模型的推理能力,结合了 DeepSeek-Math-V2 的定理证明能力,具备指令跟随、数学证明与逻辑验证能力。
DeepSeek-V3.2 是首个将思考融入工具使用的模型,支持思考模式与非思考模式下的工具调用。该模型通过大规模 Agent 训练数据合成方法,提高了泛化能力。在智能体评测中,DeepSeek-V3.2 达到了当前开源模型的水平。
DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 已在 HuggingFace 和 ModelScope 开源。官方网页端、app 和 API 已更新为正式版 DeepSeek-V3.2。DeepSeek-V3.2-Speciale 目前以临时 API 服务形式开放,供社区评测与研究。API 更新支持了 DeepSeek-V3.2 思考模式下的工具调用能力,并增加了对 Claude Code 的支持。
推荐文章
- 5.1.20250816 DeepSeek (1.000)
- 3.1.20250720 梁文锋 (1.000)
- 8.0.20250822 DeepSeek V3.1:混合架构与128K上下文 (1.000)
- 8.1.20251023 DeepSeek开源OCR模型采用上下文光学压缩技术提升长文本处理效率 (1.000)
- 1.0.20250803 行业-知识管理工具 (0.500)
- 8.1.20250917 黄仁勋的成功哲学 (RANDOM - 0.500)