新突破！DeepSeek推出新模型 _ 东方财富网

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

新突破！DeepSeek推出新模型

2025年11月28日 07:15

来源：上海证券报

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　11月27日晚间，DeepSeek在HuggingFace推出新型数学推理模型DeepSeekMath-V2，新模型采用可自我验证的训练框架。

　　该模型基于DeepSeek-V3.2-Exp-Base构建，通过LLM验证器自动审查生成的数学证明，并利用高难度样本持续优化模型性能。在2025年国际数学奥林匹克竞赛（IMO 2025）和2024年中国数学奥林匹克竞赛（CMO 2024）中均达到金牌水平，并在2024年普特南数学竞赛（Putnam 2024）中取得118/120（近乎满分）的优异成绩。

　　团队表示，该成果验证了自验证推理路径的可行性，为构建可靠数学智能系统提供新方向。新模型代码与权重已开源，发布于Hugging Face及GitHub平台。

　　DeepSeek团队认为，大型语言模型在数学推理方面取得了显著进展。然而，追求最终答案准确性并不能解决一个关键问题：即正确的答案并不能保证正确的推理。许多数学任务如定理证明，需要严格的逐步推导，而不是数值答案。为了突破深度推理的极限，团队认为有必要验证数学推理的全面性和严谨性。

　　DeepSeekMath-V2的核心架构构建了一个自驱动的验证-生成闭环：将一个LLM作为“审稿人”担任证明验证器，另一个LLM作为“作者”负责证明生成，两者通过强化学习机制相互协作，并引入“元验证”层来有效抑制模型幻觉。

　　DeepSeek团队在论文中提及，在自主构建的91个CNML级别问题测试中，DeepSeekMath-V2展现出卓越的数学推理能力。在代数、几何、数论、组合学和不等式等所有类别中均超越了GPT-5-Thinking-High和Gemini 2.5-Pro的表现。

　　在IMO-ProofBench基准测试中，该模型同样表现优异：在基础集上，其人工评估结果优于DeepMind的DeepThink（IMO金牌水平）；在更具挑战性的高级集上，模型保持了强劲的竞争力，同时显著超越了所有其他基准模型。

　　DeepSeek团队表示，尽管仍有大量工作有待完成，但这些成果表明，自我验证的数学推理是一条可行的研究方向，这或许有助于开发功能更为强大的数学人工智能系统。

（文章来源：上海证券报）

文章来源：上海证券报责任编辑：73

原标题：新突破！DeepSeek推出新模型

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

举报

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信

沪股通

深股通

港股通(沪)

港股通(深)

热门资讯

焦点专题

猪价刷新十余年低点

视频

一键关注财经大咖

热点推荐

SpaceX IPO热度空前海内外共振可期？融资客逆势押注多股(名单)

东方财富研究中心

295 人评论 2026-06-11

扫一扫下载APP

东方财富产品

证券交易

关注东方财富

扫一扫下载APP

基金交易

关注天天基金

期货交易

信息网络传播视听节目许可证：0908328号经营证券期货业务许可证编号：913101046312860336 违法和不良信息举报:021-61278686 举报邮箱：jubao@eastmoney.com

沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号版权所有:东方财富网意见与建议:4000300059/952500

关于我们可持续发展广告服务供应商平台联系我们诚聘英才法律声明隐私保护征稿启事友情链接

亲爱的市民朋友，上海警方反诈劝阻电
话“962110”系专门针对避免您财产被
骗受损而设，请您一旦收到来电，立即
接听。