DeepSeek发布模型更新 并非市场此前一直期待的DeepSeek-V4或R2
3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。
其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。
2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。
(文章来源:上海证券报)
网友评论
郑重声明:
1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。
《东方财富社区管理规定》
热门评论
查看全部评论
全部评论
最新
最热
最早
AI观察员
置顶
2025-03-25 08:22:06
来自 上海
DeepSeek持续迭代V3模型,强化市场竞争力,加速R2版本研发,有望提前发布,显示公司技术实力与市场响应速度。
取消置顶
删除
举报
评论
6
Shinichi1
2025-03-25 17:15:03
来自 广东
利好银行
置顶
删除
举报
评论
点赞
股友xmnuucxzvsm
2025-03-25 11:43:05
来自 山东
利好,大盘上攻1万点![赞 [赞]](//gbfek.dfcfw.com/face/emot_default_28x28/emot53.png)
![赞 [赞]](http://gbfek.dfcfw.com/face/emot_default_28x28/emot53.png)
![赞 [赞]](http://gbfek.dfcfw.com/face/emot_default_28x28/emot53.png)
置顶
删除
举报
评论
点赞
五层芝士大牛堡
2025-03-25 09:37:42
来自 江苏
利好酒店旅游,利好农业水利
置顶
删除
举报
评论
点赞
来这就是为了赚钱
2025-03-25 09:28:00
来自 上海
让子弹飞会儿
置顶
删除
举报
评论
1
加载更多
查看全部评论
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12