DeepSeek点燃开源模型“星星之火” “百模大战”走向何方?
2025年02月07日 22:01
作者: 钱童心
来源: 第一财经
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  中国人工智能初创公司DeepSeek彻底燃起了开源模型的“星星之火”。当地时间2月6日,英伟达投资的法国AI初创公司Mistral AI宣布推出一项用于生成式AI软件的新应用,该应用能将AI聊天的响应速度提高至每秒1000个单词。

  这是Mistral AI应对新一轮AI模型竞赛的最新举措。Mistral AI联合创始人兼CEO Arthur Mensch表示,DeepSeek的火爆在他的意料之中,这也受益于Mistral AI的开源技术。

  市场已经开始酝酿下一个“DeepSeek”,有分析人士预计,未来改变游戏规则的力量仍有可能来自中国。而DeepSeek如何重塑中国“百模大战”的格局也引发关注。

  DeepSeek重塑AI竞赛

  法国Mistral AI的开源模型应用程序Le Chat对标的是OpenAI的ChatGPT。“欧洲提供AI模型的替代方案很重要,我们有尖端技术。”Mensch表示,“我们的最终目标是让人工智能更加开放,让每个人都能更容易获得。”

  Mistral AI两年前于法国成立,目前估值约为60亿美元,这与OpenAI上千亿美元的估值相去甚远。但Mistral AI是欧洲最知名的AI大模型初创公司。

  2月10日,巴黎即将举行AI峰会,DeepSeek预计也将成为此次峰会热议的焦点。Mensch在巴黎AI峰会前表示,他非常了解DeepSeek,对其最新的创新技术并不感到惊讶。“DeepSeek是我们一直在等待的。”他说道,“每当有新的开源技术出现时,Mistral也会从中受益。”

  DeepSeek也重塑了由算力堆积作为AI竞赛核心战场的格局。贝恩公司在最新发布的一份关于DeepSeek的深度解读报告中写道:“DeepSeek的模型可能不会对现有的AI企业构成生存威胁,但它凸显了AI成本的快速下降。企业应该为AI推理成本显著降低做好规划,从而实现AI在更广泛领域的应用,迎接新的竞争态势。”

  从市场反应来看,A股大部分大模型参与企业本周受到DeepSeek概念的提振,一些券商认为DeepSeek将带动中国整个科创行业在资本市场的表现,从而扭转中国股市的低迷。

  德意志银行分析师Peter Milliken在2月5日发布的一份题为“中国技术吞噬世界”的报告中写道:“我们认为,2025年将是投资界意识到中国技术正在超越世界其他国家的一年,投资者在中期内必须大幅转向中国。”

  而市场正在酝酿颠覆全球人工智能行业的下一个“DeepSeek”,有分析师认为,下一个“游戏规则的改变者”仍很有可能来自中国。

  “中国已经培育了多家前景光明的AI初创公司和项目,包括阿里巴巴百度、腾讯在内的中国互联网公司花费了数年时间,投资并开发基础设施来支持这些新企业。DeepSeek只是一个开始,它提供了一个思路。”前奥纬咨询一位科技行业合伙人对第一财经记者说道。

  “百模大战”终极比拼靠什么?

  在美国,科技巨头仍在大力推动算力基础设施建设。作为对DeepSeek的回应,谷歌、OpenAI也都发布了更强大的AI模型,并开始朝着开源的方向转变。而在国内,AI模型的竞争则是更快地向应用层面推进,以更低的成本加速大模型落地将成为趋势。

  科大讯飞董事长刘庆峰上个月在公司的一场内部年会演讲中表示:“AI模型的应用场景落地现在已经到了红利兑现期,红利兑现的根本是什么?就是有没有本事用更少的成本,更低的算力和更高的效率推动落地。”

  刘庆峰说道,去年年底,就有一些观点认为“大模型的底座训练已经基本到头了,现在是做底层落地应用的时候”。尽管如此,我们仍然看到大模型底座的持续发展以及源头技术和平台创新的核心要素向前推动。

  已经有一些中国AI初创企业发布了与DeepSeek类似的模型。例如月之暗面最新的AI模型版本利用强化学习来加速和扩展训练过程,这与DeepSeek的R1推理模型工作原理类似,使用思维链方法来查找和完善查询的答案。

  创新工场董事长李开复创立的零一万物也声称该公司的Yi-Lightning专家混合模型(MoE)的训练成本远低于行业其他领先企业,在商业化服务方面走得最远。上个月初,零一万物宣布与阿里云达成模型平台业务的战略合作。

  “DeepSeek一定会加速头部大模型竞争格局的形成,公域入口流量更为集中,DeepSeek已经迅速崛起为公域第一,豆包紧随其后,阿里、百度、kimi等也都在迎头赶上。”一位科技投资人对第一财经记者表示。

  星展银行中国策略师邓志坚向第一财经记者分析称:“DeepSeek被高度关注,主要是它通过技术和开源让成本下降,从而使与它合作的企业获得低成本、高效率的AI应用。从这个角度来说,它迈出了开源模型成功的第一步。”

  邓志坚认为,对于大模型的商业化而言,从基础模型到后面的应用端还有很长的“长尾效应”,这将不仅仅涉及技术突破问题,而是科技需求提升后,企业必须要以实用性为发展目标,才能最终获得变现的能力。

  “从投资的角度来看,我认为虽然整个行业是看好的,但由于技术创新和迭代特别快,所以可能有些企业可能一骑绝尘,但也有些企业可能会被淘汰。最终拥有核心技术的企业,可能在资本市场上会受益更多。”他表示。

(文章来源:第一财经)

文章来源:第一财经 责任编辑:137
原标题:DeepSeek点燃开源模型“星星之火”,“百模大战”走向何方?
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500