大厂环伺、DeepSeek崛起大模型“六小虎”走向分化

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

大厂环伺、DeepSeek崛起大模型“六小虎”走向分化

2025年01月01日 11:16

作者：李明明

来源：科创板日报

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

摘要

【大厂环伺、DeepSeek崛起大模型“六小虎”走向分化】英诺天使基金合伙人、北京市前沿国际人工智能研究院理事长王晟告诉记者，“2023年没投大模型的投资人很焦虑，而2024年投了大模型的投资人更焦虑。”他表示，大模型企业耗资大，落地场景和赚钱能力未被证明，AI能力有提升空间，导致后续融资有较大不确定性。“目前多为国资投资，但国资资金也有限。”

　　临近2024年年末，大模型领域掀起新一轮融资热潮。12月23日，阶跃星辰宣布完成数亿美元B轮融资；12月17日，智谱获得新一轮30亿元融资。

　　财联社创投通-执中数据显示，2024年以来，全市场AI及大模型相关项目共发生270起投融资事件，涉及项目公司217家，参与投资机构495家，可统计到的融资金额达413.98亿元人民币。

　　其中吸金能力最强劲的，无疑是几家头部大模型项目。但随着项目估值持续走高，而商业化能力尚无里程碑节点出现，明年大模型及AI领域的发展引发行业内外关注。

　　事实上，一些投资人的态度已经发生了微妙的转向。英诺天使基金合伙人、北京市前沿国际人工智能研究院理事长王晟告诉《科创板日报》记者，“2023年没投大模型的投资人很焦虑，而2024年投了大模型的投资人更焦虑。”

　　他表示，大模型企业耗资大，落地场景和赚钱能力未被证明，AI能力有提升空间，导致后续融资有较大不确定性。“目前多为国资投资，但国资资金也有限。”

　　一位匿名投资人对《科创板日报》记者预期，明年大模型及相关企业融资难度或较大。另外能接盘的资本也非常有限，“大模型企业可能更多寻求中东等国外资本，但实际融资金额和宣传可能存在差异，比如，国资可能会有相应的一些产业落地要求等，如果达不到后期打款或许会设限。”

　　水木创投合伙人张静亦告诉记者，2025年以后很难再有同类基础模型企业进入这个赛道，新入局者很难拿到融资。未来的发展主要是基础模型和行业结合，寻找商业化落地的途径。

　　“在垂直领域有可能会率先跑出一批商业化企业，所以围绕垂直领域应用可能会出现新的机会，并且成为投资机构的关注热点。”

　　除了在融资能力上的表现分野，在业务上，经过2024一年的洗牌和分化，大模型“六小虎”也走到分水岭，有的企业坚守基础模型研发，有的则转向垂直应用领域。与此同时，厚积薄发的大厂如字节等，开始强势崛起，裹挟流量、算法等优势，从To B和to C两个领域碾压创企。

　　王晟表示，就大模型企业的发展而言，目前的几家头部创业项目，未来将面临来自大厂的更激烈的竞争。“在大模型能力方面，在海外OpenAI和Anthropic这样的Startups（创业公司）强于谷歌、苹果、Meta。而国内则是字节的豆包、阿里的通义明显强于六小虎。”

　　2024年被公认为是AI应用元年。尽管，Agent等概念引发了二级市场的巨大想象，但爆款级AI超级应用是否会出现的悬念，仍然留到了2025。

　　对此，王晟认为，如果 O3 范式（O3模型是OpenAI推出的新一代AI推理模型）能在垂类大模型上跑通，明年就非常有可能在编程和PC/手机界面操作这两个领域中产生超级 Agent。

　　大模型“六小虎”，谁来接盘？

　　据《科创板日报》记者统计，大模型“六小虎”（零一万物、MimiMax、百川智能、智谱、阶跃星辰、月之暗面），今年均获得了亿元级融资，大模型项目在一级市场吸金超过200亿元。其中，智谱、月之暗面、百川智能估值已超200亿元。

　　“吸金”能力最强的是近日深陷仲裁风波的月之暗面。2024年初，阿里投资月之暗面近8亿美元；今年8月，月之暗面再度收获大额融资，跻身估值超200亿元的国产大模型独角兽之列。

　　智谱则已经完成至少12轮融资，投资方包括北京市人工智能产业投资基金、社保基金中关村自主创新基金、美团、阿里、腾讯等多家知名投资机构。

　　百川智能则在去年7月底完成了50亿元人民币的A轮融资，投资方集齐北上深三地国资。

　　从大模型“六小虎”今年的融资情况来看，当前，选择出手大模型项目的资方出现从市场化VC转向大厂和国资系基金的趋势。

　　积极出手的国资中，北京市人工智能基金是典型代表。该基金成立仅一年，但出手频繁，目前为止共投资了超过30个项目，涵盖了北京市一众大模型产业链和具身智能企业。

　　关于接下来融资趋势，水木创投合伙人张静告诉《科创板日报》记者，政府会持续支持AI行业的发展，国资背景资金和大机构资金会持续投入，最终一定会有一到两家企业紧跟海外的对标企业，但同时国内企业的竞争将更加激烈。“基础模型是未来AI的基座，也是大家抢占的制高点，但未来可能只有一两家能够活下去。”

　　匿名投资人则对《科创板日报》记者表示，如今头部大模型企业估值被抬得很高，能够持续投资的机构只有少数。目前来看，国资还愿意持续加注，但与市场化机构纯粹关注资金回报不同，国资还有其他目标和诉求，可能涉及相关业务目标的置换，“若未来大模型发展不及预期，无法达到国资在推动产业发展等方面的诉求，那可以持续给予大模型创业项目资金支持的资方就更少了。”

　　中东资金以及海外明星风投机构或许是一个可选项。今年，中东石油巨头沙特阿美旗下Prosperity7基金就参与了智谱的融资。事实上，海外大模型独角兽的投资方中也频见中东资金的身影，如沙特投资公司Kingdom Holding、由阿联酋主权基金穆巴达拉和G42担任创始合伙人的科技投资公司MGX等。此外，软银也一向是人工智能领域的积极投资方。而众所周知，软银旗下的两只愿景基金，背后的出资方也有很大一部分来自中东。

　　上述匿名投资人也告诉《科创板日报》记者，智谱对中东资本的引进，一定程度上说明，当前市场环境下，可以承接大模型项目高估值的投资方已经不多了。“国资之后，引进中东资本的做法或许是一个方向。**”但在商业化方面，国内几大头部大模型厂商目前始终没有交出较为满意的答卷，这一波大模型融资行情也许即将见顶。

　　作为垂直大模型创企代表，深势科技创始人、CEO孙伟杰对《科创板日报》记者表示，大模型企业的钱主要烧在硬件成本上，主要包括购置和维护高性能计算设备（如GPU、TPU、CPU集群等）的费用，其次还有能源和其他。

　　“虽然过去一段时间，融资市场确实受到了来自不同方面的影响，但是大模型企业，或者说以大模型，尤其是以通用大模型为主要发力点的企业数量陡增，但是质量参差不齐。融资是一个双向，甚至多向的选择，我们坚信，只要产品好、团队好、前景好，能了解真需求解决真问题，包括资本在内的社会各界都是能够看到的。”

　　孙伟杰表示，所有大模型入局者都会面临行业竞争加剧的情况，“技术迭代缓慢或商业化受阻这两点是很多大模型公司面临的具体问题，如果不能解决好这两个问题都有可能被淘汰。”

　　在市场对大模型后续融资存疑的同时，12月30日下午，上海国投公司与徐汇区共同发布上海大模型基金。该基金重点关注基础大模型、垂类大模型，基金首关规模10亿。这被行业视为是国资对大模型领域的持续支持。

　　而在各地国资以及政府资金对大模型项目支持的背后，也有地区之间对新兴产业的抢滩与竞逐。

　　《科创板日报》记者注意到，目前大模型项目呈现出地域聚集趋势，在“六小虎”中，北京拥有4家：智谱、月之暗面、百川智能、零一万物；上海拥有两家：阶跃星辰、MiniMax。行业内甚至出现“北智谱、南阶跃”的说法。

　　有知情人士向《科创板日报》记者透露，城市之间对大模型创业企业的争夺激烈。“有城市直接放言要通过大手笔投资，将头部项目的总部招引至当地。因为大模型代表最先进的AI能力输出，也代表新质生产力，所以地方政府对此非常看重。可以说，大模型及背后资金的竞争，在某种程度上，已经上升到了城市发展战略及产业规划之争。”

　　大厂强势紧逼，新势力重新洗牌

　　业务上，“六小虎”的路线也逐渐开始洗牌和分化，开始呈现出更清晰的市场格局。

　　在“六小虎”中，领军者智谱的To B（面向企业）定位依旧明确，并跑在了行业领先的位置。同时今年以来，公司也在加大对to C市场的开拓。

　　据智谱方面向《科创板日报》记者介绍，2024年智谱业务保持高速增长，商业化收入增长超过100% ，尤其是智谱推出的MaaS开放平台 bigmodel.cn 迎来高速增长，即使在坚持API价格普惠的情况下，MaaS平台的API年收入同比增长超过30倍，日均Tokens消耗量增长150倍。目前，MaaS平台已经吸引了70万企业和开发者用户。

　　C端产品方面，智谱清言App拥有超过2500万用户，年化收入（ARR）超千万。据介绍，清言可以通过文本、图像、音频、视频来进行多模态互动，是拥有最全模态的AI助手。

　　11月29日，智谱宣布升级AutoGLM并开放内测，并将尽快上线成为面向C端用户的产品。

　　匿名投资人告诉记者，目前大模型企业的To B业务中，不少单子来自于政企项目，但目前这块竞争正在加剧，后续业务稳定性或面临考验。

　　他表示，To B业务的“代价”之一，是卷到极致的价格战。以智谱为例，其模型调用价格已降低到几近行业最低水平，如GLM-4-Flash的价格仅0.06元/百万tokens。而这种降价策略，则导致利润空间进一步被压缩。**

　　另一明星独角兽月之暗面拳头产品Kimi在C端爆火，甚至在二级市场还掀起了Kimi概念股的投资热潮。To C走到极致的月之暗面，今年初还推行了出海战略，但出海业务的发展并不如月之暗面所预期。

　　此前有接近月之暗面的知情人士对《科创板日报》记者透露，月之暗面的出海项目在今年6月就已经撤掉。“公司目前还是更聚焦于Kimi产品的开发，认为现阶段提升智能能力更重要。”为了这一目标，月之暗面还在今年8月将微软亚洲研究院前首席研究经理招至麾下。

　　To C出海成绩斐然的MiniMax，今年亦历经曲折。其旗下产品Talkie，在海外市场一直表现出色，在2024年上半年成为美国下载量第四的人工智能应用，前八个月全球下载量已达到1700万次。

　　但12月中旬，Talkie被苹果应用商店下架，直至目前在苹果应用商店Talkie仍无法被搜索到。

　　知情人士对《科创板日报》记者表示，目前，海外监管正在加强对社交类APP的审查，“Talkie可能存在违反苹果公司相关政策或海外政府的监管政策。”

　　他对记者分析，情感陪伴类APP在海外面临不健康内容等挑战，此外，尽管Talkie已经跑出了竞争优势，但其应用场景创新目前来看有所欠缺，后续也面临用户活跃度趋于平稳、新用户留存率下滑等问题。或难以支撑其目前的高估值。据公开信息，目前Minimax估值达到25亿美元，距离200亿元俱乐部仅差临门一脚。

　　不过，遭遇逆风的MiniMax在2024年也取得了多方面的进展。8月31日，其发布了基于MOE+Linear Attention的新一代模型技术。

　　百川智能作为一个通用基础模型研发商，在商业落地上，则跑出了垂类模型的趋势。

　　作为唯一专注医疗方向的大模型创业公司，百川智能聚焦AI大模型技术在医疗领域的研发和应用。据悉，Baichuan3大模型在预训练阶段构建了超千亿token的医疗数据集，涵盖医学文献、病历资料等，提升了模型在医疗领域的专业度和知识深度。

　　其依托通用医疗增强大模型打造的AI健康顾问，在2024世界人工智能大会上首次对外展示。它能像全科医生一样与用户交互，根据用户症状持续提问，综合判断病因并给出诊断结果和用药建议。

　　但对于百川智能的战略规划，上述知情人士对《科创板日报》记者表示，“目前来看，百川模型产品尚未跑出PMF，上线后情况未知，且百川如今估值较高，作为一个通用基础模型却往垂直领域发力，业务模式或难以支撑其高估值。”

　　阶跃星辰在“六小虎”中一贯低调。但从目前公布的情况来看，其技术能力不俗。截至2024年12月，已发布11款自研基座模型，涵盖千亿参数到万亿参数，从语言到多模态，从理解到生成的全方位能力。

　　在业务方面，其与金融、内容创作、智能终端等领域的众多企业展开深度合作。如与上海报业旗下界面财联社联合创办了大模型科技公司财跃星辰，推出金融行业垂直大模型Finstep和C端私人财富助理“小财神”。

　　匿名投资人对《科创板日报》记者透露，“阶跃星辰背后有来自旷视科技方面的支持，且上海方面也一直很重视这家企业。”

　　虽然零一万物与其他小虎相比较为沉寂，并经历了高管出走的动荡：其核心成员李先刚离职，返回房屋交易平台贝壳任职；此前其另一位核心成员黄文灏被确认已加入字节跳动。但是，其也在2024年取得了一些进展，其5月推出闭源模型Yi-Large；10月发布Yi-Lightning模型，在lmsys榜单上排名全球第六。

　　值得一提的是，大模型竞逐下半年陡生变局。原本显得有些不温不火的大厂开始强势发力，而看起来与人工智能关系不大的一家量化私募机构，成为了行业内外的关注焦点。

　　这家机构即是幻方量化。近期，其发布的DeepSeek V3在多项评测成绩上一举超越阿里Qwen-2.5与Meta Llama 3.1。业内有人认为，DeepSeek事实上已经可以和“六小虎”并成为“七强”。

　　大厂方面，则有近期强势崛起字节跳动旗下的豆包大模型。尽管豆包在2023年9月才姗姗来迟，但其以惊人的速度跻身全球前列：11月全球月活跃用户数（MAU）达到5998万，仅次于ChatGPT，位列全球第二。

　　豆包之所以异军突起，最大优势或是背靠大厂对流量渠道的掌控。据AppGrowing数据，2024年以来，豆包等产品已累计投放超过625万条广告，投入金额达到15亿元。

　　智源研究院副院长兼总工程师林咏华告诉《科创板日报》记者，互联网大厂大模型在技术能力上有两方面的优势。一方面，语言模型需要更多的用户使用，才能起到数据飞轮的作用，互联网大厂有很强的流量优势。

　　另一方面，文生图、文生视频方面，字节、快手的优势在于，他们本身有短视频平台，积累了相关的高质量的数据，会比其他的非互联网厂商有明显的优势。

　　面对巨头的全面进攻，大模型创企的未来面临不确定性。

　　预计2025年会出现更多新的多模态模型

　　可以看到，整个2024年，国内外都在明显加快了多模态大模型、AI助理智能体等落地的步伐。

　　AutoGLM便是智谱此前出圈的AI助理（AI Agent）。据介绍，迭代后的AutoGLM支持自主执行超过50步的长步骤操作，也可以跨APP执行任务，手机、PC、网页端均有相应版本。《科创板日报》记者从知情人士处获悉，智谱AutoGLM去年10月就已立项。

　　对于Agent今年陡然上升的热度，智谱CEO张鹏告诉《科创板日报》记者，去年Agent讨论量较少主要是模型能力还不足，效果并不理想。现在，随着技术进步和关注度的提高，软件、硬件厂商也越来越多地参与适配。因此，这两个条件的满足让Agent更有落地可行性。**

　　智源评测则发现，2024年下半年大模型发展更聚焦综合能力提升与实际应用。多模态模型发展迅速，涌现了不少新的厂商与新模型，语言模型发展相对放缓。

　　林咏华告诉《科创板日报》记者，预期2025年，基于语言模型会产生更多的Agent。围绕Agent做更复杂的AI应用和系统，也会是明年的热点之一。以及，预计会有更多新的多模态模型。

　　林咏华表示，首先，现在最优秀的语言模型已经发展了一定的基础能力，再明显的增长不是特别容易，不能只是拼更大的参数或更多的数据这条路，而是需要更多的深入创新才能提升，因此，会看到更新更大的语言模型出现的频率有所减缓，可以说现在进入了语言模型的深水区。

　　应用落地的硬件方面，近期，百度、Rokid、影目科技、亿道信息等纷纷发布AI眼镜相关产品，多家国内科技企业也宣布将在2025年1月7日至10日举行的国际消费电子产品展览会（CES2025）发布AI眼镜新品。“百镜大战”已悄然上演。机构预测，AI眼镜已成为智能穿戴市场新风口，有望引领下一代终端革命。

　　此外，在垂直模型侧（如医疗、化学、教育），国内目前也是百花齐放，孙伟杰表示，科学大模型是大模型的垂直领域应用，包括药物研发、材料科学、气候预测等方向。与通用大模型不同，科学大模型更关注领域知识与AI技术的深度结合，在特定行业中具有高附加值和强商业潜力。

　　“未来，通用大模型与垂直大模型都会共存，通用大模型仍将在数据处理、语言生成等广泛场景中占据主导地位。而科学大模型在垂直行业领域肯定会进一步细化，在科学研究、医疗、制造业等专业场景中发挥更大作用。” 孙伟杰说。

　　端侧AI也成为了不少创业企业的选择。面壁智能联合创始人、CEO李大海告诉《科创板日报》记者，“2024年下半年，行业突然形成新共识：更高知识密度的小模型和端侧智能，成为大模型发展的新阶段。”而面壁智能则从去年年底就开始转向端侧AI。

　　“如今，因为端侧智能发展的深刻影响，主流消费电子和新兴硬件正演变成一个个在不同场景、执行特定任务的超级智能体，成为新一轮科技创业大风口。”

　　王晟对《科创板日报》记者分析，当前大模型应用缺乏新计算设备（即手机、电脑之外的新设备）带来的新场景，在手机和电脑上的应用场景受限，尚未出现令人眼前一亮的原生或杀手级应用，比如新一代类似微信、拼多多、美团、字节跳动级别的应用。“目前的AI应用多是对现有业务的AI增强，但未达最理想状态。”

（文章来源：科创板日报）

文章来源：科创板日报责任编辑：6

原标题：大厂环伺、DeepSeek崛起大模型“六小虎”走向分化|2025年展望

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，