智源研究院林咏华：多模态模型需求旺盛，但基础能力仍有提升空间

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

智源研究院林咏华：多模态模型需求旺盛，但基础能力仍有提升空间

2024年12月22日 13:57

来源： 21世纪经济报道

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　21世纪经济报道记者雷晨北京报道

　　今年下半年以来，大模型经历了残酷的淘汰赛，少数用户活跃度高的大模型脱颖而出，进入决赛圈。与此同时，各界对于这些模型的性能表现、发展潜力等方面的关注与日俱增。

　　近期，北京智源人工智能研究院（简称：智源研究院）发布并解读了国内外100余个大模型的综合及专项评测结果，涵盖语言、视觉语言、文生图、文生视频、语音语言等多个领域。

　　围绕大模型发展趋势、行业现状及相关热点问题，智源研究院副院长兼总工程师林咏华与21世纪经济报道等媒体进行了一场深度对话，从专业视角对大模型的发展趋势、行业现状以及相关热点问题进行剖析。

　　互联网大厂优势明显，模型发展仍具潜力

　　林咏华指出，互联网大厂在大模型领域具有显著优势。在语言模型方面，凭借强大的流量优势，大厂能获取更多用户反馈，推动数据飞轮，在主观评测中表现良好。例如字节、快手等公司，在文生图、文生视频领域，因自身短视频平台积累的高质量数据而领先于非互联网厂商。

　　针对前OpenAI联合创始人、SSI创始人Ilya提出的预训练停滞观点，林咏华予以反驳。她表示，当前互联网存在数据孤岛现象，大量数据未被充分利用，中文数据在全球占比下降，但使用中文上网人数未变。同时，海量视频数据也有待挖掘，以促进模型对世界的认知学习，大模型发展仍有巨大潜力。

　　模型发展态势分化，多模态潜力凸显

　　智源评测结果显示，2024年下半年大模型发展呈现新趋势：多模态模型发展迅速，新厂商与新模型不断涌现，在K12学科测试中，融合语言和视觉的多模态模型表现出色，其理解和推理能力更强。语言模型发展则相对放缓，开源的第一梯队模型已达到较高水平，继续提升需更多创新，模型尺寸出现两极分化，除大型稠密模型外，7B或以下小模型下载量也较高。

　　林咏华认为，多模态模型需求旺盛，但基础能力仍有提升空间，预计2025年将有更多新模型出现。对于资金不强但创新能力足的团队，可在多模态模型的拼接、预处理、后处理、学习方式等方面进行创新。

　　AI应用趋势明确，算力需求将提升

　　林咏华还对AI应用趋势进行了展望。她表示，2024年语言模型基础能力提升，推动了复杂应用发展，2025年基于语言模型的Agent将成为热点，用于构建更复杂的AI应用和系统。文生图、文生视频应用也将在2025年迎来发展，VLM多模态模型在企业的落地场景广泛，未来需提升基础能力以形成新应用。

　　随着模型发展，对算力需求也将变化。林咏华提到，端侧模型正在发力，未来端云结合将成趋势，小模型和大模型将分别承担不同工作，以平衡资源消耗与效率提升。

　　开源生态持续发展，国内外差距仍存

　　在模型开源生态方面，除了坚定开源的机构外，新的开源贡献者不断出现。林咏华同时指出，中国在大模型技术领域与国际先进水平相比，在数据和AI系统方面存在差距，包括各类数据资源及算力。未来，国内需加强数据建设，提升算力水平，以推动大模型技术的进一步发展。

（文章来源：21世纪经济报道）

文章来源：21世纪经济报道责任编辑：6

原标题：智源研究院林咏华：多模态模型需求旺盛，但基础能力仍有提升空间

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈