经济日报:打通国产大模型发展堵点
2025年02月19日 07:52
来源: 经济日报
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  今年1月,深度求索(DeepSeek)公司发布通用大模型DeepSeek-R1,以其低成本、高性能的特征在全球引起巨大轰动。DeepSeek的出圈是我国AI发展的重要里程碑,为产业发展带来了一系列有益的启示。

  DeepSeek通过并行线程执行(PTX)、混合专家模型(MoE)、多头潜在注意力(MLA)和多Token预测(MTP)四大创新技术,在算力资源远不及国际同行的情况下,实现模型性能的大幅追赶,并将训练成本压缩至行业标杆的10%。这一突破不仅有效降低了大模型部署门槛,也揭示了以算法优化弥补算力短板的可行性,为突破西方主导的“大力出奇迹”的AI发展模式,走出多元化发展路径提供了新方案。

  同时,DeepSeek采取完全开源的策略,公开算法、模型权重及训练细节,使全球开发者能借鉴、改进和部署模型。开源生态有助于吸引更多开发者和用户参与,促进技术迭代,有望改变赢者通吃的竞争格局。

  尽管DeepSeek取得重要突破,但也应看到,我国AI原始创新仍存短板。2023年在被引用次数最多的生成式AI研究机构前10名中,中国仅占1席。从AI专利数、深度学习模型、机器学习加速硬件等方面来看,我国与美国也仍存差距。

  当前,我国数据基础制度建设仍处于起步阶段,数据获取和交换机制尚不健全,行业数据、公共数据获取和访问困难,大模型可使用的数据有限。同时,数据标注是高质量数据供给的基础,由于专业化标注人才短缺,我国数据标注质量仍有待提升,特别是在医疗、自动驾驶等发展需求迫切且对专业性要求高的领域,数据标注的供给规模和准确度难以满足发展需求。

  从全球范围看,DeepSeek等国产大模型在全球技术生态中的影响力仍处于起步阶段。从国内看,我国AI发展从基础研究到技术创新,再到场景应用的全链条尚未完全打通。支撑大模型迭代发展的技术、资金、数据、人才等要素流动仍存在梗阻,尚未形成高效的生态闭环。

  为此,应加强AI基础研究和技术创新。加快建设AI领域的国家战略科技力量,推动AI与数学、物理、脑科学等基础学科交叉融合,提升AI基础研究水平。鼓励AI技术开源开放,以开源项目为中心,促进开源贡献者、服务者、使用者、运营者等主体共同推动AI技术创新。

  统筹大规模数据集建设。加快数据基础制度建设,以政府数据开放为牵引,融合企业和行业数据,推动公共数据集、专业应用数据集建设。针对不同应用场景,制定细化的数据标注规范,针对医疗、自动驾驶等垂直领域,开展专项知识培训,提升数据标注质量。

  培育壮大AI初创企业。应发掘具有中国特色的AI初创企业估值模型和平台系统,强化AI初创企业早期估值发现,为政府、金融机构精准识别有潜力、高价值的AI初创企业提供科学参考,为国产AI技术发展壮大注入活力。

  打造AI自主产业生态。充分发挥我国海量数据和丰富应用场景优势,组织科研机构、科技领军企业等优势力量,聚焦智能制造、自动驾驶等重点垂直细分领域,统筹布局大模型行业应用创新(工程)中心,依托自主技术,建设集数据、算法、算力于一体的行业通用大模型平台,形成标准化模块化的模型、中间件及应用软件,以开放接口、模型库等推动产业链上下游深度合作,在应用中持续健全迭代自主产业生态。

(文章来源:经济日报)

文章来源:经济日报 责任编辑:137
原标题:打通国产大模型发展堵点
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500