面壁智能首席科学家刘知远:提升知识密度是实现高效大模型的方向
2024年07月05日 16:15
来源: 每日经济新闻
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  大模型也有自己的“摩尔定律”?2024世界人工智能大会期间,深耕端侧大模型的清华大学计算机系长聘副教授、面壁智能首席科学家刘知远分享了他的研究思路:“如果拥有在端侧有限的算力、内存、能耗条件下,将知识浓缩到更小的参数规模中的能力,那么便可探寻大模型的高效成长规律。”

图片来源:每经记者张韵摄

  在训练大模型之前,刘知远会在“模型沙盒”中做成百上千次演练。他解释道,在小模型上高效寻找最优数据和超参配置,并外推至大模型,可找到一个更高的知识密度,从而带来一个更加高效的模型。

  刘知远认为,如果说芯片制程会带来终端算力持续增强,模型制程也将带来模型知识密度的持续增长,那么两者交汇将揭示端侧智能的巨大潜力。因此,大模型时代会拥有自己的“摩尔定律”,即模型知识密度的持续增强。据刘知远观察,模型的知识密度呈现出每8个月提升一倍的规律。

  刘知远进一步得出结论,未来高效大模型第一性原理的关键词便是知识密度,也就是每一次计算依托的参数规模所对应的能力消耗。当大模型数据驱动技术方向大致确定,模型的架构、算法、数据等技术方案却仍在高速迭代,因此持续改进模型制程、极致提升知识密度成为行业努力的方向。

(文章来源:每日经济新闻)

文章来源:每日经济新闻 责任编辑:3
原标题:面壁智能首席科学家刘知远:提升知识密度是实现高效大模型的方向
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500