月之暗面创始人杨植麟:中国技术不仅要好用还要参与制定规则 未来大模型要推出到K100
2026年01月10日 20:07
作者: 范佳来
来源: 澎湃新闻
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  “希望在接下来的十年、二十年的时间,继续把K4、K5到K100做得更好。”

  1月10日,在清华大学基础模型北京市重点实验室主办的AGI-Next前沿峰会上,AI大模型独角兽月之暗面(Kimi)创始人、CEO杨植麟谈到Kimi在未来的发展规划。

  澎湃新闻记者范佳来摄

  在大模型迎来上市潮流之际,同为大模型独角兽的Kimi的资本动态受到外界广泛关注。去年12月31日,杨植麟曾在内部全员信中表示,公司已完成5亿美元C轮融资,账面有超过100亿元人民币的现金储备。

  此外,信中还透露,Kimi全球付费用户数月增速170%,受K2 Thinking大模型带动,Kimi在海外的大模型API收入增长4倍。

  杨植麟表示,自2019年以来,全球大模型的发展都遵循一个核心规律——Scaling Law,本质上就是“更多算力、更多数据、更大模型参数,能让AI更聪明、犯错更少”。这一规律的落地,离不开主流架构Transformer的支撑。

  他举例说明,Transformer与早期的LSTM架构相比,在处理短文本任务时效果相近,但面对长文本、复杂任务时,Transformer能更清晰地记住逻辑关系,就像“看短文章不分上下,读长篇报告则优势明显”,这也成为其适配当下编程、复杂问题求解等场景的关键。

  基于这一核心规律,Kimi的技术研发聚焦两大方向:让AI“学东西更快”和“记东西更久”。为实现这两个目标,团队取得了两项关键技术突破。一是推出MUON二阶优化器,相较于行业沿用十年的Adam优化器,新优化器让AI的学习效率翻倍,“原本要读100份资料才能学会的技能,现在50份就够,还学得更扎实”。

  二是研发Kimi Linear架构,解决了传统技术“记久了就出错”的问题,在处理百万字级长文本时,速度比传统架构快6-10倍,且逻辑更稳定。

  值得一提的是,团队还攻克MUON优化器训练中的“Logit爆炸”难题,通过动态QK-clip技术,在不影响效果的前提下,实现万亿参数级Kimi K2模型的稳定训练。作为中国首个真正意义上的Agent模型,Kimi K2具备两三百步工具调用能力,能独立完成复杂编程、难题推导等任务,在核心测试HLE中准确率达到45%,超越了OpenAI同类模型。

  杨植麟透露,目前已有多款中国开源模型成为行业测试标准,“中国技术不仅要好用,还要参与制定规则”。面向未来,团队将持续迭代技术,下一代模型将采用Kimi Delta Attention新型线性注意力机制,进一步提升短长文本任务性能与速度。同时,未来的大模型还将具备更多“审美”和“价值观”,摆脱同质化发展。

  对于公众关心的AI安全问题,杨植麟分享与Kimi的对话感悟:“AI可能是人类探索未知的钥匙,能帮我们攻克癌症、解决能源危机、探索宇宙。虽然有风险,但放弃发展就等于放弃人类文明的上限。”

  他表示,团队将在做好风险控制的前提下持续突破,计划未来十年、二十年内,陆续推出K4、K5直至K100系列模型。(记者注:目前最新版本的Kimi大模型是K2)

(文章来源:澎湃新闻)

文章来源:澎湃新闻 责任编辑:70
原标题:月之暗面创始人杨植麟:中国技术不仅要好用还要参与制定规则,未来大模型要推出到K100
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500