国联民生证券:豆包推出UltraMem架构推动端侧AI快速发展
2025年02月17日 11:27
来源: 财中社
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  国联民生证券发表研究报告称:

  豆包提出全新稀疏架构

  近期,字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem。该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。研究还揭示了新架构的ScalingLaw,证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。实验结果表明,训练规模达2000万value的UltraMem模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模value或expert开辟了新路径。

  大模型内嵌操作系统助力AI手机发展

  中兴努比亚手机率先将大模型内嵌到操作系统中,后续其他厂商有望跟进。中兴努比亚星云AI率先实现全尺寸内嵌DeepSeek-R1,并在努比亚Z70Ultra机型正式上线,可以发挥以下优势。(1)努比亚Z70Ultra可在星云智能对话界面直接调用DeepSeek-R1,避免多入口带来的繁杂操作。(2)DeepSeek-R1实现了与努比亚Z70Ultra星云AI多模态能力的无缝交互。(3)全尺寸内嵌DeepSeek-R1也可与努比亚AI耳机等智能设备互联,用户可通过耳机直接语音唤醒DeepSeek。

  国内模组厂商争相支持DeepSeek模型

  美格智能推出AIMO智能体产品,并加速开发DeepSeek-R1模型在端侧落地应用及端云结合整体方案。移远通信边缘计算模组SG885G上成功实现了DeepSeek-R1蒸馏小模型的稳定运行,其生成Tokens的速度超过每秒40个Tokens,且未来随着性能的不断优化,速度还将进一步提升。广和通高算力AI模组及解决方案已全面支持小尺寸的DeepSeek-R1模型。未来有望在自动驾驶、机器人控制、智能制造、智慧医疗、AI智能体等场景广泛应用。

  DeepSeek-R1模型的成功发布,豆包提出全新的稀疏模型架构UltraMem,这都有望降低推理侧模型的成本,助力模型在端侧的部署续提升。

(文章来源:财中社)

文章来源:财中社 责任编辑:6
原标题:国联民生证券:豆包推出UltraMem架构推动端侧AI快速发展
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500