联想单机部署DeepSeek推理性能实现新突破
中证报中证网讯(记者孟培嘉)3月17日,联想宣布旗下首款AMD AI大模型训练服务器联想问天WA7785a G3在单机部署671B(满血版)DeepSeek大模型时,可实现极限吞吐量6708token/s,将单台服务器运行大模型的性能推向新高。
据悉,依托联想万全异构智算平台,联想通过访存优化、显存优化、PCIe 5.0全互联架构创新以及精选SGLang框架中性能最优算子等诸多创新方式,对大模型从预训练、后训练到推理的全流程进行持续优化,在模拟问题对话场景时,最高可支持并发数158,TPOT 93毫秒,TTFT 2.01秒;而在模拟代码生成时,并发数可达140,TPOT 100毫秒,TTFT 5.53秒。
这一成绩意味着,单台联想问天WA7785a G3可以支撑1500人规模企业的正常使用,是继联想问天WA7780 G3服务器单机部署满血版DeepSeek大模型总吞吐量突破2500 token/s后,单机部署该大模型推理性能的又一次突破。
(文章来源:中国证券报·中证网)
网友评论
郑重声明:
1.根据《证券法》规定,禁止编造、传播虚假信息或者误导性信息,扰乱证券市场;2.用户在本社区发表的所有资料、言论等仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。
《东方财富社区管理规定》
热门评论
查看全部评论
全部评论
最新
最热
最早
股大V
2025-03-17 15:15:53
来自 湖北
PE12,净利润、现金流近200亿!最低估值科技股,估值相当于10元的小米,50的快手,静候后期估值修复爆发!
置顶
删除
举报
评论
点赞
香港交易所股东
:
想忽悠人来买联想哈哈
2025-03-18 01:45:21
来自 广东
删除
举报
评论
点赞
股大V
回复
股大V
:
事实说话,快手!
查看图片
2025-03-17 15:56:19
来自 湖北
删除
举报
评论
点赞
还有3条回复, 点击查看全部
股大V
2025-03-17 15:02:38
来自 湖北
同时,开始跨入了机器人、智能驾驶
置顶
删除
举报
评论
点赞
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12