通义千问首个千亿参数模型来了
2024年04月29日 15:27
来源: 中国证券报·中证金牛座
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

K图 BABA_0]

K图 09988_0]

  据“阿里通义千问”微信公众号4月28日消息,通义千问首次推出千亿级参数模型Qwen1.5-110B。据介绍,Qwen1.5-110B基础能力可与Meta-Llama-3-70B媲美,是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超1000亿参数的模型。

  据研究团队评估,结果显示:在MMLU、GSM8K、MATH、HumanEval等基准测试中,Qwen1.5-110B模型是三者中表现最优的。在TheoremQA、ARC-C、MBPP等评测中,Qwen1.5-110B模型表现优于Llama-3-70B。

1868ea77-93e3-4584-b07b-84ad13cfab73.png

图片来源:“阿里通义千问”微信公众号

  此外,据研究团队对Chat模型进行的评估,对比Qwen1.5-110B-Chat模型在MT-Bench和AlpacaEval 2.0上的表现。结果显示:与之前发布的Qwem1.5-72B-Chat模型相比,Qwen1.5-110B-Chat模型的表现显然更好。

ed576618-2db0-4826-a250-5ec0c1711e0d.png

图片来源:“阿里通义千问”微信公众号

  今年以来,通义千问团队推出最新开源模型系列Qwen1.5,随后在不到3个月的时间连续推出8款大语言模型,此前的模型参数规模涵盖5亿、18亿、40亿、70亿、140亿、320亿、720亿,而本次Qwen1.5-110B的参数规模达到1100亿。据悉,目前通义千问开源模型下载量超过700万。

(文章来源:中国证券报·中证金牛座)

文章来源:中国证券报·中证金牛座 责任编辑:91
原标题:通义千问首个千亿参数模型来了
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500