全球开源平台评测结果出炉:阿里Qwen-2居首 中国大模型处于领导地位
上证报中国证券网讯(记者温婷)6月27日凌晨,全球著名开源平台huggingface(笑脸)的联合创始人兼首席执行官Clem在社交平台宣布,根据日前的评测,阿里最新开源的Qwen2-72B指令微调版本卫冕冠军,继续位列全球开源模型排行榜第一名,中国在全球开源大模型领域处于领导地位。
Clem表示,为了提供全新的开源大模型排行榜,使用300块H100对目前全球100多个主流开源大模型,例如Qwen2、Llama-3、mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行全新评估。
结果显示,阿里开源的Qwen-2 72B力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为王者。排名前10的模型有3个出自Qwen,包括卫冕的Qwen2-72B指令微调模型,以及曾经登顶的Qwen1.5-110B模型(base和chat版本各一)。中国在全球开源大模型领域处于领导地位。
日前,多个用户收到OpenAI的推送邮件显示,自7月9日起,OpenAI将开始阻止来自非支持国家和地区的API(应用程序接口)服务,这意味着中国将不在OpenAI的API服务提供范围之列。随后,阿里云百炼宣布,将为OpenAI API用户提供最具性价比的中国大模型替代方案,并为中国开发者提供2200万免费tokens和专属迁移服务。根据斯坦福最新公布的大模型测评榜单HELM MMLU,Qwen2-72B得分为0.824,与GPT-4并列全球第四。
(文章来源:上海证券报·中国证券网)