首个AI大模型高考全卷评测结果发布

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

首个AI大模型高考全卷评测结果发布

2024年06月19日 16:38

来源：界面新闻

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　据上海人工智能实验室官微，近日，司南评测体系OpenCompass选取6个开源模型及OpenAI的GPT-4o开展首个大模型高考“语数外”全卷能力测试。评测采用全国新课标I卷，参与评测的所有开源模型，开源时间均早于高考，确保评测 “闭卷”性。同时，成绩由具有高考评卷经验的教师人工评判，更加接近真实阅卷标准。首个大模型高考全卷评测结果显示，阿里通义千问Qwen2-72B、OpenAI的GPT-4o及书生·浦语2.0文曲星（InternLM2-20B-WQX）成为本次大模型高考的前三甲，对应得分率分别为72.1%、70.5%和70.4%。大部分模型在“语言”本质上的表现良好，语文平均得分率为67%，英语更是达到了81%。而数学则是所有大模型的短板，平均得分率仅为36%；InternLM2-20B-WQX取得了75分的最高分，超过所有受测模型。然而仍未达到及格水平。

（文章来源：界面新闻）

文章来源：界面新闻责任编辑：33

原标题：首个AI大模型高考全卷评测结果发布

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈