AI参加数学高考为何不及格?周伯文提出“通专融合”科研战略路径
2024年07月04日 20:50
来源: 上观新闻
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  如何实现通用人工智能(AGI),让人工智能像人一样可以做很多事,不再局限于某些特定领域?今天下午举行的2024世界人工智能大会·科学前沿全体会议上,上海人工智能实验室主任、清华大学惠妍讲席教授周伯文发表演讲,提出“通专融合是通往AGI的战略路径”。在他看来,建立在AI大模型强大泛化能力上的专业能力,是“人工智能皇冠上的明珠”,与目前的大模型相比,这种系统可以更高效、更好地适应并解决现实世界中的复杂问题。

  大模型在专业能力上进步缓慢

  回顾历史,2017年以前,人工智能在专业能力上发展迅猛。从“深蓝”到“阿尔法围棋”,AI棋手先后击败了国际象棋和围棋世界冠军。那时,人工智能面临的巨大挑战是不具备泛化能力,只在一些特定任务上表现突出。然而随着Transformer架构2017年问世, ChatGPT等大模型在泛化能力上突飞猛进,表现出触类旁通的“涌现”能力,让很多人相信:通用人工智能时代即将到来。

  对于这种乐观预测,周伯文指出了大模型的一大弱点:它们在专业能力上进步缓慢,虽然在迭代过程中消耗了巨大的能源、数据等资源。OpenAI首席执行官萨姆·奥特曼坦言:GPT-4的专业能力大概相当于10%—15%的专业人士,即使迭代到GPT-5,其专业能力预计也只会提高4—5个百分点。这意味着,OpenAI将用指数级的能源消耗增长换来缓慢的专业能力提升。

  从GPT-4o等大模型参加今年中国数学高考的成绩,也可看出大模型在专业能力上的短板。“书生·浦语”2.0文曲星考了75分,GPT-4o得到73分,阿里Qwen2-72B拿到70分,都没有及格(满分150分)。令人欣慰的是,上海人工智能实验室研发的“书生·浦语”2.0文曲星在数学成绩上排名第一,超过了GPT-4o。

中外7个大模型的数学各题型得分情况

  “这得益于我们的开源数学模型,它沉淀了密集过程监督、模型辅助的思维链校验、多轮强化自训练、文本推理和代码解释器联合迭代等一系列技术,具备良好的自然语言推理、代码解题和形式化数学语言性能,所以能以200亿参数在高考数学上超过GPT-4o。我们的大模型不但效果最好,而且参数体量最小,能源消耗最低。”周伯文说。

  AI有望提出有价值的科学假设

  “书生·浦语”的胜出,显示出“通专融合”研发路径的潜在价值。作为一种新的人工智能发展范式,“通专融合”将大模型的泛化能力与专业能力紧密结合,旨在打造一个完整的技术体系。周伯文认为,这个体系包含三层重点工作:基础模型层、融合协同层、自主进化与交互层。

  在基础模型层,科研团队专注于高效地构建大模型的通用泛化能力,尤其是高阶能力,如数学、因果推理等。通过高质量数据的清洗和合成,研发高性能训练框架、高效的模型架构。

  在融合协同层,科研人员要将泛化性和专业性有效地结合起来。上海人工智能实验室正在采用多路线协同的算法和技术,构建比肩人类优秀水平的专业能力。实验室的原创工作包括:高密度监督信号的生成、复杂任务规划,以及用新的架构来实现人类大脑“系统1”(快速、直觉反应的系统)和“系统2”(慢速、逻辑分析的系统)之间的交互。通过这些技术,AI能够在复杂环境中做出决策,将复杂任务分解为更易管理的子任务,制定行动计划,并有效地协调多个智能体,以实现群体智能的“涌现”。

  在自主进化与交互层,人工智能的自主探索和反馈闭环十分重要。人工智能系统要在真实或仿真世界中自主地收集数据、学习并适应环境,通过与环境的交互获得反馈。这些反馈对于AI自我进化至关重要,自主进化与交互层使AI能进行“具身”自主学习,最终对“世界模型”有更深刻的理解并与之交互,具备完成开放世界任务的能力。

  “在科学发现领域,通专融合也有巨大的潜在价值。”周伯文表示,通过通专融合,AI能掌握科学知识、分析实验结果、预测科学现象,进而在反思的基础上,拥有越来越强的提出科学假设的能力。

  为此,他给出一个科研团队发现新科学假设过程的案例:他们将已有的背景知识输入2023年1月发布的大模型,并让大模型生成可能的假设。大模型提出的假设中,第一条假设是背景已知信息,并不是新的知识,但第二条假设是以前科学文献中所没有的。两个月后,第二条假设在2023年3月发表的论文中得到了验证。

  “这个案例显示出大模型有望成为科学家的得力助手,促进科学知识发现,并能够提出有价值的科学假设。”周伯文的演讲,指出了AI4S(科学智能)的巨大潜力。

  科技部副部长龙腾、上海市副市长刘多出席会议。

(文章来源:上观新闻)

文章来源:上观新闻 责任编辑:73
原标题:AI参加数学高考为何不及格?周伯文提出“通专融合”科研战略路径
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500