大模型远没有到泡沫临界点
2024年08月07日 20:29
作者: 魏蔚
来源: 北京商报
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  “叫我仲远吧。”相比王院长,他更习惯这个称呼。

  2024年2月,北京智源人工智能研究院(以下简称“智源”)宣布王仲远成为第二任院长,他在2018年荣获“《麻省理工科技评论》35岁以下科技创新35人”;并有微软、Facebook(现Meta)、美团、快手的工作经历,科技圈很想听听这位“85后”院长心中人工智能的当下和未来。今年3月,中共中央政治局常委、国务院总理李强在北京调研时专门来到智源,在这详细了解大模型前沿技术研发情况。

  在接近一个小时的专访中,王仲远与北京商报记者就当下人工智能行业待破的瓶颈与泡沫、中美互联网发展的差异、国内大模型价格战走向、智源的定位及发展规划等问题进行了深入交流。

  /行业反思/

  “9.11和9.8哪个大”难倒大模型不奇怪

  Q:“9.11和9.8哪个大”的问题最近难倒了一众大模型,您怎么看这个结果?

  A:我一点都不惊讶。从研究者的角度看,大模型的惊艳感来自于它解决了人工智能之前很难解决的理解、推理、常识性问题,但它没有解决所有的问题,比如数学。我们发现看起来很容易的数学题,大模型反而做得不好。做不好比数字大小的题,并不妨碍大模型的持续进化以及产业落地。

  Q:大模型火爆一年半,业界的判断更加理性,您认为人工智能是否达到了泡沫临界点?

  A:还远没有到所谓的泡沫临界点,这是我非常坚信的观点,大模型大的序幕才刚刚拉开。iPhone从诞生到迭代至大家公认好用的iPhone4、iPhone4S,有四年时间,大模型从实验室到产业界才一年半,但我赞同大模型的能力需要持续提升,也要针对不同的场景去打磨应用。

  /价格战/

  百模大战证明我们的市场化不错

  Q:百模大战打到现在,您依然对价格战持保留意见吗?

  A:大模型的迭代需要持续性投入,百模大战显然不利于基础大模型发展,会造成资源分散。价格战的利好在于可以筛掉一些不是真心投入大模型研发的企业,也有利于发现场景,并且针对场景打磨应用。不过,我希望价格战不要导致企业不敢投入研发,就好比iPhone,如果对比的始终都是第一代产品,那离想要的目标会渐行渐远,这是我不愿意看到的。

  Q:如果价格战无法避免,您对大模型toB(企业)有什么建议?

  A:想要建立toB的生态需要企业愿意为软件付费、为大模型付费、为知识付费,这是我特别想呼吁的。只有形成这样的生态,才既有利于大模型的发展,也有利于使用大模型的企业发展。

  价格战只是推动大模型普惠的一种方式,更重要的是大模型的效果。我更期待大模型能在B端找到提升效率的场景,或企业发现大模型能更好解决问题的场景,这是大模型toB需要解决的。未来一两年内可能就会看到一些成熟的B端大模型应用出来。

  大模型toC(用户)可能需要更多的耐心,因为用户对于体验非常敏感,研发人员认为大模型面对“9.11和9.8哪个大”问题不会比大小很正常,但用户无法接受它不会这个问题。

  Q:中国互联网曾出现过百团大战、千播大战,这场百模大战可能怎样收尾?

  A:在美国,每个行业或领域出现一两个巨头后,其他企业就会开始打差异化。国内不管是互联网还是移动互联网都经历过充分竞争,我觉得这说明我们的市场化不错。在这种情况下,最终能胜出的企业,竞争力和战斗力更强。

  /智源/

  要做高校做不了、企业不愿做的研发

  Q:人工智能不等同大模型,智源在大模型上的力量匹配有怎样的计划?

  A:人工智能发展至少有三大流派,符号主义、连接主义和行为主义,分别对应着知识图谱、神经网络、智能体,大模型只是神经网络中的一个分支。大模型之所以不同,是因为它将海量数据通过神经网络进行压缩,让我们看到了它在常识、推理方面的进步。大模型确实不等于人工智能,但是大模型是当下人工智能的重要推动力,智源的愿景是成为人工智能创新引领者。我们依然会在大模型方向投入很多资源,去持续地解决挑战性问题,但也依然会布局大模型以外的人工智能技术。

  比如,不久前智源发布了大模型全家桶,有语言大模型上的共性研究,也有多模态、生物计算、具身智能大模型三个方向上的前沿研究,智源还在做类脑、数字心脏等研究。

  Q:2018年智源在科技部和北京市委市政府的指导和支持下成立,如今人工智能是发展新质生产力的重要引擎。智源在其中扮演什么角色?

  A:智源是一家独立的非营利性研发机构,在中国科研体系中扮演着独特的角色。高校模式已经运行了几十年,较难有组织、有规模、跨团队地做系统性研发。企业也会投入做研发,但面临着激烈的业务竞争和生存压力,更倾向于研发与业务强相关的。智源会做高校做不了、企业不愿做的研发,做3至5年甚至更长时间才能看到成果的研究项目。

  Q:智源是新型研发机构,保持对重大科学问题的敏锐眼光,未来3至5年有什么规划?

  A:2024年北京智源大会上的研究进展和成果发布就是我们的答案,我们对整个人工智能尤其在大模型技术发展趋势上做了判断:从语言大模型到统一的多模态大模型,再到具身智能和生物计算模型,最终到世界模型、AGI(通用人工智能),这是我们对整个人工智能技术路线发展的判断,主要是攻克一些技术难题。

  原生的多模态大模型,从一开始就把不同模态的信息,比如文字、图像、视频、语音放在一个模型里训练,这样的多模态大模型能像人类大脑一样理解和推理。

  大模型跟硬件结合,也就是具身智能,这是未来一个非常重要的发展方向,它使人工智能不再存在于虚拟世界,能进入物理世界服务人类。

  微观角度就是生命科学,人工智能技术可以对生命分子进行理解、建模及推理,它对于AI制药以及整个制药产业有重大帮助。

  智源希望人工智能能够像人类一样对这个世界建模,最终实现AGI。

  Q:为了赶上大模型浪潮,企业面临压力和挑战,智源是否也有紧绷感?

  A:当下整个人工智能行业确实面临非常多的挑战,同时又有激烈的竞争,大家永远都在快速奔跑的路上,最终比的是谁跑得快又不摔倒。

  智源聚焦人工智能的原始创新,焦虑感主要来自于能不能在人工智能技术领域取得国家急需的技术突破。所以智源既要明确要做什么,又要想清楚做这些能不能真的取得突破,并且最终有利于整个人工智能乃至更大的产业发展。

  /人才培养/

  青年人挑大梁年轻成为智源的标签

  Q:作为“85后”院长,您非常年轻,也拥有丰富的互联网大厂经验,您怎么看这一标签?

  A:过去十几年,我个人的经历可以分为两大段,一段是毕业之后加入微软亚洲研究院,那是一段偏科研的经历,后来从一个纯科研机构进入企业,将人工智能技术落地到具体的业务里。在互联网行业我已经不算年轻人,而是一个老兵了。

  在科研机构,很多人会认为“85后”做院长比较年轻,我想这恰恰是智源的特质。智源提倡青年人挑大梁,不论资排辈,智源很多非常重要的科研项目,都是很年轻的科研人员来承担的。比如,我们原生多模态大模型的负责人还不到30岁,生物计算大模型的负责人才30岁出头,具身大模型负责人也是30岁左右,与其说年轻是我个人的标签,我更愿意把它作为智源的标签,我也非常欢迎所有年轻、有冲劲、有想法、有能力的青年科学家加入智源,一起做未来的研究,一起做核心技术的突破。

  Q:任何研发都高度依赖人才,智源在人才引进上有什么优势?

  A:人才始终是智源这样的新型研发机构的核心要素。智源非常重视年轻人,只要有能力、有想法、有冲劲,就能拿到最顶尖的科研岗位和项目。智源很多的资源调配,都围绕核心和优秀的人才展开。北京商报记者陶凤魏蔚

  ·记者手记·

  看不见的大模型,看得见的生产力

  2017年,人工智能首次被写入中国政府工作报告,上升为国家战略。2018年,北京智源人工智能研究院诞生于领创空间一个小小的办公室。那时的Open AI上线的第一代GPT模型还没占领媒体头条。

  2023年,智源将我国首个超大规模智能模型“悟道”升级到3.0,成为微软总裁布拉德·史密斯心中全球最前沿的三个AI机构之一。在大模型领域,智源是全球唯一没有背靠大厂的非企业研究机构,也是国内最早系统布局大模型技术研发、开源生态建设、人才培养和企业培育的新型研究机构。

  2023—2024年,AI科学家、科技大厂CEO、明星初创企业创始人聚在各种场面为大模型布道,台上的不管是不是技术咖,或多或少都听过智源的名号,不少还直接参与过智源当年的大模型研究项目。百度CTO王海峰曾担任智源理事,智谱AI创始人唐杰曾任智源副院长,月之暗面创始人杨植麟参与过“悟道”的研发。

  这些AI弄潮儿不是当下才与智源结缘,智源也不是在大模型风起后才投身其中。

  科研讲究体感,要提出问题,作出判断。“人工智能大模型时代即将到来”的判断,给了智源毫无保留的勇气,就连“大模型”这个中文词汇,都是智源最先提出的。

  这是一种介于大学和企业之间的新型研发机构。新在不以论文为最终评价指标,不以产品为评价指标,而是要做创新性系统;新在把清华、北大、Facebook人工智能实验室、百度等不同机构以及企业的学者聚在一起办大事;新在瞄向大问题,保持对重大科学问题的敏锐眼光,进行前瞻布局。

  新质生产力是创新起主导作用,摆脱传统经济增长方式、生产力发展路径,具有高科技、高效能、高质量特征,符合新发展理念的先进生产力质态。它由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生。“过去每次科技平权都能够催生重大产业机会,大模型可以带来新的科技平权。”王仲远坚信。

  智源搭建的技术体系包括:大模型全家桶、大模型操作系统、数据集、训练框架、算子库等。这些成绩和智源的愿景目标等一起挂在智源大厦一楼的墙上。

  企业贴近市场,向上找场景,研发机构聚焦核心技术突破,向下做加持,智源属于第二种,和应用与场景离得较远,却用开源的方式做产业界的后盾。

  “人工智能不等同于大模型,它只是人工智能的一个流派。”王仲远向北京商报记者解释道。当下的智源也对类脑研究、数字心脏等其他人工智能技术全力以赴,这意味着人工智能在其他产业的想象空间没有上限。

(文章来源:北京商报)

文章来源:北京商报 责任编辑:10
原标题:大模型远没有到泡沫临界点
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500