“外界对大模型有相当多的误解。”9月12日消息,百度创始人李彦宏近日的一则内部讲话曝光。在最近一次和员工交流中,李彦宏谈及三个大模型认知误区,涵盖了大模型竞争、开源模型效率、智能体趋势等热点话题。
李彦宏指出,未来大模型之间的差距可能会越来越大。大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级;需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。
“模型之间的差距是多维度的。”李彦宏进一步表示,一个维度是能力方面,不管是理解能力、生成能力、逻辑推理能力还是记忆能力等这些基本能力上的差距;另一个维度是成本方面,你想具备这个能力或者想回答这些问题,你付出的成本是多少?有些模型可能推理速度很慢,虽然也达到同样的效果了,但实际上它的体验还是不如最先进的模型。
“部分自媒体的炒作,再加上每个新模型发布时都有宣传的动力,使得大家认为模型之间的能力差别已经比较小了,其实不是这样。”李彦宏谈到,在实际使用过程当中,我不允许我们的技术人员去打榜,真正衡量文心大模型能力的是,你在具体应用场景当中到底有没有能够满足用户的需求,有没有能够产生价值的增益,这是我们真正在乎的。
在商业领域,开源模型没有优势
李彦宏指出,一个模型除了能力或效果之外还要看效率,效率上开源模型是不行的。闭源模型准确地讲应该叫商业模型,商业化的模型是无数个用户或者说客户在共享同样的资源,在分摊研发成本、分摊推理用的机器资源和GPU,而开源模型需要你自己去部署一套东西,部署之后GPU的使用率是多少?文心大模型3.5、4.0也好,使用率都是90%多。
在大模型时代之前,大家习惯了开源意味着免费、意味着成本低。李彦宏进一步表示,由于Linux是开源的,所有程序员都可以看到代码,哪儿做的不好我可以去更新,更新了再check in。但是这些东西在大模型时代都不成立,大模型时代,大家经常讲的是GPU有多贵,算力是决定大模型成败的一个关键因素,开源的模型给你送算力吗?它不给你送算力,怎么能够让算力高效地被利用?开源模型解决不了这个问题。
以前你买电脑的时候就已经为算力付费了,但大模型的推理不是这样,这个推理其实很贵。在商业领域,当你追求的是效率、效果,追求的是最低成本时,开源模型是没有优势的。
强调智能体,因为它的门槛很低
AI应用的演进方式是什么?李彦宏认为,大模型发展的过程必然要经历这几个阶段,一开始是对人进行辅助,最后出来什么东西需要人把最后一道关,我们确定它的效果是OK的,各方面都不错才会让它出去,这是Copilot阶段;再往下走就是Agent智能体,外界对于Agent有各种各样不同的定义,最主要还是说它有了一定的自主性,具备自主使用工具、反思、自我进化等能力;这种自动化程度再往下走就变成一个所谓的Al Worker,能够像人一样做各种各样的脑力和体力劳动,各方面的工作都可以独立完成。
至于为什么要强调智能体?李彦宏说,因为智能体的门槛确实很低,去年说要“卷”应用、大家都去做应用,其实很多人还是说不知道该怎么做,不知道这个方向能不能做出来,到底要用到什么能力才能够在这个场景下产生价值,这里面有无数不确定性,大家不知道怎么从模型变成应用。但是智能体提供了一个非常直接、非常高效、非常简单的方式,在模型之上构建智能体是相当方便的,这也是为什么今天每周都有上万个新的智能体在文心平台上被创造出来。
(文章来源:广州日报)