11月29日,智谱AI CEO张鹏宣布旗下智能体AutoGLM再升级,支持自主执行超过54步的长步骤操作,可以跨APP实现任务完成。现场,张鹏进行了实际操作,成功完成通过AutoGLM派发2万元微信红包与1万元支付宝口令红包的任务。
AutoGLM是今年10月智谱AI发布的智能体产品,可以执行在微信上点赞评论、在淘宝上购买历史订单产品、在携程预订酒店、在12306购买火车票等任务。此次新发布的产品除了升级版AutoGLM,还有基于PC的自主Agent(智能体)GLM-PC ,目前探索落地的场景包括会议总结、文档处理、网页搜索与总结、远程指令与定时操作、隐形屏幕等。
2024年上半年,行业追着ChatGPT的脚步,积极寻找大模型领域的超级应用。进入下半年,智能体成为更重要的布局方向。苹果(Apple Intelligence)、Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企业也将Agent 作为 2025 年的主要关注点。Gartner近期将Agentic AI列为 2025年十大技术趋势之一,并预测2028年至少有15%的日常工作决策将由Agentic AI自主完成,这一数字在2024年为0。
对于这一转变,张鹏对第一财经记者表示,行业寻找大模型超级应用这件事有点期待过高,有些急。大模型本身是一件高投入的事情,智谱AI对智能体的理解更偏底层技术,而非简单提升单项文本技术能力后就期待产生巨大价值。并且,人类日常处理的任务多是多模态的复杂交互情况,这就要求智能体的技术是全面的、不能有短板的。因此,张鹏认为,智能体是模型能力增长到一定程度之后的产物,太“笨”的时候不太能够产生这样的效果。
目前行业内已有厂商发布智能体项目,包括字节跳动扣子、钉钉AI助手、夸克AI写作助手CueMe、百度AI 助手百小应等。并且,互联网大厂基于过往多年的资源积累,与行业厂商之间更具备资源互换的优势。对于创业公司与大厂之间的竞争差异性,张鹏对记者表示,智谱优先侧重技术导向,其次才是目的导向,并不会局限于单项技术的快速变现。生态系统布局上持有更开放的心态,鼓励合作伙伴在开放技术体系上发展自有应用与商业价值。
另在技术层面,智谱AutoGLM 技术负责人刘潇表示,AutoGLM本质上叫用户图形化交互界面的操控Agent,通过模拟人类完成一系列操作,并非通过传统机械方式去调用。
张鹏表示,现阶段,AutoGLM 相当于在人与应用之间添加一个执行的调度层,很大程度上改变人机交互形式。更重要的是,智谱AI看到了 LLM-OS(大型语言模型操作系统)的可能,基于大模型智能能力,未来有机会实现原生的人机交互。
LLM-OS是一种基于深度学习技术的创新操作系统,引入大型语言模型(如GPT、BERT等)作为核心组件,在操作系统层面实现智能化功能。
对于大模型时代的操作系统布局,张鹏表示,智谱AI主要通过与现有操作系统厂商合作的形式切入行业,尝试将AI能力赋能进去,进行原生大模型新操作,团队已经在进行相关研究工作。
(文章来源:第一财经)