电脑成精了!OpenAI推出AI代理Operator 能像人类一样浏览网页
2025年01月24日 03:41
来源: 财联社
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

摘要
【电脑成精了!OpenAI推出AI代理Operator 能像人类一样浏览网页】美国初创公司OpenAI周四突然举行直播活动,发布市场期待已久的首款AI代理工具Operator(意为操作员),能够代理用户执行基于网页的操作。言简意赅的解释,就是Operator能够像人类一样使用网页浏览器。

  美国初创公司OpenAI周四突然举行直播活动,发布市场期待已久的首款AI代理工具Operator(意为操作员),能够代理用户执行基于网页的操作。

  言简意赅的解释,就是Operator能够像人类一样使用网页浏览器

  与“问一句、答一句”的聊天机器人不同,AI代理能够在人类有限监督的情况下按照设定完成任务,也被普遍视为AI生产力的下一个里程碑。在OpenAI通往通用人工智能(AGI)的五个步骤中,AI代理是继聊天机器人、推理机器人之后的第三步,也是全新的一步。

  山姆·奥尔特曼介绍称,从周四开始,美国的ChatGPT Pro用户(一个月交200美元)将能使用“研究预览版”的Operator。未来将拓展到更多区域的Pro用户,几个月后ChatGPT Plus用户也能用上。同时在未来几周、几个月里,还会发布更多的AI代理。

image

  什么是Operator?

  Operator由一个名为CUA(计算机使用代理)的新模型驱动,结合了GPT-4o的视觉能力,以及通过强化学习实现的高级推理。Operator能够“看见”网页(截图),并使用鼠标和键盘允许的所有操作与网页进行互动。在操作中如果碰到困难,模型会调用推理能力进行自我纠正,若依然无法解决问题则会把控制权交还给人类。

image

  要理解这种新事物,还得靠新鲜生动的案例。

  Operator的界面与聊天机器人ChatGPT类似,最大的区别是调用“AI代理”完成用户吩咐的事情。

  在演示案例中,Operator被要求预订某家饭店。用户只需要在对话框中输入“给我订一个XX饭店今晚19点的桌子”,然后AI代理就会自己打开网页进入预订网站搜索餐厅并完成预订

image

  如果用户所需的时段已经被订完,AI会询问“19点的桌子订完了,19点45分的桌子还有,要不要订?”

  在另一个案例中,用户上传了一张写有“鸡蛋、菠菜、蘑菇”等杂货的购物清单,要求Operator去买菜网站上进行操作。随后AI就会打开浏览器,顺着清单逐一搜索并加入购物车

image

  完成任务后,Operator会告诉用户总共需要多少钱,以及骑手送达的时间,然后将浏览器的控制权交还给人类。

image

  OpenAI也提醒使用者,虽然Operator已经是市面上最强的AI代理,但与人类相比依然差得很远。例如在使用浏览器的基准测试中,OpenAI CUA模型能拿到58.1%的评分,但人类的水平可以达到78%。所以这项新技术仍有可能犯错,但会在未来数月里持续改进。

image

(文章来源:财联社)

文章来源:财联社 责任编辑:126
原标题:电脑成精了!OpenAI推出AI代理Operator 能像人类一样浏览网页
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500