龙虾大模型测评榜来了！MinMax和Kimi杀入前三

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

龙虾大模型测评榜来了！MinMax和Kimi杀入前三

2026年03月09日 19:07

来源：东方财富研究中心

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　在刚刚过去的一周，“养龙虾”彻底火了！

　　腾讯总部门前大排长龙等着免费安装“龙虾”，闲鱼上代装“龙虾”服务几十到上百不等，各大云厂商纷纷推出一键部署教程和服务。而这里的“龙虾”可不是指我们吃的小龙虾，而是指“OpenClaw”，“claw”有爪和工具之意，正契合了它的工具属性，并且OpenClaw的吉祥物就是一只可爱的龙虾。

　　OpenClaw官网给出的官方定义为“The AI that actually does things”，可以直译为“真正干活的AI”。它可以帮你清理收件箱，发送邮件，管理日程，办理航班值机等，而你只需发送指令到WhatsApp、Telegram、飞书、钉钉等与它连接过的聊天软件。

　　事实上，OpenClaw并不能直接使用，而是需要完成部署配置，并且在日常使用中逐渐给它添加技能，因此称为“养龙虾”。在部署OpenClaw时，第一个需要解决的问题就是选哪个大模型来当它的“大脑”。为了回答这一问题，PinchBench网站应运而生。

　　PinchBench专门针对OpenClaw对大模型进行基准测试，从而评估大语言模型在 OpenClaw 任务中的表现。目前官网显示测试了全球主流的33个大模型。

　　数据显示，在成功率方面，谷歌的gemini-3-flash-preview位居榜首，为95.1%。国产大模型minimax-m2.1和kimi-k2.5闯进前三，测试成功率分别为93.6%和93.4%，力压一众claude大模型。

　　完成测试费用方面，minimax-m2.1和kimi-k2.5也表现不俗，在兼顾了成功率的同时，费用低于gemini-3-flash-preview。前者费用分别是0.14和0.20美元，后者费用为0.72美元。

　　另外，在任务完成的速度上，minimax-m2.1和kimi-k2.5在7个成功率高于90%的大模型中也能达到平均水平。

　　也难怪OpenClaw的创始人Peter Steinberger在接受一档播客访谈时曾直言，他认为Minimax 2.1是当前最好的开源模型（彼时他还没有测试过Minimax和Kimi的最新模型）。

（文章来源：东方财富研究中心）

文章来源：东方财富研究中心责任编辑：91

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信

沪股通

深股通

港股通(沪)

港股通(深)

热门资讯

焦点专题

OpenClaw刷屏

猪价刷新十余年低点

视频

一键关注财经大咖

热点推荐

10家A股公司退市超25万股民踩雷

21世纪经济报道

366 人评论 2026-06-14