大模型价格又砍一刀 这次“屠夫”竟是量化私募?
2024年05月10日 15:15
来源: 科创板日报
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

  连AI大模型也开始“卷”价格了,这次举起“砍价屠刀”的搅局者,没有科技巨头加持,也没有互联网大厂背景,而是和幻方这家量化私募有着千丝万缕关系

  日前,深度求索开源第二代MoE大模型DeepSeek-V2,顶着“价格屠夫”的称号一炮而红——性能比肩GPT-4、价格仅有GPT-4的近百分之一

  值得注意的是,DeepSeek出品公司是杭州深度求索人工智能基础技术研究有限公司(以下简称“杭州深度求索”),此前多家媒体报道显示,深度求索为幻方旗下组织机构。且幻方量化曾在去年4月发布公告称,将全力投身到人工智能技术之中,成立新的独立研究组织“深度求索”

  另据天眼查数据显示,杭州深度求索的背后为幻方量化实控人梁文锋,后者在杭州深度求索最终受益的股份比例超八成。

image
image

  性能方面,DeepSeek-V2拥有2360亿参数,其中每个token210亿个活跃参数。据官网介绍,DeepSeek-V2中文综合能力(AlignBench)“在众多开源模型中最强”,超过GPT-4,与GPT-4-Turbo,文心 4.0等闭源模型在评测中处于同一梯队;英文综合能力(MT-Bench)与LLaMA3-70B处于同一梯队,超过最强MoE开源模型Mixtral8x22B。

  算力需求方面,分析机构SemiAnalysis指出,DeepSeek-V2训练参数量达8.1万亿个token,而表现出“难以置信”的训练效率,计算量仅为Meta Llama 3 70B的1/5,更只有GPT-4 的1/20

  如果说上述这些只是AI技术迭代浪潮中常见的“技术炫技”,那么价格则是该模型最引发关注的要点。

  目前DeepSeek-V2 API定价为:每百万token输入1元、输出2元(32K上下文),仅是GPT-4的近百分之一水平

  SemiAnalysis给出了“便宜得难以置信”的评价。据该机构计算,在其算力服务力利用率最高的情况下,DeepSeek每台服务器每小时收益可达35.4美元,毛利率在70%以上

image

  幻方量化,这家号称量化界“四大天王”之一的私募,管理规模曾一度飙升至千亿,但之后幻方产品大幅回撤,管理规模也迅速缩水。去年年末,幻方还遭投资者控诉称,“花100万元买了幻方量化的产品两年多,赎回时只剩约80万元,还要被计提3万多的业绩报酬”。

  幻方量化去年4月公告成立“深度求索(DeepSeek)”之后,深度求索发布了第一代大模型,并将免费商用,完全开源。

  彼时,幻方量化的公告曾在业内引发“AI炒股说”的议论,但幻方量化董事总经理陆政哲表示,“我用中文重申一下:AGI不是用来炒股的,有大得多的用处和大得多的价值。”

  在此之前,幻方量化已于2019年投资2亿元自主研发深度学习训练平台“萤火一号”,搭载了1100块GPU;2021年幻方量化对“萤火二号”投入增加到10亿元,且搭载了约1万张英伟达A100显卡——也是在那一年末,OpenAI的ChatGPT横空出世,掀起全球AI热潮和英伟达GPU“抢购潮”

  值得一提的是,为了投入人工智能,幻方还租下“20个网球场”。去年末有媒体报道称,北京深度求索人工智能(以下简称“北京深度求索”)正在进行装修招标,办公室选址于北京海淀区融科中心,装修工程面积达1950平方米,并获得了施工许可证。

  而天眼查显示,北京深度求索则由上文提到的杭州深度求索100%控股。

image

(文章来源:科创板日报)

文章来源:科创板日报 责任编辑:43
原标题:大模型价格又砍一刀,这次“屠夫”竟是量化私募?
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500