795.8元!寒武纪再创历史新高 竟和DeepSeek重磅开源有关?
2025年02月24日 16:48
来源: 每日经济新闻
东方财富APP
Scan me!

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章
Scan me!

提示:

微信扫一扫

分享到您的

朋友圈

K图 688256_0

  炒股第一步,先开个股票账户

  今天(2月24日),DeepSeek开源周正式开启。

  第一个开源的项目就是重量级技术DeepSeek-V3核心技术MLA的改进版本FlashMLA。该项目上线仅两个小时就已经收获了超过2600+star!

图片来源:Github

  据介绍,FlashMLA的灵感来自FlashAttention 2&3和cutlass项目,是针对英伟达Hopper架构的GPU优化的高效MLA解码内核,主要在变长序列 (variable-length sequences) 的场景进行了深度优化,能够显著提升大模型推理效率。

  FlashMLA速度非常快,在H800 GPU上具有3000 GB/s的内存速度上限以及580 TFLOPS的计算上限。此外,部署这一技术也很简单,只需要满足FlashMLA的运行环境要求(Hopper GPU、CUDA 12.3及以上版本以及PyTorch 2.0及以上版本),就可以一键通过`python setup.py install`完成配置。

  总之,FlashMlA对英伟达GPU进行了优化。

图片来源:X

  众所周知,MLA是DeepSeek大模型的重要技术创新点,之前Huggingface技术总监也曾多次赞扬此项技术。此次DeepSeek直接开源了该核心技术的改进版本,可以说是诚意满满。

  DeepSeek表示,当前在线服务的模块已经经过测试、部署完备,可以投入生产环境。这个领域没有高高在上的象牙塔,只有纯粹的车库创业精神与社区共筑的创新力量。

  正如很多网友的评价:DeepSeek才是真正的OpenAI。

图片来源:X

  之前几次DeepSeek新模型和技术的公布都对美股和A股产生了很大的震动。

  寒武纪(688256.SH)股价上个交易日20cm涨停,股价创新高;今天盘中最高795.8元,截至收盘大涨5.14%,续创新高。

  寒武纪股价大涨和DeepSeek开源有什么关系?

  每经小编问了DeepSeek。它分析称:

  FlashMLA是DeepSeek对混合专家模型(MoE)架构的改进版本,这类技术需要高性能AI芯片提供算力支持。寒武纪的云端推理芯片(如MLU370)和训练芯片(如MLU590)直接受益于大模型技术迭代带来的算力需求增长。寒武纪作为国产龙头,可能因FlashMLA等本土技术突破获得更高关注度。

  总之,FlashMLA的开源可能通过技术协同效应和市场情绪催化间接推动寒武纪股价,但直接因果关系较难量化

  想炒股,先开户!选东方财富证券,行情交易一个APP搞定>>

(文章来源:每日经济新闻)

文章来源:每日经济新闻 责任编辑:10
原标题:795.8元!寒武纪再创历史新高,竟和DeepSeek重磅开源有关?
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈
Scan me!

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500
搜索
复制