阿里云AI基础设施升级亮相模型算力利用率提升超20%

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

阿里云AI基础设施升级亮相模型算力利用率提升超20%

2024年09月20日 11:56

作者：记者张云山

来源：潮新闻

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　9月20日，2024云栖大会现场，阿里云全面展示了全新升级后的AIInfra系列产品及能力。通过全栈优化，阿里云打造出一套稳定和高效的AI基础设施，连续训练有效时长大于99%，模型算力利用率提升20%以上。

　　阿里云基础设施全面升级

　　“AI创新需要新形态的云基础设施。”阿里云副总裁、弹性计算及存储产品线负责人吴结生表示，阿里云整合底层的计算、存储、网络等资源，实现了统一调度和软硬一体优化，以满足模型训练和推理的爆发式AI算力需求。基于全新的CIPU2.0，阿里云新推出磐久AI服务器，实现单机16卡、显存1.5T以上，支持SolarRDMA互联。磐久AI服务器采用超钛金电源实现97%以上的高能效，并可通过AI算法预测GPU故障，准确率达92%，保障AI算力的性能和稳定性。在存储方面，阿里云并行文件存储CPFS实现端到端全链路性能提升，单客户端吞吐达25GB/s，高性能数据流动达到100GB/s，为AI智算提供指数级扩展存储能力。为AI设计的高性能网络架构HPN7.0，性能和稳定性也再次提升，其中，集合通信性能提升1倍以上，模型端到端训练性能提升10%以上。通过底层计算、存储、网络等基础设施的升级，阿里云灵骏集群可提供超大规模、超强性能的智能算力，万卡规模性能线性度超过96%，并行存储吞20TB/s，万卡规模下网络带宽利用率超过99%，可支持单集群十万卡级别AI算力规模。面向AI业务，阿里云计算产品也大幅演进更新。本次云栖大会上，容器服务ACK面向AI实现重磅升级，大模型应用冷启动延迟降低85%，并可提供15000个超大规模节点支持。同时，容器计算服务ACS即将推出GPU容器算力。

（文章来源：潮新闻）

文章来源：潮新闻责任编辑：10

原标题：阿里云AI基础设施升级亮相模型算力利用率提升超20%

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈