中国电信发布单体稠密万亿参数语义模型用了普通训练方案9%的算力资源

行情中心

指数期指期权个股板块排行新股基金港股美股期货外汇黄金自选股自选基金

数据中心

资金流向主力排名板块资金个股研报新股申购转债申购北交所申购 AH股比价年报大全融资融券龙虎榜限售解禁 IPO审核大宗交易估值分析

首页 > 财经频道 > 正文

中国电信发布单体稠密万亿参数语义模型用了普通训练方案9%的算力资源

2024年06月19日 12:41

来源：每日经济新闻

小中大

东方财富APP

方便，快捷

手机查看财经快讯

专业，丰富

一手掌握市场脉搏

手机上阅读文章

提示：

微信扫一扫

分享到您的

朋友圈

　　6月19日，《每日经济新闻》记者从中国电信处获悉，近日，中国电信人工智能研究院（TeleAI）联合北京智源人工智能研究院发布了全球首个单体稠密万亿参数语义模型Tele-FLM-1T，成为国内首批发布稠密万亿参数大模型的机构。

　　《每日经济新闻》记者了解到，针对大模型训练算力消耗高的问题，TeleAI与智源基于模型生长和损失预测等关键技术联合研发出的Tele-FLM系列模型，仅使用了业界普通训练方案9%的算力资源，基于112台A800服务器，用时4个月完成了3个模型总计2.3T tokens的训练。

　　中国电信方面透露，Tele-FLM-1T版本即将开源，期望为社区训练万亿稠密模型提供技术参考，避免万亿模型训练收敛难等问题。

　　据悉，作为最早布局并首先开源大模型的央企机构，TeleAI去年发布了千亿参数“星辰”语义大模型；今年2月，TeleAI自主研发的星辰大模型首次通过了“境内深度合成服务算法备案”。今年5月15日，根据北京市生成式人工智能服务备案信息公告，星辰大模型再次通过产品备案。“双备案”标志着星辰大模型可正式对外提供生成式人工智能服务。

　　开源方面，TeleAI已接连开源7B、12B、52B参数规模大模型。随着TeleChat系列模型的发布，TeleAI还同步对多个大模型落地项目进行了能力升级，如在某市民生诉求场景项目上，通过引入TeleChat-52B模型能力，整体应用效果提升40%。

（文章来源：每日经济新闻）

文章来源：每日经济新闻责任编辑：91

原标题：中国电信发布单体稠密万亿参数语义模型用了普通训练方案9%的算力资源

郑重声明：东方财富发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

东方财富网

分享到微信朋友圈

打开微信，

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈