首发“快思考、慢思考统一模型” 讯飞星火X1为企业提供高效低门槛部署方案
2025年04月22日 23:02
作者: 张露
来源: 广州日报新花城
东方财富APP

方便,快捷

手机查看财经快讯

专业,丰富

一手掌握市场脉搏

手机上阅读文章

提示:

微信扫一扫

分享到您的

朋友圈

K图 002230_0]

  近日,科大讯飞深度推理大模型——讯飞星火X1迎来升级。作为当前业界唯一基于全国产算力训练的深度推理大模型,升级后的星火X1在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果显著提升,在模型参数比业界同类模型小一个数量级的情况下,整体效果对标OpenAI o1和DeepSeek R1。

  星火X1除了在常见通用任务取得显著进步之外,由于融入了更多场景复杂类型数据,模型的泛化性也取得了进步,其中在重点行业如教育、医疗、司法等进一步扩大了领先优势。以司法行业为例,对于行业专业需求,例如根据材料总结案件事实以及判决理由,升级后的星火X1能够精准把握用户指令,详细分析争议点,快速定位关键信息,并输出准确内容,为行业用户提供专业、可靠的智能支持。

  面向企业和广大开发者,讯飞星火X1首发“快思考、慢思考统一模型”,全新升级模型定制优化工具链,进一步降低大模型私有化部署和定制门槛;同时,讯飞星火X1 API已上线讯飞开放平台开放服务,作为首个支持全国产算力微调的推理大模型,讯飞星辰MaaS平台同步上线了星火X1微调服务。

  据介绍,讯飞星火X1的全新升级背后,是一系列技术创新与理念突破。首先,提出基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景全面提升模型效果及泛化性;同时提出强化学习动态更新算法,基于样本采样长度动态调整强化学习更新速度,进一步提升深度思考强化学习效率及效果。其次,统一模型下的快慢思考混合训练方法,充分发挥快慢思考数据相互促进作用,实现基于系统指令控制模型是否深度思考,支撑下游更高效便捷地部署使用;第三,实现多项工程技术创新,显存动态卸载技术大幅提升长文本推理并发、训推共卡协同实现高效训推资源转换、推理引擎冬眠机制实现快速拉起和恢复,实现国产算力平台上高效和稳定的强化学习训练全流程。

(文章来源:广州日报新花城)

文章来源:广州日报新花城 责任编辑:73
原标题:首发“快思考、慢思考统一模型”,讯飞星火X1为企业提供高效低门槛部署方案
郑重声明:东方财富发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
举报
分享到微信朋友圈

打开微信,

点击底部的“发现”

使用“扫一扫”

即可将网页分享至朋友圈

扫描二维码关注

东方财富官网微信


扫一扫下载APP

扫一扫下载APP
信息网络传播视听节目许可证:0908328号 经营证券期货业务许可证编号:913101046312860336 违法和不良信息举报:021-61278686 举报邮箱:jubao@eastmoney.com
沪ICP证:沪B2-20070217 网站备案号:沪ICP备05006054号-11 沪公网安备 31010402000120号 版权所有:东方财富网 意见与建议:4000300059/952500