小红书开源大模型强化学习训练引擎Relax
小红书AI平台团队今日正式开源Relax —一款面向全模态与Agentic场景设计的大模型强化学习训练引擎。
Relax基于Megatron-LM 和SGLang高性能后端构建,将全模态数据支持、服务化容错架构和异步训练流水线三个维度统一解决。在Qwen3-Omni-30B上,Relax 验证了图像、文本、音频和视频四种模态的RL 训练稳定收敛;在16xH800多机下,训练全异步相比Colocate基线端到端提速76%,相比veRL的全异步端到端提速20%。
(文章来源:第一财经)