7月23日,Meta开源最新Llama 3.1系列,包括备受关注的4050亿参数 “超大杯”模型。阿里云魔搭社区第一时间上架全系列3款模型,阿里云百炼平台在国内首家推出针对Llama 3.1系列的训练、部署、推理服务,企业和开发者即日起可在阿里云上基于其打造自己的专属大模型。
阿里云国内首家支持Llama3.1训练推理
Llama 3.1系列包括80亿、700亿、4050亿参数版本,上下文长度扩展至12.8万tokens,并增加了对八种语言的支持。其中“超大杯”4050亿参数版本,是目前最大规模的开源大模型,在各项测评中能力表现突出,不过由于模型尺寸极大,本地开发部署难度极高。
为方便国内开发者,阿里云百炼平台推出针对Llama 3.1全系列的一键再训练、部署、推理方案,且限时一个月为所有用户提供免费算力额度。企业和开发者可在阿里云百炼模型广场申请使用,通过后即可快速体验Llama 3.1效果,并与其他模型进行直观比较。
希望直接进行推理应用的用户,可在百炼上点击模型调试、prompt模版等功能,快速基于Llama 3.1打造自己的AI助手。希望深度开发的企业,后续可结合企业数据集,一键启动SFT全参训练或LoRA高效训练,并利用百炼RAG检索增强、智能体打造等能力进行应用开发。
在云上开发和使用大模型具有诸多优势。百炼平台融合了阿里云获评产品力全球第二的AI基础设施能力,企业和开发者能获得丰富的AI计算资源和极致弹性,轻松完成对超大模型的深度开发、高效部署和高并发推理。在基础设施层,阿里云灵骏智算集群具备高达十万卡GPU的扩展性;在AI平台层,人工智能平台PAI可10倍提升大模型训练性能,并稳定运行千卡任务5周以上;在模型即服务层面,阿里云打造了国内最大规模的AI模型社区魔搭和模型服务平台百炼,提供从大模型选型、体验到再训练、部署、应用、推理的一站式服务。
作为中国云计算领导者,阿里云提出要做“AI时代最开放的云”,全面支持中国大模型生态繁荣。从去年起,阿里云全尺寸、全模态开源了自研通义千问大模型,并深度支持对Llama、Mistral、Stable Diffusion、ComfyUI等开源模型的开发应用,以及百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等众多国内机构大模型的训练推理。目前,阿里云已成为中国大模型的公共算力底座,超过一半中国主流大模型跑在阿里云上。
(文章来源:潮新闻)