4月6日消息,全球科技巨头Meta(脸书母公司)发布旗下最新Llama 4系列AI模型,据了解,该模型目前有Scout和Maverick两个版本,也是该公司迄今为止最先进的模型。
对此,Meta透露相应模型都经过了“大量未标注的文本、图像和视频数据”的训练,以使它们具备“广泛的视觉理解能力”。
据了解,Llama 4系列模型是Meta旗下首批采用混合专家(MoE)架构的模型,这种架构在训练和回答用户查询时的效率更高,所谓“混合专家架构”基本上是将数据处理任务分解为子任务,然后将它们委派给更小的、专门的“专家”模型。其中,Llama 4 Scout面向文档摘要与大型代码库推理任务,专为高效信息提取与复杂逻辑推理打造,共有16位“专家”、1090亿参数、170亿激活参数量;Llama 4 Maverick则专注于多模态能力,支持视觉和语音输入,具备顶级的多语言支持与编程能力,共有128位“专家”、4000亿参数、170亿激活参数量。
不过,Llama 4系列中没有一个模型是像OpenAI的o1和o3-mini那样真正意义上的“推理模型”。作为比较,“推理模型”会对其答案进行事实核查,并且通常能更可靠地回答问题,但因此也比传统的“非推理”模型花费更长的时间来给出答案。
Meta首席执行官马克·扎克伯格表示,Meta的目标是建立世界领先的人工智能,并将其开源,以造福全球用户。他提到,开源人工智能将成为未来的主导模型,而Llama 4的推出标志着这一趋势的开始。
业内预期,随着最新的Llama大模型发布,全球AI大模型的竞争将进一步升级。谷歌CEO桑达尔·皮查伊就Llama最新模型的发布表示祝贺,并称:“人工智能的世界永远不会无聊。祝贺Llama团队,继续前进!”
近日,消息称,Meta计划斥资近10亿美元(约合人民币72.82亿元)在美国威斯康星州中部打造一个数据中心,作为其对人工智能技术投资的一部分。早在今年1月,扎克伯格就对外表示,公司2025年计划投资多达650亿美元用于人工智能(AI)相关项目,包括建立新的巨型数据中心和加大AI团队的招聘。
(文章来源:广州日报)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12