DeepSeek-V3首个版本上线
摘要
【DeepSeek-V3首个版本上线】幻方量化全新系列模型DeepSeek-V3首个版本上线并同步开源,API服务已同步更新,接口配置无需改动。当前版本的DeepSeek-V3暂不支持多模态输入输出。据介绍,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
幻方量化全新系列模型DeepSeek-V3首个版本上线并同步开源,API服务已同步更新,接口配置无需改动。当前版本的DeepSeek-V3暂不支持多模态输入输出。据介绍,DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
(文章来源:财联社)