智谱发布新一代开源模型 极速版最高达到200tokens/秒
今日,智谱发布新一代开源模型 GLM-4-32B-0414 系列,包含基座、推理、沉思模型权重,并遵循 MIT License。目前系列所有模型可以通过 “z.ai”访问体验。据介绍,推理模型GLM-Z1-Air/AirX-0414模型推理速度可以做到最高 200 Tokens/秒(MaaS 平台 bigmodel.cn 上实测),这也是目前国内迄今最快的商业模型,而且GLM-Z1-Air-0414 的价格仅需 DeepSeek-R1 的1/30。
(文章来源:科创板日报)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12