感谢IT之家网友 GreatMOLA 的线索投递!
IT之家 7 月 25 日消息,根据 modelscope / ms-swift 代码库显示的 commit 记录,智谱即将发布 GLM-4.5 系列模型,预估采用全新的混合专家(MoE)结构,是一款多模态可扩展大模型。
根据 commit 上显示的代码,GLM-4.5 系列模型预估会有 GLM-4.5(355B-A32B)和 GLM-4.5-Air(106B-A12B)两款模型。
IT之家附上网友 @惊鱼 在 Linux DO 论坛发布的分析内容如下:
GLM-4.5 是基于混合专家(MoE)结构的多模态可扩展大模型,具备高吞吐推理、结构化工具调用、可解释推理追踪、分布式负载均衡等特性。
支持多专家分组、负载均衡、分布式推理和多 token 预测(MTP)推理。
添加了新的推理解析器和工具调用解析器,允许模型输出严格的… 推理内容和
… 工具调用内容,便于工具增强推理与函数调用。文档显示 GLM-4.5 支持 T(文本)、I(图像)、E+(可扩展)、V+(视觉扩展),表明模型定位为多模态增强大模型。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。