AI热点 1周前 144 阅读 0 评论

中兴通讯 AiCube 智算一体机在文心 4.5 开源当天同步实现全系列模型适配

作者头像

AI技术专栏作家 | 发布了 246 篇文章

IT之家 7 月 7 日消息,百度 6 月 30 日一次性开源 10 款文心大模型 4.5 模型,涵盖从 47B 激活参数的混合专家(MoE)模型到轻量级 0.3B 稠密型模型,覆盖文本、多模态等多种任务需求。据中兴通讯今日消息,AiCube 智算一体机,在文心 4.5 开源当天便同步实现全系列模型的适配

据介绍,AiCube 智算一体机同步完成对 ERNIE-4.5-300B-A47B 等全系列模型的深度适配。这一突破得益于 AiCube 开放智算基座的灵活架构,可选配昆仑芯 P800 AI 加速卡,原生支持文心 4.5 系列模型。同时,AiCube 内置一站式模型迁移工具,用户无需修改代码,便可通过可视化界面快速完成模型部署,将传统需要数周的部署周期缩短至小时级。

另外,依托昆仑芯 P800 超大显存,AiCube 实现了文心 4.5 全系列模型的单机部署。针对多模态任务,AiCube 通过软硬件深度集成和优化,确保各组件高效协同;创新的动态资源调度和缓存优化技术,有效缓解 I/O 瓶颈,大幅提升 GPU 利用率。多维优化技术让 AiCube 充分挖掘算力资源潜能,为大模型提供了性能支撑。

IT之家注意到,AiCube 一体机不仅深度支持文心系列模型,还全面兼容 Qwen3、DeepSeek 等主流开源大模型。官方表示,其底层架构采用模块化设计,着眼于未来多模态模型的部署需求,全面适配 PyTorch、TensorFlow 等主流 AI 框架,灵活满足当前及未来多样化的模型场景需求,打造一机多模的“大模型统一底座”,降低了企业拥抱不同 AI 技术的门槛。

▲ 图源:中兴官网 | 中兴通讯 AiCube 训推一体机

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!