近日,华为昇腾计算领域副总裁刘伟在“2025 华为算力场景发布会暨北京 xPN 伙伴大会”上,分享了昇腾 APN 在一些场景上的进展。
据悉,APN 的芯片发货量相比之前有了显著增长,25 年 H1 发货量同比增长 1.2 倍。目前,华为昇腾对伙伴体系的管理已能支持钻石伙伴通过自身通道直接向华为下单。

“在人工智能爆发阶段,大家更需要关注需求,所以我更多地去接触最终客户,了解他们的需求后,再结合伙伴的能力,把合适的项目推荐给相关伙伴。”刘伟说道。
2025 年下半年,昇腾将实施从低算力到高算力全面覆盖边端场景的策略,同时,部件产品重点投入 Atlas 300I A2 和 310 模组,以此提升产品解决方案的竞争力并完善生态丰富度。
310 系列此前已发布多款,今年为了满足特定的巨深场景和低功耗场景,在 310P 上发布了 70T 及 100T 的算力。期待已久的 910B 的 300A2 标卡,以往多在数据中心见到的标卡,目前在市场上开始逐渐放量,不过还处于早期发货阶段。刘伟表示,团队正和伙伴在一些场景中验证方案可行性,预计之后会批量发货。

“人工智能发展过程中,很多客户其实并不清楚自己的具体需求。”刘伟称,“有时候大家可能觉得算力越大越能解决客户需求,但实际并非如此,即便算力达到很高水平,有时也满足不了客户诉求。所以拓展客户场景时,要以满足客户实际需求为最终目标,不能单纯比拼算力和功耗。”
目前,华为昇腾产品的场景已从之前的应急、教育、医疗、金融等场景,开始向传统行业快速渗透。产品系列算力范围从 8T 到 560T,这主要是因为当前支持 int8 类型。

“人工智能的发展不应只靠算力的线性增长来解决智能问题,因为线性发展难以应对智能在感知、决策和执行方面的挑战,所以需要用非线性的方式,跳出单纯看算力的思维,通过其他方式来解决问题。”刘伟表示。据悉,当前其团队已有解决方案,但要之后再揭晓。
刘伟介绍,300I A2 目前两卡运行 32B 模型的性能是友商的两倍,四卡运行 70B 模型的性能是友商的 1.5 倍。

CANN 全面开源开放,架构灵活、工具链完备,2025 年底将完成 A2 版本开源。刘伟表示,在开源方面,编译器和指令集层面并非所有伙伴都能轻松应对,但其他部分会逐步开源,同时也会积极对接 Triton、ARM 等开源社区,目前已经完成了部分对接。
算力是智能化发展的支撑。IDC 中国研究副总裁周震刚在会上指出,全球服务器保有量和 CPU 核数提升,ARM 架构服务器增长迅速,中国市场增速更高。数智时代算力基础设施需具备高性能多核处理器等特性,并具备面向 AI 应用的加速技术。大模型推动下 AI 基础架构市场高速增长,算力需求结构从训练向推理倾斜,自主创新算力崛起,智能算力需求爆发式增长且供给部署方式多元。