AI热点 4小时前 84 浏览次数 0 评论

ICT巨头转身AI“交钥匙商”:中兴全栈技术输出,打造国家队新质生产力

智东西

发布了 112 文章

智东西

作者 | 李水青

编辑 | 漠影

智东西8月12日报道,2025世界人工智能大会(WAIC)期间,由国务院国资委统筹指导、中国移动牵头建设的国家级AI开源开放平台“焕新社区”正式启动。这一平台肩负着整合央企资源、推动AI普惠发展的战略使命,已有90余家央企、50余所高校及20余个组织加入。

作为首批共建单位,中兴通讯正式开源NTele-R1-32B-V1、7B-Curr-ReFT、3B-Curr-ReFT等6款自研发模型及5个行业数据集,以及 “Co-Sight 超级智能体” 和配套工具链,为AI国家队提供技术动能,展现出ICT巨头向AI技术输出者的成功跨越。

成立40年的中兴通讯,不仅是全球5G先锋,更凭借“芯片+硬件+软件+应用”的软硬件综合优化及全球交付能力,成为央企数智化转型的关键伙伴。

近日,通过对话中兴通讯战略和生态首席专家屠嘉顺、中兴通讯星云通信大模型研发总工刘昆麟博士,我们对这家ICT巨头的AI实力以及6G+AI等垂直行业未来趋势发展有了更深入认识。

一、三大核心能力,40年ICT经验助百家央企智能化转型

“焕新社区”定位独特,屠嘉顺指出:“它是一个更聚焦央国企和To B垂直领域的AI生态平台。所有的大模型及数据集,基本都面向To B的产业需求。” 其核心使命是解决大模型在百家央企真实场景的落地难题。

中兴通讯以“技术输出者+生态共建者”双重身份,通过三大能力精准补位:

1、模型与数据集开源:小样本的“精兵”策略

中兴通讯首批开源6个自研大模型及5个行业数据集,覆盖电信、多模态等关键领域,并计划持续开放训练方法、算法框架等底层能力,为国家队开发者提供基础技术支撑。

其明星成果——电信大模型NTele-R1-32B-V1,仅用800个精选样本(400数学+400代码),即在多项测评中超越Qwen3-32B、QwQ-32B等行业标杆。

中兴通讯还基于其创新训练范式,开源了7B-Curr-ReFT和3B-Curr-ReFT轻量化模型。3B-Curr-ReFT在AI2D数学推理测试中准确率达83%,超越26B参数的 InternVL-26B(79%)和32B参数的Llava-Next-32B(81%)。

2、国产AI芯片生态协同:做开放的“连接者”

面对GPU算力的短板,中兴联合国产GPU厂商开展软硬件协同优化。屠嘉顺坦言:“GPU算力确实是一块短板,需要耐心突破。但中兴的独特价值在于‘连接’,即集群GPU之间的互连技术。”

他进一步描绘了生态愿景:“我们想象中未来的计算生态应是开放的,能将多个厂家的GPU放在一个资源池里协同工作。中兴致力于成为这个开放生态的‘连接者’和‘使能者’。” 不再依赖单一来源,可有效规避因个别厂商断供、技术封锁等带来的风险,这正推动着国家队智算体系的稳定性与自主可控性。

3、智能体应用落地:从“打工人”到“指挥官”

值得一提的是,中兴通讯本次还开源了 “Co-Sight超级智能体” 及配套工具链,降低开发者创新门槛。这一超级智能体在GAIA基准测试中以72.72分夺冠。其采用“主管智能体+执行智能体”的协同架构和DAG任务引擎,将行业研究周期从数周压缩至1小时。

刘昆麟生动地解释了其进化:“常规智能体像一个‘打工人’,而超级智能体更像一个‘指挥官’,能调度各种已有的智能体或服务功能协同作战。”

从技术生态视角看,中兴通讯的参与并非简单的资源堆砌,而是通过 “模型 – 数据 – 硬件 – 应用” 的全链条协同,为焕新社区构建起完整的技术支撑体系。

依托40年ICT经验,中兴的技术输出直击产业痛点。以电信运维为例,其自研星云大模型驱动的“网优专家”系统在云南移动实现了网络优化全流程自动化,非现场处理时长缩短20%,用户上行速率提升30%,有力推动了运维从“人工经验”向“数据驱动”的跃迁。

现在,这家ICT巨头正将其40年ICT经验迁移到百家央企数智化转型过程中,成为中国 AI 国家队不可或缺的核心力量。

二、全栈输出:从电信到千行百业,打造新质生产力

尽管大众印象中的中兴“强在硬件”,但其核心竞争力实为软硬件协同优化和一站交付的全栈能力。

屠嘉顺精辟总结道:“中兴的核心竞争力是做软硬件的协同优化,并提供‘交钥匙’的解决方案。这不是简单的卖设备,而是结合客户现有行业场景,致力于成为客户数智化转型路上的长期伙伴,通过清晰的阶段规划与持续的技术赋能,帮助客户一步步将数智化蓝图转化为现实。”

2023年启动大模型战略后,中兴在2025年迎来技术爆发期:

1、小样本训练匹敌大模型:三阶数据管理直击数据痛点

中兴通讯开源的电信大模型NTele-R1-32B-V1,以 “小样本高效训练” 实现性能超越,成功实践了“数据质量优于数量”的路径。

刘昆麟博士再次强调了其底层逻辑:“这并不意味着大模型对数据量的依赖被彻底打破,而是证明:如果能找到‘量身定制’的关键数据,少量样本也能激发出匹敌大量数据的效果。”

具体来看,NTele-R1-32B-V1实现了三阶数据管理策略的创新突破,直击大模型训练中 “数据冗余与模式固化” 的行业痛点:

(1)优选 “教师模型”,锚定高质量参考样本。研发团队选定QwQ-32B作为 “教师模型”,对初始S1数据集中的每个问题抽样50个回答,确保知识蒸馏的 “源头质量”。

(2)筛选高难度样本,强化复杂任务处理能力。研发团队对样本问题的回答正确性进行量化评估,保留高难度样本形成S-hard数据集。这种 “靶向训练” 策略使模型聚焦复杂任务,训练效率提升40%。

(3)构建多样化推理路径,打破模式固化。通过计算每个问题答案之间的列文施泰因距离(字符串相似度指标),为每个问题选择最多5个距离最远的答案,最终形成包含965个样本的训练数据集,从而有效避免蒸馏过程中模型 “死记硬背” 单一推理路径的问题,显著提升了模型的泛化能力。

该模型的技术价值不仅在于性能指标的领先,更在于为中国 AI 国家队提供了 “小样本训练” 的可复制方法论。刘昆麟告诉智东西,这种聚焦场景建模、精炼数据的方法论,已成功复制到钢铁、水利等行业。

2、轻量化模型打破参数迷信:后训练激发模型智能

多模态智能领域长期存在 “参数规模决定性能” 的固有认知,中兴通讯推出的 Curr-ReFT(Curriculum Reinforcement Fine-Tuning)训练范式,使3B、7B参数的轻量化视觉语言模型(VLM)在多项任务中超越26B、32B大模型。

Curr-ReFT 的创新点集中在 “课程式强化学习” 与 “基于拒绝采样的自提升” 两大模块,形成闭环优化体系:

(1)课程式强化学习:三阶递进式能力培育。研发团队借鉴人类认知规律,将训练任务分为三个难度递增阶段,配合分层奖励机制,使模型能力稳步提升:

第一阶段(二元决策学习):通过“是/否”类简单任务(如“这是苹果吗?”),快速建立基础视觉理解与简单推理能力,奖励函数聚焦“准确率”。

第二阶段(多项选择学习):引入多选项任务(如“水果里哪个最大?”),强化模型的细节分辨与决策能力,奖励函数兼顾 “准确率” 与 “推理步骤完整性”。

第三阶段(开放式回答学习):以复杂开放式问题(如“描述这幅画的故事”)激活综合推理能力,奖励函数涵盖“逻辑性”“流畅度”“信息完整性”多维度。

(2)拒绝采样自提升:平衡能力提升与基础技能保留。为避免模型在提升复杂推理能力时丢失基础语言技能,研发团队采用两步优化机制:

高质量样本筛选:引入大尺寸模型作为教师模型,从模型生成结果中筛选评分超过 85 分的样本(评估维度包括准确性、逻辑性、格式规范度),构建精编数据集。

自我迭代优化:以精编数据集为参考,同时混合少量多任务多领域高质量多模态数据,通过持续对比修正模型输出,在提升复杂任务处理能力的同时,确保基础语言技能不退化。

刘昆麟对此技术趋势判断明确:“所谓的‘参数规模决定性能’的行业认知,应该早就过时了。关键在于如何通过后训练(如强化学习)更充分地激发模型潜能,将预训练阶段掌握的模糊概念凝练成解决实际业务的能力。”

他进一步指出业界共识的转变:“OpenAI近期也提出,未来强化学习可能占算力消耗的大部分,预训练只占一小部分。”

3、6G前沿的务实“干粮”:从“考题”到“生产力”

整合40年电信领域知识,中兴通讯开源了TFCE(Telecom Function-Calling Evaluation)数据集,成为中国AI国家队在通信行业的核心 “技术弹药”,填补了全球电信领域函数调用评估的空白。

TFCE数据集包含1800余个通信专用函数、917道Python实战题目,覆盖4G、5G、6G、无线通信网络优化、物联网、网络安全等全场景,被刘昆麟称为电信AI的“标准考题”。

他阐释了其设计理念:“TFCE避免简单的知识问答,聚焦于通信网络的智能化运维、优化业务和渐进式创新。题目设计源于真实产业痛点,是‘实战化考题’。” 这体现了中兴将40年工程经验转化为AI“养分”的务实作风。

TFCE的推出为中国AI国家队带来多重价值:提供统一的电信AI模型评估标准,降低通信行业 AI 开发的入门门槛,并加速电信领域AI技术迭代,通过标准化测评推动模型向 “高准确率、高适配性” 进化。

屠嘉顺提到,未来6G网络中的AI是原生的,6G是一个会思考的网络——在6G中我们可以实现云边端响应时间控制,通过边缘大模型及终端小模型,为6G网络管道提供思考能力,让智能无处不在。

当下,开源模型大战竞争激烈,中兴通讯相比于互联网大厂的差异化护城河何在?

屠嘉顺一语道破本质:“方向上有较大区别。现在的互联网公司大量做To C业务,中兴更聚焦To B领域,用‘连接+ 算力’全栈能力为钢铁、电力、金融等行业提供端到端解决方案。” 其护城河源于三方面:

1、前瞻布局:随着2022年底ChatGPT爆发,整个通信行业深受其影响。中兴通信发现6G是AI内生的,2023年初就制定大模型战略,2024年发布千亿级MoE通信模型,至今加速迭代出多款开源大模型及数据集,落地行业,并成为焕新社区的技术输出者。

2、场景Know-How:40年电信经验沉淀为可复用的行业知识图谱。刘昆麟强调:“数据只是表象,真正护城河是能稳定产生数据的场景。真正产生价值的,是让模型到真实系统里去交互,这一过程积累的语料和迭代经验,是比单纯数据更高效的资产。”

3、研发效能革新:中兴通讯内部进行了AI研发绩效工具创新,从而大幅提升人效,加速了技术迭代。

从电信行业中来,到千行百业中去。行业案例成为中兴通讯全栈实力的最佳印证。

在云南泼水节保障案例中,面对200万游客的网络洪峰,中兴“大模型+智能融合板”双智协同体系对180个基站实施精准护航,达成“零卡顿感知、零中断服务、零重大投诉”的“三零”目标,高负荷小区占比降20%以上,直播上行速率提升30%。

结语:AI使能者入局,加速AI普惠新生态

从NTele-R1-32B-V1的小样本“精兵训练”,到Curr-ReFT激发小模型的“潜能革命”;从TFCE深入产业的“标准考题”,到Co-Sight指挥多智能体的“超级指挥官”,中兴通讯以全栈开源的“干粮”,为AI国家队构建起坚实的技术底座。其星云大模型已在电力、金融、钢铁等千行百业落地生根。当这家拥有40年深厚ICT功底的巨头,以开放之姿躬身入局AI国家队,以“交钥匙”的务实态度赋能百家央企,中国AI的“新质生产力”图景,正加速从愿景照进现实。

智东西

智东西

112 文章 15029 浏览次数 0 粉丝

评论 (0)

睡觉动画