AI热点 3 months ago 213 Views 10 Comments

阿里通义成了AI的“黄埔军校”?

硅星人Pro公众号

Published 9565 Articles

声明:本文来自于微信公众号 硅星人Pro,作者:summer,授权站长之家转载发布。

AI之争,既是技术战,也是人才战。随着AI决赛圈逐渐收窄,头部玩家对顶尖人才的渴求也达到了新的高度。

从去年开始,各大科技巨头就纷纷调整战略,加大了人才招揽的力度:腾讯的“青云计划”以“业界Top0级别薪资”和“不设职级上限”吸引顶尖人才,并计划新增2.8万实习岗位以充实后备力量;字节跳动则启动“Top Seed计划”,专门为大模型、多模态等前沿领域的顶尖博士开放岗位。相较于新生力量,在这场竞逐中,经验丰富的AI核心骨干,更是成为了各方争夺的重中之重。

而阿里巴巴的通义实验室,在这一波浪潮中,其人才的流动尤为引人注目。

最近阿里通义实验室应用视觉团队负责人薄列峰被曝离职,引起了一轮热议。而这已是继2月语音团队负责人鄢志杰、2024年8月大模型技术负责人周畅之后,阿里AI核心部门第三次失去关键人物了。

一边是千问系列模型在榜单上大杀四方,一面却是研究团队的领军人物几次流失。这些带着阿里技术基因的核心人才,或投身其他大厂,或另立门户,成为行业暗战中的新变量。通义有点新一代“AI黄埔军校”的味道了。

通义实验室,一个被实战验证过的人才库

在通义之前,业界公认的AI“黄埔军校”是微软亚洲研究院(MSRA)。两者在培养顶尖人才摇篮的路径上,的确有不少相似之处。自1998年成立以来,MSRA为中国乃至全球AI领域输送了诸多关键人物,李开复、沈向洋、张宏江、陆奇、王坚等都出自这里。MSRA是初代由强大科技公司支持并投身于长期技术研究的组织。

而通义之所以能成为新的人才输出“富矿”,根基也在于强大的母体支持与长期的战略布局。

时间拉回到2017年10月,马云在云栖大会上宣布成立达摩院,初期投入千亿,立志将其打造成“致力于探索科技未知,以人类愿景为驱动力的研究院”。在时任院长张建锋(花名:行癫)负责之下,机器智能、数据计算等五大实验室迅速铺开。这一举措的背后,是互联网大厂试图复制新一代“微软亚研院”的时代雄心。 金榕、司罗、华先胜、王刚等一批在各自领域声名显赫的科学家,被内部戏称为“十三扫地僧”,为达摩院奠定了最初的人才基石。

相较于其他大厂的AI团队,由达摩院孵化而来的通义实验室,在顶尖人才密度、前沿技术探索和研究体系的系统性上,从一开始就建立了优势。 相比今天字节跳动般从内部抽调并辅以外部引援组建独立的Seed大模型团队,腾讯在既有AI Lab基础上修补增益的路径,客观来看通义实验室的布局的确更早,带来了更丰富的积累。

达摩院当初也成为国内最早嗅到并全力投入大模型浪潮的团队之一。 在OpenAI的GPT系列引爆全球之前,达摩院内部已启动大模型研究,并推出了M6等早期探索性模型。这种“跟进早、持续投入”的战略路径,使得通义在后续的大模型竞赛中,能够更快拿出具备竞争力的产品来跟进。

之后 Qwen的演进更是验证了通义更早的积累的重要性。它今天不仅在多个权威Benchmark上取得了与国际顶尖模型(如GPT-4、LLaMA系列)相媲美甚至超越的成绩,更关键的是,在达摩院时期阿里就已经开始把开源作为重要的技术竞争策略,甚至做了诸多基于开源的商业化尝试,这让后来阿里把Qwen系列中的多个版本(从1.8B到72B,乃至更大参数的闭源版本)进行开源的决策更加顺畅。

许多开发者反馈,Qwen在代码生成、长文本理解、多轮对话等方面的表现令人印象深刻。这种来自一线开发者的“用脚投票”,从侧面印证了通义团队在模型架构设计、训练数据构建、以及优化调优等方面的积累。

在模型性能之外,通义团队的一大特点,还在于研究方向覆盖面广,几乎涵盖了AI技术的各个关键维度——从自然语言处理到计算机视觉,从语音识别到多模态融合,在各个细分赛道都积累了技术人才。这些更早发生,且与阿里其他真实业务场景结合更紧密的技术研发积累,让通义成为了一个被实战验证过的人才库。当ChatGPT突然闯出后,这些真正有过丰富经验的人才就成了香饽饽。

大厂间挖角,人才流动是否会带来格局变动?

与MSRA诞生时,中国AI产业尚处萌芽,更侧重基础研究与人才启蒙的时代背景不同,通义成长于AI产业化竞争已趋白热化的阶段。这决定了通义的模型研发从一开始就更紧密地围绕市场需求与商业化落地展开。因此,从通义流出的技术人才,往往具备“即插即用”的实战能力和丰富的工程经验,一旦加入核心竞争对手阵营或另立门户,无疑会成为撬动行业现有格局的潜在变量。

比如周畅作为通义千问大模型的技术负责人之一,深度参与了Qwen系列模型从架构设计到训练优化的核心环节。他当时的出走引发的讨论和后续一些竞业的争议,来自对这种稀缺经验可能对竞争格局带来改变的预判。对大模型技术栈的理解、训练的Know-how以及对行业技术发展方向的判断,对于任何一家致力于大模型研发的企业而言都是宝贵财富。而鄢志杰作为前阿里达摩院智能语音实验室的负责人,在语音识别、语音合成及自然语言处理领域拥有超过二十年的研发经验和深厚的技术积累;薄列峰作为原通义实验室应用视觉团队负责人,在计算机视觉领域,尤其是在工业视觉、3D视觉、多模态内容理解等方向也有丰富实战经验,据公开信息,其团队的技术成果已在阿里云工业大脑、城市大脑等项目中得到应用。这些与MSRA时期的黄埔军校有很大不同,今天的通义,出走的都是能直接影响产业落地格局的关键人物。

对于阿里来说,会让外界担忧的是连锁反应,这些“将帅级”人才的流失师是否可能进一步影响其原团队部分成员的后续流动,或影响关键项目的研发方向和进度。在薄列峰离任后,通义应用视觉团队的领导权交接成为外界关注的新焦点,而官方至今尚未公布明确的继任者。

但从更广阔的行业视角审视,“黄埔军校”在每一个技术革新时期都会出现,这成为一种必然。这背后就是经验溢出对行业整体成熟度的关键作用。人才的合理流动本身是技术创新与生态繁荣的催化剂。一位算法工程师的评价颇具代表性:“从通义出来的人,在硅谷找工作都是有含金量的。”这从侧面印证了通义人才的市场认可度。

而对于试图通过“挖角”核心人才来快速弥补自身短板、甚至复制一个“小通义”的大厂或创业公司而言,只是挖人并非一条坦途。通义基于“研究院”土壤成长起来的独特AI研究氛围,以及阿里集团提供的海量真实业务场景、强大的算力支持和长期战略投入,是其成功的关键因素。

这让竞争变得更加复杂,阿里云 CTO 兼阿里通义实验室负责人周靖人曾强调:“现在模型研发不仅是模型、算法层的创新,而是个长期系统工程,要有坚定投入的耐心,今天做、明天停,对团队影响很大。阿里在通义千问上的投入是非常坚定的。” 这基本也说明仅靠挖人难以构建起真正的核心竞争力,它背后要做的是一个复杂庞大的系统工程。

对手人才流出可能在短期内为接收方带来战术上的优势,但长期来看,行业格局的变动更多取决于各玩家自身战略的清晰度、执行的彻底性、以及构建可持续创新体系的能力。对各家公司而言,真正的考验并非如何单纯“留人”与“抢人”,而是在持续的技术创新与开放生态中,如何巩固并提升自己的独特文化和竞争力。这盘棋,远比“抢人大战”复杂得多。

(举报)

硅星人Pro公众号

硅星人Pro公众号

9565 Articles 1578993 Views 950300 Fans

Comment (10)

User avatar

阿里通义千方百计,真有“黄埔军校”潜力!

User avatar

厉害了,这简直就是一场“军备竞赛”!

User avatar

这种想法,未来绝对会很精彩!

User avatar

感觉他们真的在用各种方式“造势”!

User avatar

厉害了,这简直是奇招!

User avatar

别闹,这想象力也太丰富了吧!

User avatar

感觉他们真的在用各种手段“练兵”!

User avatar

哈哈,这想法有点意思,未来可期啊!

User avatar

厉害了,这简直就是科技版的“脑洞”!

User avatar

阿里通义千方百计,真有“黄埔军校”潜力! 搞什么啊,这比炒菜还玄乎!

睡觉动画