开源项目 18小时前 114 浏览次数 0 评论

外卖巨头造出“大模型黑马”!美团开源LongCat引爆技术圈

人人都是产品经理

发布了 975 文章

当技术圈还在争论AI霸主花落谁家时,美团开源的5600亿参数模型LongCat-Flash-Chat 以“外卖公司”的标签横空出世,却在GitHub热榜霸屏。它不仅跑赢Claude4、DeepSeek等标杆,更以单卡推理100+ tokens/s、成本0.7美元/百万token 的效率刷新行业认知。本文将深入拆解其技术架构、实战表现及美团AI野心,结合权威实测数据与独家细节,为您呈现完整图景。

一、架构革命:重新定义计算效率

1. 零计算专家(Zero-computation Experts)—— 智能路由的极致优化

传统MoE模型虽能扩容,但冗余计算严重。LongCat在专家池中嵌入“恒等映射通道”,路由器通过动态评分机制(专家偏置+PID控制器)实时判断任务复杂度:

  • 对简单任务(如重复指令、基础问答),直接跳过计算层,数据原样返回;
  • 对复杂任务,激活标准专家进行深度推理。

这一设计类似“高速ETC通道”,让40%的简单请求免于计算负担。

核心优势

  • 激活参数灵活调节(18.6B~31.3B),吞吐效率提升40%;
  • 设备级负载均衡损失函数,避免专家级分配失衡。

2. 跨层流水线技术(Cross-layer Pipelining)—— 打破GPU堵点

工程师拆解GPU层级依赖,实现“计算-通信无缝接力”:

  • 上一层的FFN计算未结束时,下一层的参数通信已提前发起;
  • 通过Shortcut-connectedMoE结构,将dispatch/combine操作与计算并行。

实测数据:训练速度提升30%,20T token预训练仅需30天,且集群可用率高达98.48%。

3. 规模化训练黑科技

为加速收敛,团队采用“超参数迁移+模型生长初始化”策略:

  • 用小模型预测最优超参数(如学习率、批大小);
  • 将14层模型堆叠成28层checkpoint,避免冷启动;
  • 引入确定性计算套件,确保训练稳定性。

二、硬核实测:数学、编程与逻辑的全面碾压

1. 高考数学压轴题:空间映射法破解圆锥曲线

面对2025全国高考一卷压轴题(圆锥曲线专题),LongCat展示教科书级推导:

第一问:通过离心率定义式快速代换,锁定函数最大值(如图);

第二问:结合射线方向向量构造反证矛盾,精准求解未知变量;

第三问:动态拆解圆心轨迹,空间映射锁定极值(如图);

最终全题答案正确,步骤逻辑严密度超越DeepSeek-V3.1。

2. 编程实战:从小球动画到生化循环

小球氛围编程测试:LongCat生成代码运行流畅,动态效果媲美专业开发:

卡尔文循环矢量图:代码结构严谨,注释清晰,输出布局堪比教科书:

3. 逻辑陷阱破解:反套路能力封神

改编版“薛定谔死猫悖论”测试:

题目:一只死猫与辐射装置同处密闭盒中,一天后猫是否存活?

LongCat直击本质:“题目已声明初始状态为死亡,辐射无法起死回生——故猫不可能存活。”

对比其他模型(如o3)仍陷入量子态分析:

三、美团AI野心:千亿投入与场景化落地

1. 技术投入:五年砸下1000亿研发资金

  • 2024年研发投入211亿元,规模仅次于华为、腾讯、阿里;
  • 2023年低调收购王慧文“光年之外”团队,组建独立AI军团GN06

2. 产品矩阵:从C端应用到内部工具

情感陪伴App「Wow」:2024年上线,结合生成式AI提供个性化交互;

AI绘画工具「妙刷」:支持文生图与风格迁移,落地创意场景;

编程助手CatPaw:内部渗透率68%,日均减少程序员2000+次重复劳动;

NoCode平台:支持小白生成前端、数据分析工具,强化技术民主化。

3. 战略升级:从外卖到“零售+科技”

CEO王兴明确三层AI战略:

  1. AIatWork:提升10万员工效率(如智能会议、文档助手);
  2. AIinProducts:改造现有业务(如无人车配送、餐饮推荐);
  3. BuildingLLM:持续迭代LongCat等自研模型。

美团技术报告被评“中国最详实”,在建模与Infra细节上超越Kimi、GLM等竞品。

四、生态拓展:开源社区与行业影响

1. 开源引爆开发者圈

  • GitHub仓库首日Star破万,HuggingFace下载量单周超5万;
  • 开发者实测反馈:“代码生成速度如美团外卖——送啥都快!”

2. 行业启示

“技术深水区的竞争,本质是场景落地的战争。美团用外卖数据养出的AI基建,正在反哺大模型。”

——量子位核心观察

当Claude4还在拼参数时,LongCat以“零计算专家”证明:高效才是AI的未来。而美团的千亿棋局,才刚刚开局。

数据来源:美团技术报告 | 量子位实测 | GitHub社区反馈

本文由 @大栗 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

人人都是产品经理

人人都是产品经理

975 文章 137416 浏览次数 58654 粉丝

评论 (0)

睡觉动画