AI热点 4月前 236 浏览次数 10 评论

讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新

AI中国
AI中国

发布了 11569 文章

全技术栈开发,让更多的想象力成真了。



进入 2025 这个被誉为「Agent 元年」的下半场,我们见证着一众 AI Agent 的智能水平正朝着同一个新目标快速发展:


用全技术栈把创意直接变成可运行的产品。


就在上周,有媒体报道 AI 独角兽 MiniMax 完成了新一轮融资,公司估值突破 40 亿美元关卡。这家成立三年多的「年轻」公司再一次获得资本青睐。


而就在上个月的 MiniMax Week,他们做了一系列开源动作:从超长上下文的 MiniMax-M1 推理模型,再到 AI 视频模型 Hailuo 02、MiniMax Agent 、Hailuo Video Agent、Voice Design,在各个技术社区引起了广泛关注。


30 天前,MiniMax Agent 产品刚上线时,我们就做了第一时间的全面测评:《MiniMax 的 Agent 做得怎么样?|我们实测了 7 个案例,给出 3 点思考》。


之后我们一直在跟进这款 Agent 产品的更新和迭代。


现在,这位拥有完整 AI 技术栈的实力玩家 MiniMax,又让他们的 AI 原生 Agent 产品完成了一次关键升级——全栈开发能力正式上线。



🚥


接下来的部分,我们将分享完整的评测报告,以及对Agent全技术栈能力的2个核心洞察。


全栈开发让更多的想象力成真了


1)来打造一个「十字路口 Crossroads」播客社区吧!


亮点:深度搜索、视觉识别、支持 Supabase、会员系统、Stripe 付费


MiniMax Agent 现在支持全栈开发,也就是说,前端界面和后端功能可以一起搞


比如我们想做个几乎涵盖所有基础功能的「十字路口 Crossroads」播客社区,就可以输入:


打造「十字路口 Crossroads」播客社区(支持 MiniMax MCP + Stripe 支付) 你是一名全栈开发者,目标是开发一个类似 Spotify 的播客社区平台,命名为「十字路口 Crossroads」。该平台通过调用 MiniMax MCP 接口,将用户上传的播客文稿自动生成语音内容,构建一个围绕播客内容的听、评、聊、付费下载的一站式社区。 🎯 核心目标: • 支持上传播客文稿 → 自动生成 AI 音频 → 发布为可播放内容; • 听是免费的,但下载每个音频需支付 5 美元(通过 Stripe); • 平台具备基础社区互动功能和内容审核机制。



这个时候,MiniMax 会提醒你去 Supabase 注册一下,这是一个 「开源版 Firebase」的系统,可以快速构建后端,不需要自己搭建服务器、数据库和认证系统。



注册流程很简单,MiniMax Agent 会自动提醒并给出网址:



在 Supabase 注册完成后,创建一个项目,剩下的事情就完全不用管了——Agent 会自动处理所有技术对接。



Supabase


我整理了下开发播客社区平台「十字路口 Crossroads」的完整流程,大致分为四个阶段:


第一阶段就是后端搭建,Agent 会自动创建数据库结构,配置文件存储等基础功能。整个过程有详细的执行日志,可以看到每一步在做什么。



剩下三个阶段就是前端开发,用户系统与支付功能,功能完善与上线部署。



任务流程上,我很明显地感受到新版本 MiniMax Agent 现在的「反思」能力更全面了。即使网站已经部署完成,Agent 还会继续优化,添加更多社区互动功能,力求做到完美。



在完成构建并部署上线后,MiniMax Agent 还会进行端到端测试与总结。


可以说,MiniMax Agent 这回最大的特点就是它「端到端」能力提升了一大截:



最后,MiniMax Agent 给出的是一套「前端 + 后端 + 数据库/存储 + 边缘函数 + 支付集成」的完整全栈项目。


你可以下载所有代码文件,也可以将成品网站 Share 给他人(亲测有效):



下面来让我们看看 MiniMax 生成的播客社区,功能有多完整。


首先是网站首页,基本上该有的要素都有了,每一个模块都连接着后台数据库,全部可互动:



MiniMax Agent 提供的这个创建账户功能并不只是个模拟器或者是前端展示,它背后连接了 Supabase,能完整实现注册、激活、登录的全套流程。


比如说,我们可以直接在和 MiniMax Agent 聊天时,把自己的邮箱设为管理员,注册完就能管理整个网站后台了。



当你在上面这个页面系统里注册账户后,会收到来自 Supabase 的邮件,点进去就等于激活账户:



最能体现 MiniMax Agent 全栈能力的就是它提供了完整的后台。


在「个人主页」里,你可以重新设置账号、名称、收藏夹等等;在「上传播客」页面可以完整地上传音频文件。



在「管理后台」的总览页面,我们能看到有多少用户登录了播客社区,还有订单购买时间、收入等数据,全都是实时更新的。




新版 MiniMax Agent 与提示词的一致性更好了。


比如,你如果在提示词里设置一句「登录账户,才可以评论」的功能,出来的成品里就会出现这个新功能,而且所有匿名用户的评论也同样会被记录在网站里:



当然,页面的美观度还有改进空间。


这时候我们可以发挥想象力,一次性给整个网站换个全新风格,比如:


任天堂复古游戏风,低分辨率,黑色背景


MiniMax Agent 的「端到端」能力,让它能够保持极佳的一致性,迅速地为整个网站规划元素相似的风格:



与此同时,我还为这个「十字路口 Crossroads 播客社区」的用户设了一个规则,每个播客售价 5¥:



为了实现付费功能,需要接入 Stripe 支付平台(一家全球在线支付处理平台)的接口。设置过程很简单,MiniMax Agent 会直接给出注册网址,进去注册就行了。


像是下面这样:




这样一来,所有用户登录网站后必须付费才能下载播客音频。


我录制了一段 Gif 展示了具体测试的过程。


当你点击付款按钮后,如果账户余额足够成功支付的话,才可以去下载音频,整个流程很流畅,没有出现功能衔接不了的情况:



我也把这段音频放上来了,是关于「Koji 与鸭哥」的一段访谈内容:



用下来感觉 MiniMax Agent 的工作流程越来越熟练了。主要是因为它的任务起点是「深度搜索」,信息储备很充分,所以最终输出的结果一致性很高。


它能以极快的速度从 0 到 0.99,构建一个完整的平台。


我再举个例子,只是简单输入一段这样的提示词:


把这个播客社区转换成 Spotify 风格,简洁有美感。


MiniMax Agent 在几分钟内就做出了一个工业美学风的播客台:



里面很多元素的一致性非常非常高,且每个播客栏目的封面图与标题之间的协调度也很好。


像是「海洋诗篇」、「街道故事」栏目等等,很文艺:



在实际体验过程中,我还发现 MiniMax Agent 在批量搜索图片和视觉识别方面越来越得心应手了。以前让它做这类任务,它只是按量完成,现在则是追求更高的完成度。


大概就是之前求「做完就行」,而现在是「求精、求好」:




2)一句话就可以构建的「 AI 算命 MCP 」


亮点:搭建可复用 MCP、接入大模型 API


现在,MiniMax Agent 支持一句 Prompt 直接构建 MCP,还能保存到本地或者直接在聊天框里重复使用,甚至保存到工具栏里随时调用。


比如,我想做个「算命服务」MCP:让我输入任何内容,它用「算命大师」的语气来回答,背后调用 MiniMax 的 API 来支持。


就可以输入下面这段提示词,需要的朋友可以直接 Copy:


你是一位全能AI开发助手,请为我创建一个基于MCP协议的“算命服务”MCP服务器。

1. 使用 Python 编写;

2. 支持运行于MCP框架中(例如MiniMax Agent平台);

3. 实现一个名为 fortune_telling 的MCP操作; 4. 用户输入一段描述内容,系统将其作为 user_input 传入;

5. 后端调用大模型,使用如下 prompt: “你是一位通晓命理、星象、八字与塔罗的算命大师,请根据以下内容进行命理解析,要求包含:①性格分析②当前运势③建议,风格神秘隐晦,不给具体时间,只谈趋势,语言富有象征性,不使用现代词汇。用户内容为:{{user_input}}”; 6. 将生成的内容作为 output 返回。 后端调用大模型MiniMax的API,(API Key为______)


MiniMax Agent 几乎简化了中间需要人力操作的复杂步骤。


比如以前最让新手头疼的就是「工具调试」,现在它会自动测试,运行自己做好的 MCP 工具,看结果是否成功输出了:



完成后,你只需要输入几个字和 API Key,就能保存到 MiniMax Agent 里,以后随时复用,这点做的还是挺贴心的:



有了趁手的 MCP 后,我们就可以基于它「随意」开发了。


比如最简单的就是让它做一个前端界面,将 MCP 嵌入其中,构建一个完整的「天机占卜」网站。


提示词如下:


请创建一个充满东方古韵的算命网页前端,用户输入提示词,你调用「算命服务」MCP服务器,输出结果,字体为宋体,体现中华传统文化的深厚底蕴和古典美学:


一个「探天机·观人生·知命运」的古风网站就很迅速地完成了,你可以提问多种类型的问题:



这种一句话就能构建出来的可复用且非常成熟的 MCP,确实为「灵敏开发者」们提供了更多的想象空间。


3)定时全网搜索的「AI 初创公司融资新闻站」


亮点:Cron job 自动运行、全网搜索


MiniMax Agent 现在还支持 Cron job (定时任务),能够更灵活地设定时间间隔,自动运行脚本或命令。


像是,我想用它做一个 AI 初创公司融资信息新闻站,1 分钟更新一次,就可以输入下面这段提示词:


每隔 60 秒自动调用一次 Serper API 使用关键词如 “AI 初创公司融资” 或相关短语进行搜索 从 API 返回结果中提取最新的一条新闻:标题、摘要、来源链接 在页面上显示最新新闻内容,无需手动刷新 页面应自动更新:旧内容被最新内容替换(或可选择以列表形式累积展示)


这里,你需要去 Serper[1] 注册一下拿到 API,这是一个为开发者提供 Google 搜索相关 API 接口的平台,注册完后就可以随时调用它的搜索能力了:



大概几分钟过后,一个比较有科技感又富有动态交互效果的 AI Funding News 网站就顺利建好。


进入这个网站,一开始会有「最新 AI News 雷达搜索」效果的展示。


等它搜索完毕后,来自全网多个信息来源的 AI 初创新闻都被完整地列好,并且每 60 秒可以更新一次:



像是我点击 Reuters(路透社)的一条「美国人工智能初创公司融资激增,数据显示更多风投基金融资受阻」新闻,它会自动跳转到该条新闻所在的网站,整个过程很流畅:



4)高度一致性的「彩虹小熊」PPT


亮点:图片生成、高一致性 PPT


与上回我们介绍 MiniMax Agent 的流程一样。


这回我在试用时,发现它做 PPT 的效果还不错,所以我就准备让它用「彩虹小熊」风格,来给自己的工作流程创建一个完整的 PPT。


提示词如下:


基于我上传的MiniMax Agent工作流程Word文档,创建一个完整的PPT演示文稿,将文档内容进行可视化呈现。 PPT里所有的图片全部用自己生成的可爱彩虹小熊,生成一个萌宠环游世界的主题海报,绘制一系列萌宠在世界各地标志性建筑或风景前的可爱插画。 每一张PPT用一张小熊的插画,如萌宠在埃及金字塔旁玩耍、于中国长城上漫步等,通过色彩鲜艳、形象生动的画面来直观呈现主题;或者设计以萌宠环游世界为主题的海报、贴纸、动画等,在画面中融入地图、飞机、行李箱等旅行元素与萌宠形象相结合,突出主题的趣味性和活力感,吸引观众的目光。


看一看 MiniMax Agent 的效果吧,是不是非常可爱,每一张 PPT 的一致性都很高。


这一整套「MiniMax Agent 智能工作流程」涵盖了它工作时的六个阶段,甚至自动总结出了它的实际案例、功能和技术栈:






整个使用过程非常流畅。虽然复杂任务需要注册一些第三方平台(如Supabase、Stripe),但 MiniMax Agent 会明确告诉你需要哪一步,提供注册地址,让整个流程很清晰。


全技术栈的 Agent 有什么吸引力?


1)技术门槛正在消失,创意与生产力直接挂钩


我还依稀记得几年前,如果想要做个「凑合能用」的网站,你得找前端工程师负责用户看到的页面,找后端工程师处理数据逻辑,还要有人搞定数据库存储。一个简单的网站,可能需要 3-4 个技术人员配合,花费几个月时间。


当 Agent 能够以全技术栈进行 Vibe 开发时,现在只要会说话,说「自然语言」就行,靠感觉、靠想法来开发。

像是一句「做个播客社区」,几分钟后就有了包含用户系统、支付功能、内容管理的完整平台。这不是演示,是真能用的产品。


这种变化最直观的体现就是:想法验证的时间被大幅压缩了。一个有想法的普通人,他的能力被 AI 成倍放大了。


「1 个人的公司」正在快速成真,技术壁垒在消失,但是这同样意味着使用相同 AI 工具可能导致创业者们的产品同质化,如何差异化成为关键。


创意和市场洞察变得比以往任何时候都更重要。


2)端到端能力的需求,比以往任何时候都重要


当市面上出现如此多的 Agent 产品后,用户的品味早已经变得挑剔。AI Agent 不应再满足于「做完就行」,而是追求「做好做精」。


以前的 AI 工具更像个实习生,交代什么做什么。现在更应像个有经验的员工,不仅完成任务,还会主动优化、反思改进。


可以说,「端到端能力」是 Agent 的新 Benchmark(基准测试)。


比如播客平台做完后,它还会自动进行端到端测试,确保每个功能都能正常使用,甚至「是否达到生产级标准」。


什么样的 AI Agent 最会被喜爱?我们总结了下:


【1】Agent 能够在过程中主动进行优化,承认自己做的「不足」,在生成的过程中自动测试各种功能,尽量别麻烦用户;


【2】Agent 需要保持风格统一,换个主题能保持整体设计协调。就像一个有经验的设计师,知道怎么在变化中保持统一感。


🚥


前几天,OpenAI 终于正式展示了他们的 Agent 产品,把 ChatGPT、DeepResearch、Operator 这些技术都封装整合进了一起。


这正好说明,AI Agent 的「故事主线」才刚起了个头。


接下来估计还会有更多公司加入这场「AI Agent」的竞赛,展现他们谁更懂技术、更有品味、更了解用户需求。


不过,大家的终极目标都非常美好:


让有想法的人终于不用再等别人来帮忙实现了。


那么,你想解决什么有创意的问题?又想为谁创造温暖的价值呢?



参考资料


[1]Serper: https://serper.dev/


文章来自于“十字路口Crossing”,作者“镜山”。

AI中国

AI中国

11569 文章 2144100 浏览次数 950300 粉丝

评论 (10)

User avatar

预言成真了,我简直要跳起来!

User avatar

简直是天才之作,我给它打满分!

User avatar

感觉世界末日之后,MiniMax拯救了我们!

User avatar

别怀疑了,MiniMax就是未来,谁也别想挡住!

User avatar

这种发展简直是神迹,我膜拜!

User avatar

简直是人类文明的下一个飞跃,太棒了!

User avatar

感觉我的人生都被它提前了十几年!

User avatar

别我说,MiniMax这趋势,简直是宇宙的旨意!

User avatar

简直是预言实现了,我早就觉得它会大爆发!

User avatar

这事儿太对了,MiniMax这玩意儿,简直是未来!

睡觉动画