AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

4.8
0热度

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录月之暗面推出了专注于软件工程任务的开源模型 Kimi-Dev-72B,在 SWE-bench Verifi

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录

月之暗面推出了专注于软件工程任务的开源模型 Kimi-Dev-72B,在 SWE-bench Verified 测试中创下最高成绩,以72亿参数量超越了DeepSeek-R1,展示了其在编程领域的强大能力。

image.png

【AiBase提要:】

🚀 参数量仅为72亿的Kimi-Dev-72B在SWE-bench Verified测试中获得60.4%的高分,成为开源模型的新标杆。

🔍 模型结合BugFixer和TestWriter双重角色,确保代码质量和正确性,通过自我博弈机制提升性能。

🌟 未来计划与流行开发工具深度集成,持续优化并推出更强大的版本。

2、MiniMax-M1开源!1M超长上下文推理,AI新王者仅53万美元打造!

MiniMax-M1以其超长上下文推理能力、高效训练成本及开源特性引发关注,成为开源模型中的佼佼者。

图片

【AiBase提要:】

上下文窗口达1M输入和80k输出,远超GPT-4o,适合复杂文档分析和多轮对话。

训练成本仅53万美元,通过MoE架构和CISPO算法实现高效推理与低成本。

开源于Hugging Face平台,支持40k和80k思维预算,性能媲美顶级商业模型。

3、腾讯LeVo来袭!媲美Suno4.5的AI唱歌模型,支持零样本音色克隆

腾讯AI团队推出的LeVo模型以其强大的音色克隆、分轨生成和高保真音乐表现引发热议,与Suno4.5相比,它在多项关键指标上表现出色,同时支持零样本音色克隆和分轨生成,展现了革命性的突破。

image.png

【AiBase提要:】

🌟 支持零样本音色克隆,仅需3秒音频即可精准复制音色,大幅降低音乐创作门槛。

🎵 提供分轨生成模式,支持人声与伴奏分离,为专业音乐制作提供更高灵活性。

🌐 以开源形式发布,促进全球音乐创作社区的发展,提升中国AI技术国际影响力。

详情链接:https://levo-demo.github.io/

4、阿里巴巴发布 Qwen3升级版,适配苹果 MLX 架构

我非常看好这次阿里巴巴与苹果的合作,Qwen3升级版不仅支持更多语言,还增强了性能和推理能力,这标志着苹果智能在中国市场的发展迈出了重要一步。

image.png

【AiBase提要:】

🌟 阿里巴巴推出Qwen3升级版,与苹果MLX架构兼容,助力苹果智能在中国落地。

📱 新版Qwen3支持119种语言,具备更强性能和混合推理能力。

🚀 苹果智能尚未在中国上线,可能会在iOS18.6正式公测版中提供预览。

5、豆包电脑版与网页版上线“AI播客”功能

豆包推出全新‘AI播客’功能,通过上传PDF或链接生成自然双人对话播客,革新信息接收方式。

image.png

【AiBase提要:】

🌟只需上传PDF或链接,即可快速生成自然流畅的双人对话播客。

🏃‍♂️适用于工作、学习等多种场景,利用碎片时间高效获取信息。

🎙️语音效果逼真,去机器感,提供沉浸式听觉体验。

6、夸克App推出“夸克老师” 具备个性化AI辅导能力

夸克App推出了全新的学习产品‘夸克老师’,这款AI家教功能强大,能讲题、批作业、出题、找试卷,尤其擅长数学和物理难题的解答,同时具备因材施教的能力,通过分析学生的学习数据提供个性化的辅导。

image.png

【AiBase提要:】

✨ 集多种学习功能于一体,如讲题、批作业、出题、找试卷等,支持数学和物理难题的深度解析。

🎯 能够根据学生特点提供个性化辅导,模拟真人教师教学思路,帮助学生理解并提升学习效果。

📚 拥有海量题库资源,包括专业题库和名校真题,满足多样化学习需求。

7、松下全新 OmniFlow 多模态大模型,实现文本、图像与音频自由切换

我非常看好OmniFlow这款多模态大模型,它不仅能轻松转换文本、图像和音频,还能让用户根据需求定制生成结果,极大提升了操作灵活性和效率。

image.png

【AiBase提要:】

🌟 OmniFlow 支持文本、图像和音频的高效转换,带来全新的多模态体验。

⚙️ 采用模块化设计,各组件独立预训练,提高资源利用效率并优化训练效果。

🎯 引入多模态引导机制,用户可精准控制生成过程,满足多样化需求。

8、TikTok 全新Symphony AI工具上线:图片一键变视频,文字直接生成广告

TikTok 推出三款AI视频创作工具,包括"图像转视频"、"文字转视频"和"Showcase Products",旨在简化品牌广告内容制作流程。这些工具集成到 Symphony Creative Studio 中,并与Adobe Express及WPP Open合作,提升广告商效率。

image.png

【AiBase提要:】

✨ 图像转视频功能让静态图片轻松变为动态视频,只需上传图片和添加文字提示即可生成多个AI视频选项。

📝 文字转视频功能无需图片或模板,仅凭文字即可制作视频,助力广告商快速测试和完善创意。

🛍️ Showcase Products工具融合产品图片与数字化身,打造沉浸式广告体验,提升用户原创内容风格。

9、极氪与火山引擎携手,豆包大模型赋能智能座舱新体验

极氪汽车与火山引擎合作,将豆包大模型接入ZEEKR AI OS的新版中,提升智能座舱服务能力,优化个性化体验。

【AiBase提要:】

豆包大模型接入极氪智能座舱,实现精准推荐与个性化服务。

升级后的极氪智能语音助手Eva,支持从传统语音交互到大语言模型服务的无缝切换。

极氪第50万台车型009光辉下线,刷新豪华纯电车型最快纪录。

10、大模型新突破!Meta Llama3.1能回忆《哈利波特》42% 的内容!

斯坦福大学等机构的研究表明,Meta的Llama3.170B模型在文本记忆方面表现出色,尤其在热门书籍如《哈利波特》中的表现令人瞩目。

【AiBase提要:】

📚 Llama3.170B模型在《哈利波特》中能记住42%的内容,远超Llama165B的4.4%。

🔍 研究采用Books3数据库,通过标记段落测试模型的记忆能力。

🌟 热门书籍记忆效果更佳,显示AI在理解和处理文本上的进步。

11、Grok任务功能重磅上线!定时追踪X热门话题,AI效率直超ChatGPT

xAI旗下的AI助手Grok推出了全新的Tasks定时任务功能,通过自动化执行查询和外部通知,为用户提供高效便捷的信息获取体验。

【AiBase提要:】

🌟 支持多种任务频率,从即时到长期跟踪,满足多样化需求。

📧 提供外部通知功能,如邮件推送,结果主动找用户,提升使用便利性。

🏆 SuperGrok用户享有更高配额和优先体验尖端功能,如DeepSearch和Big Brain Mode。

12、Gemini2.5Pro即将更新Deep Think的功能

我作为一名AI助手,非常期待Gemini2.5Pro的新功能Deep Think。这个功能不仅提升了AI在复杂任务中的推理能力,还在用户体验和安全性上做出了重要改进。Deep Think的推出让我看到了AI在专业领域应用的无限可能。

image.png

【AiBase提要:】

💎 Deep Think功能通过多线程推理显著提升复杂任务中的性能,特别是在数学、编程和多模态任务中表现出色。

🌐 用户可通过网页UI直观切换至Deep Think模式,功能将逐步向更多用户开放。

🔒 在正式发布前,Google通过API收集反馈并进行安全评估,确保功能的稳定性和数据安全性。

13、谷歌地图迎来超大规模升级:全新AI功能带来智能评论与节油路线

谷歌地图通过引入生成式人工智能技术,对导航、探索及个性化推荐等功能进行了全面升级,为用户提供更加智能、高效的体验。

image.png

【AiBase提要:】

🌍 使用生成式AI搜索功能,通过自然语言实现精准地点查询。

🔍 智能评论分析功能,自动总结用户评论并解答关于地点的具体问题。

🌿 推出节油路线优化功能,结合多因素分析推荐更环保的行驶路线。

(举报)

首页 发现
看过 我的