大型语言模型 FUDOKI 非掩码离散流匹配 华为诺亚方舟实验室 突破传统!FUDOKI 模型让多模态生成与理解更灵活、更高效 ⭐0 👥0 近年来人工智能领域发生了翻天覆地的变化,尤其是大型语言模型(LLMs)在多模态任务上取得了显著进展。这些模型在理解和生成语言的能力上展现出了强大的潜力,但目前大多数多模态模型依然采用自回归(AR)架构,推理过程较为单一、缺乏灵活性。为此,香港大学和华为诺亚方舟实验室的研究团队提出了一种全新的模型 ——FUDOKI,旨在打破这一局限。FUDOKI 的核心创新在于其全新的非掩码离散流匹配(Discre
智能体 OpenAI 大型语言模型 AI实践指南 OpenAI 发布“智能体构建实战指南”实用性文档(附文档资源) ⭐0 👥0 人工智能领域领军企业 OpenAI 近日重磅发布了一份名为“构建智能体实践指南”("A practical guide to building agents")的实用性文档。这份共34页的指南旨在为产品和工程团队提供构建首个智能体系统的必要知识和最佳实践,其内容凝结了 OpenAI 从众多客户实际部署案例中获得的深刻洞察。通过阅读本指南,开发者将能够理解智能体的核心概念,掌握何时以及如何设计、构建
思维链 扩散式发散思维链 大型语言模型 西湖大学MAPLE实验室 开创性扩散思维链:让人工智能更具创造力和灵活性 ⭐0 👥0 在近年来的人工智能研究中,思维链的概念越来越受到重视,尤其是在大型语言模型的训练和推理中。最近,西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”,这是一种为扩散语言模型量身定制的全新推理方式。传统的大型语言模型通常采用线性思维链,即通过逐步推理生成答案。然而,人的思维过程往往更为复杂,充满了非线性和跳跃性的特点。齐教授的团队认为,模仿这种发散思维将有助于提升模
大型语言模型 LLM LocalScore MozillaBuilders Mozilla发布LocalScore:简化本地AI模型基准测试的新工具 ⭐0 👥0 Mozilla 最近通过其 Mozilla Builders 计划推出了一款名为 LocalScore 的工具,旨在为本地大型语言模型(LLM)提供便捷的基准测试。该工具兼容 Windows 和 Linux 系统,具有极大的潜力,成为了易于分发的 LLM 框架的重要组成部分。尽管 LocalScore 仍处于早期开发阶段,但其表现已相当不错。LocalScore 是基于上周发布的 Llamafil
Gemma3 量化感知训练(QAT) 大型语言模型 NVIDIARTX3090 谷歌发布 Gemma 3 QAT 模型:一张3090显卡也能轻松驾驭 ⭐0 👥0 谷歌近期推出了 Gemma3系列的全新版本,这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后,谷歌便发布了经过量化感知训练(QAT)优化的 Gemma3,旨在显著降低内存需求的同时,保持模型的高质量。具体来说,经过 QAT 优化的 Gemma327B 模型,其显存需求从54GB 大幅降低到14.1GB,意味着用户现在可以在 NVIDIA RTX3090等消费级 GPU 上本地运行这一大型模型
AI新词 QwenLong-L1-32B 长上下文推理 大型语言模型 阿里突破性发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型,性能媲美Claude-3.7 ⭐0 👥0 阿里巴巴今日正式发布QwenLong-L1-32B,这是一款专为长上下文推理设计的大型语言模型,标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A22B,与Claude-3.7-Sonnet-Thinking达到相当水平。技术创新亮点QwenLong-L1-32B最大的技术突破在于其是全球首个通过强化学习训练的长文本情境推理模型。该模型基于Qwen
大型语言模型 实时语音克隆 PersonaEngine 虚拟角色 Persona Engine:将虚拟角色带入现实的 AI 驱动工具 ⭐0 👥0 在快速发展的数字时代,虚拟角色与互动体验的融合正逐渐成为趋势。Persona Engine 应运而生,作为一款集成了 Live2D、** 大型语言模型(LLM)、 自动语音识别(ASR)、 文本转语音(TTS)** 和 ** 实时语音克隆(RVC)** 的全能工具包,为用户提供了创建生动、互动性强的数字角色的完美解决方案。这款引擎特别适合用于 VTubing、直播以及虚拟助手等应用,帮助用户在互动
Ollamav0.8 流式传输响应 大型语言模型 AIbase Ollama v0.8发布!AI流式响应+实时搜索,本地模型也能秒变智能助手! ⭐0 👥0 Ollama官方宣布推出其最新版本Ollama v0.8,为本地运行大型语言模型(LLM)带来了突破性升级。新版本引入了流式传输响应和工具调用功能,支持实时网络搜索等交互场景,显著提升了本地AI的实用性和灵活性。AIbase为您整理了Ollama v0.8的核心亮点及其对AI生态的影响。流式传输响应:实时交互更流畅Ollama v0.8最大的亮点之一是新增了流式传输响应功能。用户在使用AI模型进行
任务特定人工智能模型 大型语言模型 Gartner Midjourney Gartner报告显示:2027年,任务特定AI将超越通用AI ⭐0 👥0 近日,Gartner 发布了一份新报告,指出到2027年,企业将使用任务特定的人工智能模型的频率是通用大型语言模型的三倍。报告中提到,虽然通用的语言模型在语言处理方面具有强大的能力,但在需要深入理解特定业务领域的任务中,它们的响应准确性却会下降。因此,越来越多的企业开始关注定制化的 AI 模型,以满足其特定需求。图源备注:图片由AI生成,图片授权服务商MidjourneyGartner 的副总裁兼
AIAgent OpenAI 大型语言模型 实战指南 别再只玩ChatGPT了!OpenAI悄悄发布《构建 Agent 实战指南》 手把手教你打造智能体 ⭐0 👥0 OpenAI 最近悄悄发布了一份 《构建 Agent 实战指南》 (A practical guide to building agents),简直就是一份“AI 打工人”的养成手册!今天,老司机我就带你用最接地气、最有趣的方式,把这份官方秘籍给你扒个底朝天,让你也能轻松 Get 打造专属 AI Agent 的精髓!准备好了吗?发车!等等,Agent 到底是个啥玩意儿?跟普通软件有啥不一样?咱们先