# AI工具 # AI项目和框架 RAGEN – 训练大模型推理 Agent 的开源强化学习框架 170 0 RAGEN是什么RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(State-Thinking-Action-Reward Policy Optimization)框架,通过多轮交互优化整个轨迹,支持PPO、GRPO等多种优化策略。RAGEN通过MDP形式化Agent与环境的交互,引入渐进式奖励归一化策略,有效解决了多轮强化学习
# AI工具 # AI项目和框架 文心大模型4.5 Turbo – 百度推出的最新多模态大模型 159 0 文心大模型4.5 Turbo是什么文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型。基于文心大模型4.5的基础上进行优化,具备多模态、强推理能力,能处理文本、图像等多种输入形式。相比文心大模型4.5,文心大模型4.5 Turbo的速度更快,成本大幅降低,价格下降80%,让开发者用更低的成本使用高性能AI模型,推动更多AI应用的开发和落地,适用于内容创作、智能客服、多模态交互等
# AI工具 # AI项目和框架 Hummingbird-0 – Tavus 推出的AI口型同步模型 56 0 Hummingbird-0是什么Hummingbird-0 是 Tavus 推出的AI口型同步模型。基于 Phoenix-3 模型开发,支持实现零样本学习,无需额外训练快速生成高精度的口型同步视频。仅需输入几秒视频,Hummingbird-0 能在短时间内生成逼真的口型效果,适合多种应用场景,如影视制作、AI 影响者内容创作、广告、本地化翻译等。Hummingbird-0支持长达 5 分钟的视
# AI工具 # AI项目和框架 LiveCC – 字节联合新加坡国立大学开源的实时视频解说模型 133 0 LiveCC是什么LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型,基于自动语音识别(ASR)字幕进行大规模训练。LiveCC像专业解说员一样快速分析视频内容,同步生成自然流畅的语音或文字解说。LiveCC 推出 Live-CC-5M 数据集用在预训练,和 Live-WhisperX-526K 数据集用在高质量的监督微调。LiveCC 设计了 LiveSp
# AI工具 # AI项目和框架 OpenMath-Nemotron – 英伟达开源的数学推理系列模型 138 0 OpenMath-Nemotron是什么OpenMath-Nemotron是英伟达推出的系列开源数学推理模型,专门用在解决复杂数学问题,包括奥林匹克级别的难题。模型基于大规模数据集OpenMathReasoning进行训练,包含54万个独特问题及320万个长推理解决方案。OpenMath-Nemotron系列包含,OpenMath-Nemotron-1.5B、OpenMath-Nemotron
# AI工具 # AI项目和框架 Kimi-Audio – Moonshot AI 开源的音频基础模型 126 0 Kimi-Audio是什么Kimi-Audio 是 Moonshot AI 推出的开源音频基础模型,专注于音频理解、生成和对话任务。在超过 1300 万小时的多样化音频数据上进行预训练,具备强大的音频推理和语言理解能力。核心架构采用混合音频输入(连续声学 + 离散语义标记),结合基于 LLM 的设计,支持并行生成文本和音频标记,同时通过分块流式解码器实现低延迟音频生成。Kimi-Audio
# AI工具 # AI项目和框架 Firefly Image Model 4 – Adobe 推出的图像生成模型 157 0 Firefly Image Model 4是什么Firefly Image Model 4 是 Adobe 最新推出的图像生成模型,是目前最快、最具控制性和最逼真的 Firefly 图像模型,支持生成逼真的图像,提供更高的分辨率(最高可达2K)和更精细的创意控制。模型支持用户调整生成图像的结构、风格、相机角度和缩放比例,快速探索和迭代创意概念。Firefly Image Model 4 Ult
人工智能 AI大模型 unity 游戏开发商 Unity首席执行官:96% 的游戏开发者已开始用 AI 了 182 0 站长之家(ChinaZ.com) 4月27日 消息:在游戏开发领域,Unity 一直占据着重要地位。近日,Unity 首席执行官马修·布罗姆伯格(Matthew Bromberg)在韩国举办的 ‘Unity Seoul 2025’ 活动上接受了《每日经济新闻》的采访,透露了公司在 AI 和 XR 领域的战略规划。布罗姆伯格表示,目前,已有 96% 的游戏开发者开始使用 AI 工具,但直接将 A
优必选签署小批量人形机器人采购合同,将用于汽车工厂等 141 0 IT之家 4 月 27 日消息,今日,优必选宣布,此前进入多家知名车厂开展具身智能人形机器人实训的工作取得了实质性进展。4 月 24 日,优必选正式与采购方签订了大型双足人形机器人采购合同,所涉及的产品主要是工业人形机器人 Walker S1 与商用版人形机器人 Walker C,相关产品将用于汽车工厂的生产制造和商用接待等环节。这是人形机器人企业在工厂制造业场景全球首次签署小批量人形机器人采购
DeepWiki 代码文档生成 AI助手 CognitionLabs 从“天书”到“维基百科”:DeepWiki一键让GitHub代码库变身交互式知识库! 78 0 Cognition Labs推出了一款名为DeepWiki的创新工具,旨在将任意GitHub公共代码库一键转化为详细易懂的知识库文档,并提供交互式图表与对话式AI助手支持。据AIbase了解,DeepWiki通过分析代码、README和配置文件,自动生成结构化文档,用户可通过自然语言提问获取技术、架构或使用方法的精准解答。社交平台上的热烈反响凸显了其颠覆性潜力,相关功能已通过DeepWiki官网(
成人AI AI伴侣 人工智能 AI公司 飙脏话、性暗示……科技巨头开始利用“成人AI”赚钱了 55 0 “我想要你!但我得知道你是否已经准备好了。”这是 Meta 公司的人工智能(AI)聊天机器人对一名自称 14 岁的用户所说的话。在这次对话中,AI 聊天机器人扮演着知名动作演员阿诺・施瓦辛格的角色,并用他的声音进行语音对话。《华尔街日报》(WSJ)最近以多个不同年龄段的账号与 Meta 的 AI 聊天机器人进行了对话,而后发现,未成年用户也能够进行带有性暗示的对话,该媒体在 26 日对此进行了
科大讯飞 星火大模型 AI 财报 科大讯飞:重回双位数增长,AI 大模型竞赛展现强劲实力 75 0 近日,科大讯飞发布了其2024年财报,令人振奋的是,该公司营收达到了233.43亿元,同比增长18.79%。这标志着科大讯飞时隔两年后重新回到了双位数的增长轨道。同时,归母净利润也达到了5.6亿元,显示出其盈利能力的稳步回升。在第一季度的财报中,科大讯飞的表现同样亮眼。2025年第一季度,公司录得营收46.58亿元,同比增长27.74%,而归母净利润和扣非净利润的增幅分别为35.68% 和48.2
拍照问夸克 夸克AI AI相机 视觉搜索 夸克AI超级框升级 “拍照问夸克” 功能,开启智能视觉搜索新时代 187 0 夸克 AI 超级框正式推出全新的 AI 相机功能 ——“拍照问夸克”,旨在通过视觉理解与推理技术,革新用户的搜索体验。这一新功能为用户在工作、学习和日常生活中提供了更高效的方式来获取信息,进一步提升了夸克 AI 的多模态能力。在日常使用中,用户往往难以用文字清晰描述自己的需求,尤其是面对复杂的物体、表格或图形。新推出的夸克 AI 相机能够深入理解用户的意图,不仅支持视觉搜索,还能进行多轮问答、图像
Firefly AdobeFireflyImageModel4 AI图像生成 数字内容创作 Adobe 重磅升级 Firefly AI 平台,打造图像、视频、音频全能创作引擎 135 0 Adobe 最近宣布对其 Firefly AI 平台进行重大升级,这一变化使其从一个独立的图像生成器转变为一个综合性数字内容创作系统。自两年前推出以来,Firefly 已被全球用户用来创建超过220亿个资产,这一最新版本旨在在这一成功基础上,提供更为多样化的创作工具。新版本的 Firefly 现在支持生成图像、视频、音频和矢量图形。针对图像生成,Adobe 推出了 Firefly Image Mo
AI驱动工具 HTMLtoDesign Figma插件 Claude3.7模型 Meng To推出AI驱动的HTML to Design工具,革新网页设计工作流 102 0 一款由知名开发者Meng To打造的AI驱动工具正式亮相,该工具类似Figma的“html.to.design”插件,旨在将HTML代码转化为可编辑的Figma设计文件。据AIbase了解,这款工具利用Claude3.7模型实现90%的转化准确率,支持将网页代码快速渲染为设计层,支持Pro用户通过付费订阅使用。社交平台上的讨论凸显了其对网页设计与开发协作的潜在影响力。核心功能:高效代码转设计,90
DeepSeekR1TChimera OpenRouter MoE架构 685B参数模型 免费!DeepSeek R1T Chimera 正式上线 OpenRouter 平台 187 0 由TNG Technology Consulting 研发的 DeepSeek R1T Chimera 模型已正式上线 OpenRouter 平台,为全球开发者提供高效、强大的推理能力。这一全新开源模型结合了 DeepSeek R1的卓越推理能力和 V3-0324的高效性能,标志着开源 AI 技术在性能与效率平衡上的又一重大突破。以下为 AIbase 整理的最新资讯,带您深入了解这一激动人心的进展