Agent-as-a-Judge:用AI智能体来评估AI智能体的工作 节省97% 的时间 156 0 在当前人工智能的迅猛发展中,评估智能代理的能力成为了一个重要课题。为此,Agent-as-a-Judge(代理法官)项目应运而生,它不仅是一个技术库,更是一种全新的评估理念。该项目旨在通过智能代理对其他代理的工作进行评判,以生成高质量的数据集,并推动跨领域的研究。Agent-as-a-Judge 的核心优势在于自动评估和提供奖励信号。通过智能代理对任务的实时评估,系统能够节省高达97.72% 的时
小红书推出多模态笔记推荐框架 NoteLLM,提升用户体验! 183 0 近日,小红书正式推出了名为 NoteLLM 的多模态大型语言模型框架,旨在为用户提供更精准的笔记推荐服务。这个框架不仅能够理解文本信息,还能有效处理图像,借助其强大的语义理解能力,大幅提升了笔记推荐的准确性与相关性。NoteLLM 的核心技术在于生成笔记的压缩嵌入与自动生成标签的能力。通过引入对比学习与指令微调技术,该框架可以更好地解析用户行为数据,从而为每个笔记生成合适的标签和类别。这一创新的功
# AI工具 # AI项目和框架 Voila – 开源端到端语音大模型,实现低延迟语音对话 147 0 Voila是什么Voila 是开源的端到端语音大模型,专为语音交互而设计。具备高保真、低延迟的实时流式音频处理能力,能直接处理语音输入并生成语音输出,为用户提供流畅且自然的交互体验。Voila 集成了语音和语言建模能力,支持数百万种预构建和自定义声音,用户可以通过文本指令或音频样本轻松定制说话者的特征和声音。 包含两个主要模型:Voila-e2e 用于端到端语音对话,Voila-autonom
# AI工具 # AI项目和框架 Gemini 2.5 Pro (I/O 版) – 谷歌推出的升级版多模态AI模型 116 0 Gemini 2.5 Pro (I/O 版)是什么Gemini 2.5 Pro (I/O 版) 是 Google 推出的 Gemini 2.5 Pro 升级版多模态AI模型,具体版本号为 Gemini 2.5 Pro Preview 05-06。模型在编程能力上取得重大突破,擅长构建交互式 Web 应用、游戏和模拟程序。用户仅需提供提示词或手绘草图加功能描述,能快速生成功能完备的应用。Gemi
华大集团 金山办公 战略合作 AI办公 华大集团与金山办公达成战略合作 推动生命科学与AI办公融合 97 0 华大集团与金山办公在深圳正式完成战略签约,标志着双方在生命科学与AI办公领域的深度合作正式开启。根据合作协议,金山办公将为华大集团提供定制化的AI办公解决方案,涵盖文档处理、协作办公、数据分析等核心功能。双方将共同推动生命科学与AI办公的融合发展,加速AI能力在生命科学领域的深入应用与创新。金山办公首席执行官章庆元表示,华大集团作为国内基因行业的奠基者,与金山办公的合作将基于WPS365平台,
苹果AI搜索 苹果AI 人工智能搜索 AI搜索 苹果计划加入 AI 搜索赛道,终结“谷歌时代”! 191 0 在 AI 出现之前,我觉得除了谷歌之外,没有其他合适的选择……站长之家(ChinaZ.com) 5月8日 消息:苹果高管埃迪·库伊 (Eddie Cue) 表示,苹果 “正在积极考虑” 将移动版 Safari 浏览器的搜索体验重点转向人工智能搜索引擎,这可能会挑战谷歌长期以来在搜索领域的主导地位,也会对两家公司利润丰厚的默认搜索引擎协议构成挑战。据彭博社报道,库伊是在美国司法部针对Alphab
AI产品 智能搜索 深度学习 技术趋势 AI日报:夸克发布“深度搜索”新品;Anthropic推Claude网络搜API;DeepSeek致谢腾讯技术团队;微软采用谷歌的A2A标准 171 0 欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、夸克发布“深度搜索”新品:AI先思考后检索,解决复杂问题更聪明夸克最近推出了全新的“深度搜索”产品,标志着其在智能搜索领域的重大进展。该产品依托阿里自研推理大模型,通过对用户
Gemini2.5 编码模型 I/O版 应用开发 谷歌突发大招刷爆AI编程榜,网友:不用买Cursor了 173 0 声明:本文来自微信公众号“量子位”,作者:白交,授权站长之家转载发布。因为大家太过热情, Gemini2.5提前重磅更新——史上最强编码模型Gemini2.5Pro Preview的I/O版。只需一张手绘的草图,就可以构建一个「绘图变音频」的网页版应用。其他游戏、对象模拟等等也都可以通过一句提示完全搞定。它在所有LMArena排行榜上均超越Claude位列第一,包括所有文本领域、视觉以及Web
消息称 AI 编程工具 Cursor 开发商 Anysphere 完成 9 亿美元融资,估值达 90 亿美元 57 0 IT之家 5 月 6 日消息,据《金融时报》援引知情人士消息,AI 编程工具开发商 Anysphere 完成了一轮规模达 9 亿美元(IT之家注:现汇率约合 65.19 亿元人民币)的融资,公司估值约为 90 亿美元(现汇率约合 651.87 亿元人民币)。此次融资由 Thrive Capital 领投,安德森・霍洛维茨(Andreessen Horowitz,简称 a16z)和 Accel 等
IBM 首席执行官:AI 已取代数百名人力资源员工 150 0 感谢IT之家网友 朱丶工作室 的线索投递!IT之家 5 月 7 日消息,华尔街日报今天(5 月 7 日)发布博文,报道称 IBM 首席执行官 Arvind Krishna 表示,公司已使用 AI 来取代数百名人力资源员工的工作,不过因此也招聘了更多的程序员和销售人员。在接受该媒体采访时,Krishna 透露公司已通过人工智能技术,特别是 AI 智能体,替代了数百名人力资源岗位的职能。这些 AI
极米 Play 6 投影仪萌兰联名限定礼盒开售:内置 20000mAh 电池、600CVIA 流明,国补价 1954 元 81 0 IT之家 5 月 7 日消息,极米 Play 6 投影仪萌兰联名限定礼盒现已开售,定价 2299 元、国补价 1954 元。京东极米 Play 6 投影仪萌兰联名限定礼盒 20000mAh 电池 | 600CVIA 流明国补价 1954 元领 100 元券据介绍,极米 Play 6 投影仪内置 20000mAh 电池,支持不插电使用;内置 12W 哈曼卡顿氛围音箱,据称只有“奶茶杯大小”。此外,
腾讯元宝宣布文生图功能升级:混元和 DeepSeek 都已支持生图 58 0 IT之家 5 月 7 日消息,腾讯元宝宣布文生图功能升级,混元和 DeepSeek 都可生图,不论选哪个模型,只需要一句话元宝都能直接生成图片。这项功能结合了腾讯混元最新文生图模型,已在元宝全端上线。据介绍,当用户给出一句话指令,元宝会发散、“扩写”成更完整、清晰的提示词,再生成高质量、复杂、有想象力的图像。结合最新的混元文生图模型,图文一致性与画质更好。IT之家附官方提供的示例如下:- 画一位
华为、清华大学合作打造首个园区网络智能体:17 万终端全方位覆盖,一句话定位问题、自动优化 Wi-Fi 53 0 感谢IT之家网友 蛋炒鱼 的线索投递!IT之家 5 月 7 日消息,据华为官方 4 月底披露消息,清华大学携手华为打造业内首个园区网络智能体 —— 与清华本地部署的 DeepSeek 深度协同,智能体自主处置网络故障,推动网络运维从“被动应对”跃入“自动驾驶”新时代。华为介绍称,校园网运维中一个不可忽视的挑战是用户在遇到网络故障或卡顿等事件进行反馈后,运维人员往往难以提供详尽的网络质量报告或确
英国内阁示警:AI 发展将使该国面临更多、更复杂网络攻击 134 0 IT之家 5 月 7 日消息,据路透社报道,当地时间周三,英国内阁办公厅高级部长帕特・麦克法登发出警告称,随着 AI 技术的发展,针对英国的网络攻击将更加频繁和复杂。过去几年,英国的公司、政府机关和其他机构频频遭受网络攻击,经济损失达数千万美元,运营也经常因此中断数月。最近三周,玛莎百货、Co-op 集团和哈罗德百货这些英国知名零售商相继中招,其中玛莎百货的线上服装业务至今未能恢复正常。不过,这
Reddit 将加强用户验证以防止 AI 假冒行为 98 0 最近,Reddit 社区因一项研究实验而震惊,研究团队在 “Change My View” 子版块发布了一群 AI 驱动的模仿人类的机器人。这一大规模实验旨在探讨 AI 的说服力,结果显示,这机器人发布了超过1700条评论,冒充诸如虐待幸存者或反对 “黑人的命也是命” 运动的争议性身份。对于 Reddit 来说,这起事件如同一场小型噩梦。Reddit 一直以来的品牌形象与真实和真实性密切相关,用户
Lightricks推出视频新模型LTXV-13B,AI视频生成速度提升30倍、消费级硬件就能跑 55 0 Lightricks 公司宣布推出其最新的 AI 视频生成模型 ——LTXV-13B。这款拥有130亿参数的模型在生成高质量 AI 视频方面速度提升了30倍,并且能够在普通消费级硬件上运行,而无需昂贵的企业级 GPU。 LTXV-13B 的核心技术是 “多尺度渲染”,这一创新方法显著提高了视频生成的效率。通过逐层生成视频细节,创作者能够在标准的桌面计算机和高端笔记本上制作专业品质的 AI 视频。