# AI工具 # AI项目和框架 DAM-3B – 英伟达推出的多模态大语言模型 148 0 DAM-3B是什么DAM-3B(Describe Anything 3B)是英伟达推出的多模态大语言模型,专为生成图像和视频中特定区域的详细描述设计。模型通过点、边界框、涂鸦或掩码等方式指定目标区域,能生成精准且符合上下文的描述文本。 DAM-3B的核心创新包括“焦点提示”技术和“局部视觉骨干网络”。焦点提示技术将全图信息与目标区域的高分辨率裁剪图融合,确保细节不失真,同时保留整体背景。局部视
酷开 AI闺蜜机 智能硬件 春季发布会 真正懂你的移动智慧屏 酷开AI闺蜜机C20系列发布:3999元起 95 0 快科技4月23日消息,酷开在以大爱AI”为主题的2025春季发布会上发布超级智能体以及智能体硬件酷开学习机Y41 Air、酷开闺蜜机C20系列等产品,在这次活动上,深耕AI领域多年的酷开宣布:正式以AI原生企业的定位面向未来发展。本次发布会的重点产品之一是酷开AI闺蜜机C20系列,其中32英寸Pro版8GB 128GB售价3999元,32英寸Ultra版升级为4K分辨率,8GB 256GB售价
Ray-Ban Meta 智能眼镜正式推出实时翻译功能,支持四种语言和离线使用 195 0 IT之家 4 月 24 日消息,Meta 公司今日宣布,将向所有 Ray-Ban Meta 智能眼镜用户推出一项全新的实时翻译功能。此前该功能仅以测试版的形式向部分早期体验用户开放,如今正式面向广大用户推出。据IT之家了解,该实时翻译功能支持英语、法语、意大利语和西班牙语四种语言,用户可以在对话中实时将这些语言相互翻译。只要提前下载了相应的语言包,即使没有 Wi-Fi 或移动网络连接,用户也能够
Anthropic 示警:Claude 等 AI 被滥用,引导舆论威胁公众认知 65 0 IT之家 4 月 24 日消息,Anthropic 昨日(4 月 23 日)发布博文,报告称 Claude 等前沿 AI 模型正被恶意行为者滥用,涉及“舆论引导服务”(influence-as-a-service)操作、凭证填充、招聘诈骗及恶意软件开发等活动。Anthropic 开发团队为 Claude 采取了多项安全措施,成功阻止了许多有害输出,但威胁行为者仍在尝试绕过这些保护。IT之家援引博
Gemini 谷歌AI AI聊天机器人 AI助手市场 谷歌Gemini用户暴涨至3.5亿!但仍被ChatGPT碾压 146 0 最新数据显示,谷歌AI聊天机器人Gemini全球月活跃用户已达3.5亿,展现出惊人的增长势头。这一数据来自谷歌反垄断诉讼中披露的内部文件,揭示了AI助手市场的激烈竞争格局。 爆发式增长轨迹-2024年10月:日活仅900万-2025年3月:日活飙升至3500万- 短短5个月:用户规模增长近4倍市场格局对比尽管增长迅猛,Gemini与行业领头羊仍存在明显差距:- ChatGPT:月活约6亿- Met
Flex.2-preview ComfyUI 文本到图像扩散模型 8亿参数 Ostris发布Flex.2-preview,8B参数扩散模型革新ComfyUI工作流 94 0 Ostris团队发布Flex.2-preview,一款基于8亿参数的文本到图像扩散模型,专为集成到ComfyUI工作流设计。据AIbase了解,该模型在基于线条、姿态和深度的控制生成能力上表现出色,支持通用控制与图像修补功能,延续了从Flux.1Schnell到OpenFlux.1、Flex.1-alpha的微调进化路径。Flex.2-preview已在Hugging Face开源,凭借Apach
图像标记化 主成分分析(PCA) AI图像处理 分层标记 香港与英国研究团队提出创新图像标记化方法 分层结构提升重建质量 190 0 一组来自香港和英国的研究人员近日提出了一种新型图像标记化方法,旨在以更紧凑、更精确的方式将图像转换为数字表示(即令牌)。与传统方法将信息均匀分布于所有标记中不同,该方法采用分层结构,逐层捕捉视觉信息,从而提升了图像重建的质量和效率。传统的图像标记化技术通常会将图像的每个部分均等地划分为多个标记,而新方法则采取了分层结构。最初的标记会编码大致的形状和结构元素,而后续的标记则逐渐添加更精细的细节,直到
mcp-server-weread Claude 微信读书 AI知识管理 mcp-server-weread工具实现Claude与微信读书笔记无缝交互,助力阅读与AI深度融合 155 0 近日,一款名为mcp-server-weread的实用工具在Twitter上引发热议。这款工具能够让用户在Anthropic的Claude AI中无缝访问微信读书的笔记和阅读数据,实现阅读笔记与AI的深度交互,为知识工作者和阅读爱好者提供了高效的解决方案。mcp-server-weread:微信读书与Claude的桥梁mcp-server-weread是一款开源工具,旨在打破微信读书数据与AI工具
Ray-BanMeta智能眼镜 实时翻译 Meta AI翻译 Meta Ray-Ban智能眼镜全面推送实时翻译功能,支持离线使用 180 0 Meta公司近日宣布,其Ray-Ban Meta智能眼镜的实时翻译功能已正式向全球用户开放。此前,这一功能仅限于部分市场的早期测试用户。此次全面推出意味着用户可以在多种场景下,享受到更加便捷的语言转换体验,尤其是能够在无网络的环境下,突破语言障碍。根据Meta的官方消息,Ray-Ban Meta智能眼镜的实时翻译功能现已覆盖全球销售市场,支持英语、法语、意大利语和西班牙语四种语言的实时双向翻译。用
GLM-4-FlashX GLM-Z1-Air GLM-Z1-AirX 智谱BigModel 智谱宣布旗下多款大模型产品降价 其中GLM-4-Plus降价90% 144 0 4月24日,智谱BigModel开放平台宣布进入“亿时代”,对旗下多款大模型产品进行价格调整,大幅降低使用门槛,让更多的企业能够以极低成本拥抱大模型技术。智谱BigModel开放平台此次价格调整涉及多个模型产品。其中,GLM-4-FlashX模型每亿tokens的价格仅为10元,该模型基于强大的预训练基座,具有超快的推理速度,功能调用能力与GPT-4相当,在数据抽取、生成、翻译等方面表现出色。GL
人工智能 meta meta智能眼镜 AI眼镜 Meta AI眼镜“实时翻译”功能全面开放,不联网也能用! 178 0 据 The Verge 等外媒当地时间 23 日报道,Meta 正在将包括实时翻译在内的各种 AI 功能扩展应用到雷朋智能眼镜当中。据悉,此前此前仅向“抢先体验计划”用户提供的实时翻译、通过 Instagram 发送消息和进行通话、基于周边视觉信息与 “Meta AI” 进行对话等功能,现在都将面向普通用户开放。实时翻译、通过 Instagram 发送消息和拨打电话、以及根据周围环境视觉信息与
青腾读书日 复旦大学 未来商业 AI消费融合 腾讯青腾联合复旦、阅文集团启动2025未来商业学堂 新增三大校委共探全球化、AI新机遇 60 0 4月23日,青腾读书日跨界思享会暨青腾十周年启动活动在深圳举办。腾讯青腾宣布与复旦大学管理学院、阅文集团联合发起“复旦-青腾2025未来商业学堂”,并新增三位校委成员。活动现场,腾讯集团高管、阅文集团高管、和青腾校友一起,探讨了“AI×IP×消费”的商业新融合。AI×IP×消费:未来商业新范式在活动上,腾讯集团高级管理顾问、青腾教务长杨国安教授围绕“技术创新时代的敏捷管理”展开深度分享。他指出
“AI 教父”等发布联名公开信: OpenAI 重组背离初衷,呼吁监管介入 170 0 IT之家 4 月 24 日消息,科技媒体 The Decoder 昨日(4 月 23 日)发布博文,报道称前 OpenAI 员工、研究人员及非营利组织联名发表公开信,强烈呼吁监管机构阻止 OpenAI 提出的公司重组计划。OpenAI 成立于 2015 年,最初为非营利组织,旨在确保通用人工智能(AGI)开发与公共利益保持一致。公司为筹集资金,于 2019 年设立营利子公司 OpenAI LP,
OpenAI 推出轻量级 ChatGPT 深度研究工具,免费用户也能用 84 0 IT之家 4 月 25 日消息,人工智能公司 OpenAI 今日宣布,将为 ChatGPT Plus、Team 和 Pro 用户推出其 ChatGPT 深度研究(deep research)工具的轻量级版本,并且也将面向 ChatGPT 免费用户推出该功能。ChatGPT 深度研究工具可浏览网页,针对某一主题编写研究报告。据 OpenAI 介绍,轻量级深度研究工具基于其 o4-mini 模型开发
人工智能 ListenLabs 市场研究 红杉资本 红杉投资AI初创公司Listen Labs筹集2700万美元,颠覆市场研究行业 58 0 近日,红杉资本投资的人工智能初创公司Listen Labs宣布,已成功筹集到2700万美元的融资,旨在颠覆传统的市场研究行业。公司通过创新的人工智能技术,实现了在数千个语音访谈中同时进行客户研究,极大提升了调研效率和精度。AI驱动的语音访谈,打破市场研究的时间与成本壁垒Listen Labs的核心技术依赖于先进的人工智能模型,能够在短短几小时内完成传统市场研究方法数天甚至数周才能完成的工作。客户只
阿里通义大模型 智能驾驶 卓驭科技 端到端智能驾驶世界模型 卓驭科技成功接入阿里通义大模型,推动智能驾驶技术发展 72 0 在最新的上海车展上,卓驭科技(简称 “卓驭”)宣布其已成功接入阿里通义大模型,这一举措标志着其在智能驾驶领域的又一重要进展。作为智驾驾驶供应商及服务商,卓驭借助阿里云的强大计算能力,致力于构建一个端到端的智能驾驶世界模型,以提升汽车的智能化水平。近年来,智能驾驶技术得到了快速发展,各大汽车制造商纷纷加大在这一领域的投入。卓驭科技在与阿里通义大模型的合作中,已经将其核心的大数据业务系统迁移至阿里云平