Adobe 挑战 OpenAI,安卓 / iOS 版 AI 生图工具 Firefly 蓄势待发 62 0 IT之家 4 月 25 日消息,CNBC 昨日(4 月 24 日)发布博文,报道称 Adobe 公司为更有力挑战 OpenAI,计划推出移动版 AI 图像生成工具 Firefly。在伦敦 MAX 创意大会上,Adobe 公司宣布 Firefly 移动版将“很快”登陆 iOS 和安卓平台,但未公布具体日期。在接受 CNBC 采访时,Adobe Firefly 副总裁 Alexandru Costi
50 → 100 条:OpenAI 放宽限制,Plus 等用户每周可用 o3 AI 模型消息数翻倍 79 0 IT之家 4 月 24 日消息,OpenAI 公司首席执行官山姆・奥尔特曼(Sam Altman)今天(4 月 24 日)在 X 平台发布推文,宣布针对 Plus、Team 或 Enterprise 用户,放宽模型消息限制,o3 从每周 50 条升至每周 100 条,o4-mini 从每日 150 条升至每日 300 条,o4-mini-high 升至每天 100 条。IT之家此前报道,Open
UniToken 多模态建模 视觉编码 图文理解 UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成 179 0 声明:文来自微信公众号“量子位”,作者:UniToken团队,,授权站长之家转载发布。首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局!复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。UniToken通过融合连续和离散视觉表征,有效缓解了以往方法中“任务干扰”
人工智能 亿万富翁 创业故事 财富新闻 30岁华裔将成最年轻白手起家女富豪:是Scale AI联合创始人 114 0 站长之家(ChinaZ.com)4月24日 消息:近日,人工智能领域传来一则引人瞩目的财富新闻:30岁的华裔创业者郭露西(Lucy Guo)以12.5亿美元身家估值,超越知名艺人泰勒·斯威夫特,成为全球最年轻的白手起家女性亿万富豪。作为全球仅有的六位40岁以下白手起家女亿万富豪之一,郭露西的财富轨迹折射出人工智能时代的技术红利。这位出生于旧金山湾区的华裔二代,自幼便展现出对科技的敏锐洞察力。在
具身智能 宇树科技 机器人运动会 竞速跑 首届具身智能机器人运动会启动,宇树机器人携舞蹈与竞速项目参赛 200 0 首届具身智能机器人运动会将在无锡市盛大举行。作为重要参赛队伍之一,宇树科技将与来自全国各地的机器人企业同台竞技,参与激烈的竞速跑比赛以及精彩的舞蹈表演环节。截至目前,已有100多家相关企业报名参赛,来自北京、上海、深圳、西安、重庆等地的顶尖机器人公司将参与竞速跑项目,宇树机器人将在这一项目中与国家地方共建具身智能机器人创新中心(北京)、人形机器人创新中心(上海)等知名机构展开激烈竞争。除了竞速跑,
PerplexityAI 语音助手 AI助手 多任务处理 Perplexity语音助手全新升级,智能交互再创新高 114 0 Perplexity AI在其iOS应用中推出全新语音助手功能,进一步增强了AI助手的实用性与交互体验。据AIbase了解,新功能支持设置闹钟、查找路线、发送消息、预订餐厅等多项任务,结合强大的实时搜索与多应用集成,为用户带来无缝的智能生活体验。相关更新已在App Store上线,社区反响热烈,标志着Perplexity向综合AI助手领域的强势迈进。核心功能:多任务处理与实时交互Perplexit
Craft智能体 代码助手 AI编程 腾讯云 腾讯云代码助手CodeBuddy推出Craft软件开发智能体 支持MCP协议 180 0 4月24日,腾讯云宣布其代码助手CodeBuddy全新升级,推出Craft软件开发智能体,这一创新工具将AI编程从“补全代码”进化为“交付项目”,极大地提升了软件开发效率。据腾讯云介绍,使用Craft智能体的开发者平均编码时间缩短了超过40%,AI生成代码的占比超过40%,研发效率提升超过16%。在过去,开发一个完整的应用程序需要多个团队协作,包括前端、后端、测试和运维等,流程复杂且耗时。然而,C
元宇宙 Ray-Ban智能眼镜 实时翻译 MetaConnect Meta为Ray-Ban智能眼镜推出实时翻译功能 141 0 近日,Meta 公司宣布,为其 Ray-Ban 智能眼镜推出多种新功能,包括实时翻译、Instagram 消息和通话功能等。这些功能原本仅限于 Meta 的抢先体验计划用户,现在已全面向所有 Ray-Ban 智能眼镜用户开放。实时翻译功能最早在2024年 Meta Connect 大会上首次披露,并于去年12月在部分国家进行有限测试。现在,用户可以在支持的市场中,使用该功能与讲英语、法语、意大利语
Gemini Workspace 音频概述 AI工具 谷歌 Workspace 再添 AI 功能,音频概述与会议跟踪全新上线 104 0 谷歌近日宣布,旗下 Workspace 产品将引入更多 AI 工具,尤其是对其 Gemini 功能的扩展。这些更新包括新的音频概述()功能和改进的会议跟踪方式,旨在提升用户的工作效率和体验。新推出的音频概述功能,最初在谷歌的 NotebookLM 中亮相,允许用户围绕自己选择的研究主题创建播客。现在,通过 Gemini 平台,用户可以根据上传的文档和幻灯片生成音频文件。此外,用户还能在深度研究报告
SWE-PolyBench AI编程助手 大规模语言模型(LLM) AWSAILabs AWS 发布 SWE-PolyBench:评估 AI 编程助手的新开源基准 111 0 近日,AWS AI Labs 推出了 SWE-PolyBench,这是一个多语言的开源基准,旨在为 AI 编程助手的评估提供一个更全面的框架。随着大规模语言模型(LLM)的进步,AI 编程助手的开发已经取得了显著的进展,这些助手能够生成、修改和理解软件代码。然而,目前的评估方法仍然存在诸多局限,许多基准测试往往仅集中在 Python 等单一语言,无法全面反映真实代码库的结构和语义多样性。SWE-P
GPT-4.1 OpenAI AI模型 模型对齐 OpenAI 新推出的 GPT-4.1 模型面临对齐性下降的挑战 181 0 近期,OpenAI 发布了其最新的人工智能模型 GPT-4.1,声称该模型在执行指令方面表现优秀。然而,多项独立测试却显示,GPT-4.1在对齐性,即可靠性方面,相较于前代模型 GPT-4o 有所下降。通常,OpenAI 会在发布新模型时附上详细的技术报告,包含安全评估的结果。但此次却没有遵循这一惯例,OpenAI 解释称,GPT-4.1不属于 “前沿” 模型,因此不需发布单独的报告。这一决定引起
谷歌 AI 聊天机器人 Gemini 月活达 3.5 亿,与 ChatGPT 等竞品仍有差距 154 0 IT之家 4 月 24 日消息,根据正在进行的谷歌反垄断诉讼中披露的内部数据,截至 3 月,谷歌的人工智能聊天机器人 Gemini 全球月活跃用户数达 3.5 亿。IT之家注意到,在过去一年中,谷歌的 AI 产品使用量呈现出爆发式增长。数据显示,Gemini 在 2024 年 10 月的日活跃用户仅为 900 万,而到了上个月,其日活跃用户数已攀升至 3500 万。然而,尽管 Gemini 的用
消息称 OpenAI 计划今夏初发布开源语言模型,力争推理能力超越同类 174 0 IT之家 4 月 24 日消息,今年 3 月底,OpenAI 宣布计划在今年某个时候发布自 GPT-2 以来的首个“开源”语言模型,目前该模型的细节正逐渐浮出水面。据 TechCrunch 报道,消息人士透露,OpenAI 研究副总裁 Aidan Clark 正在领导这一开源模型的开发工作,该模型目前仍处于早期阶段。公司计划在今夏初发布该模型,并希望其在推理能力上超越其他同类开源推理模型。该模型
OpenAI 图像生成 GPT-image-1 API应用 微软上线GPT-image-1模型 通过API向开发者开放使用 110 0 4月24日凌晨,OpenAI正式推出了其全新图像生成模型GPT-image-1,并通过API向全球开发者开放使用。这一模型的发布标志着图像生成技术的又一次飞跃,为开发者带来了更多可能性。GPT-image-1与OpenAI此前的ChatGPT版本有很大不同,它不仅能够生成高质量的图像,还支持多种高级定制功能。开发者可以通过API控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量和压缩质量
# AI工具 # AI项目和框架 DAM-3B – 英伟达推出的多模态大语言模型 148 0 DAM-3B是什么DAM-3B(Describe Anything 3B)是英伟达推出的多模态大语言模型,专为生成图像和视频中特定区域的详细描述设计。模型通过点、边界框、涂鸦或掩码等方式指定目标区域,能生成精准且符合上下文的描述文本。 DAM-3B的核心创新包括“焦点提示”技术和“局部视觉骨干网络”。焦点提示技术将全图信息与目标区域的高分辨率裁剪图融合,确保细节不失真,同时保留整体背景。局部视
# AI工具 # AI项目和框架 Eagle 2.5 – 英伟达推出的视觉语言模型 178 0 Eagle 2.5是什么Eagle 2.5是英伟达推出的视觉语言模型,专注于长上下文多模态学习的 AI 模型,参数规模仅为 8B。参数量较小,但在处理高分辨率图像和长视频序列方面表现出色,性能媲美参数量更大的 Qwen 2.5-VL-72B 和 InternVL2.5-78B。Eagle 2.5 采用创新训练策略:信息优先采样和渐进式后训练。信息优先采样通过图像区域保留和自动降级采样技术,确保