谷歌推出 Project Astra,智能助理可控 Android 手机 166 0 谷歌近日正式发布了 Project Astra 的最新功能,该项目展示了其强大的智能助理能力,能够控制 Android 手机。这一技术目前已经以应用程序的形式提供给受信任的测试者,并在 Pixel9Pro 上进行了演示。在演示中,用户在修理自行车的过程中,与 Astra 进行实时对话。用户首先请求 Astra 在线查找一份 PDF 手册,Astra 随后打开文档,并以悬浮气泡的形式展示其触控操作,
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破 155 0 字节跳动 发布了一款名为 BAGEL 的开源多模态基础模型,拥有70亿个活跃参数,整体参数量达到140亿。BAGEL 在标准多模态理解基准测试中表现出色,超越了当前一些顶级开源视觉语言模型,如 Qwen2.5-VL 和 InternVL-2.5。此外,在文本到图像的生成质量上,BAGEL 的表现也与强大的专业生成器 SD3相媲美。更重要的是,BAGEL 在经典图像编辑场景中的效果优于许多领先的开源
AI起号 抖音整治 内容产业分化 虚假信息 继小红书后,抖音也开始专项治理“AI起号”! 198 0 声明:本文来自于微信公众号 见实,作者:见实,授权站长之家转载发布。通过AI技术实现“日产千条视频、周产百个账号”,类似这样的“AI起号流水线”你有听过吗?近期,抖音开始重拳出击整治这些“AI起号”了!抖音对利用AI进行账号批量生产、传播虚假信息的黑灰产链条展开了重点打击,共清理了311条违规内容,封禁了“心x甜”等15个严重违规账号。这场针对“AI起号”的专项治理行动,近期不仅仅发生在抖音,
英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识 70 0 IT之家 5 月 21 日消息,科技媒体 marktechpost 昨日(5 月 20 日)发布博文,报道称英伟达针对物理推理任务,设计推出了 Cosmos-Reason1 系列模型,提升了 AI 在物理常识和具身推理方面的表现,为机器人、自动驾驶车辆等领域带来实际应用潜力。Physical AI 挑战人工智能(AI)在语言处理、数学和代码生成领域取得显著进步,但将其能力扩展到物理环境仍面临挑战
谷歌实验室推出新 AI 工具 Stitch:文字、图片可秒变 UI 设计与前端代码 201 0 IT之家 5 月 21 日消息,谷歌 I/O 2025 大会首日活动已经结束,众多更新与新工具发布,其中包括 Gemini 模型的升级、谷歌搜索中 AI 模式的更广泛推广以及用于媒体创作的全新生成式 AI 工具。而在众多亮点中,谷歌实验室(Google Labs)推出的一项名为 Stitch 的新实验项目颇为有趣。Stitch 旨在解决从构思用户界面到实现可运行代码这一过程中常见的繁琐与反复沟通
多邻国创始人:AI 教学优于人类,但学校仍将存在并承担托育功能 87 0 感谢IT之家网友 往事2016 的线索投递!IT之家 5 月 21 日消息,据《财富》20 日报道,语言学习应用多邻国近年来大举押注生成式 AI。这家以猫头鹰吉祥物闻名的公司去年在财报电话会议上曾用 AI 头像短暂“替代”CEO,更在上个月宣布将永久用 AI 取代合同工。多邻国的野心目前自然已不止于此。凭借每月 1.16 亿用户积累的大量学习数据,公司掌握了激发学习动机的方法,甚至可以在考试前
英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界 185 0 近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理环境中成为了一大挑战。物理 AI(Physical AI)不同于传统的人工智能,它依赖于视频等感官输入,并结合现实物理法则来生成反应。物理 AI 的应用领域包括机器人和自动驾驶车辆等,需要具备常识推理能力
字节跳动海外版剪映 CapCut 推出 AI 营销平台 Pippit,并注册相关商标 55 0 天眼查信息显示,北京字跳网络技术有限公司近期申请注册了多枚“PIPPIT”商标,覆盖教育娱乐、科学仪器、网站服务、广告销售等多个国际分类,目前商标状态均为等待实质审查。据公开资料,Pippit AI 是字节跳动旗下视频编辑应用 CapCut(剪映海外版)新近推出的 AI 营销内容创作平台,于今年4月份正式发布。此举表明字节跳动正积极拓展其在 AI 营销领域的布局。
Framer发布全新AI功能,Wireframer秒建网站,Workshop生成交互组件,Vectors 2.0与A/B测试引爆设计新热潮! 176 0 Framer在I/O2025期间宣布推出全新AI功能套件,包括Wireframer、Workshop、Advanced Analytics和Vectors2.0,通过AI驱动的网站布局生成、交互组件设计、矢量绘图升级和高级分析工具,显著降低了网站创建的成本和复杂度。这些功能面向所有用户开放,无需Beta测试,引发全球设计师和开发者社区的热烈反响。AIbase综合最新社交媒体动态,深入解析Frame
腾讯混元 TurboS 技术报告全面揭秘,560B参数混合Mamba架构 172 0 腾讯发布了混元 TurboS 技术报告,揭示了其旗舰大语言模型 TurboS 的核心创新与强大能力。根据全球权威大模型评测平台 Chatbot Arena 的最新排名,混元 TurboS 在239个参赛模型中位列第七,成为国内仅次于 Deepseek 的顶尖模型,并在国际上仅落后于谷歌、OpenAI 及 xAI 等几家机构。混元 TurboS 模型的架构采用了创新的 Hybrid Transfor
英伟达 黄仁勋 戴尔 AI转型 黄仁勋:AI十年变革拉开序幕,“这个赛道没有第二名” 158 0 “未来十年将是人工智能(AI)大转型的关键时期。在这场竞争中,没有第二名的空间,必须成为第 一。”站长之家(ChinaZ.com) 5月20日 消息:2025 年 5 月 19 日(当地时间),英伟达 CEO 黄仁勋在美国拉斯维加斯举行的“戴尔科技世界 2025”(Dell Technologies World 2025)大会上发表主题演讲,明确表示:“未来十年将是人工智能(AI)大转型的关键
英伟达发布 GR00T N1.5 人形机器人 AI 基础模型,黄仁勋称将推动“下一代工业革命” 175 0 IT之家 5 月 20 日消息,在 2025 台北国际电脑展上,英伟达首席执行官黄仁勋宣布大幅扩展机器人开发基础设施,推出人形机器人基础模型 Isaac GR00T N1.5 新版,并称其为“下一代工业革命的核心构建模块”。该模型的亮点在于大幅提升了训练效率,传统人工数据采集通常需要近三个月,而新模型通过 GR00T-Dreams 工具生成合成数据,新版本开发可以缩短到 36 个小时,显著缓解了
模型上下文协议(MCP) Windows Anthropic AI应用 微软宣布Windows11原生支持MCP 81 0 微软宣布对 Windows 系统进行重大升级,以支持一种名为模型上下文协议(MCP)的新标准。这一标准由 Anthropic 于去年推出,常被称为 “AI 应用的 USB-C 端口”。MCP 的引入,将使得开发者能够更加便捷地让他们的 AI 应用与其他应用、网络服务及 Windows 的各个部分进行互动。Windows 的首席执行官 Pavan Davuluri 表示,他们希望 Windows 平
人工智能 AI数据中心 富士康 英伟达 富士康与英伟达携手打造100兆瓦人工智能数据中心 92 0 在全球最大的合约电子产品制造商富士康(Foxconn)与知名芯片制造商英伟达(Nvidia)之间,合作的脚步愈发坚定。近日,富士康在台北国际电脑展上宣布,将分阶段建设一座专门针对人工智能(AI)应用的数据中心,预计其总功率将达到100兆瓦(MW)。富士康董事长刘扬伟在展会上透露,该人工智能数据中心将采取逐步建设的方式。刘董事长强调,由于电力资源在台湾的稀缺性,该项目的推进并非一蹴而就。初期计划将从
谷歌i/o大会 2025谷歌i/o大会 谷歌i/o大会2025 谷歌AI 谷歌I/O大会全汇总:Gemini升级、AI搜索、Android XR等重磅更新 194 0 未来几周还将有更多科技大会接连登场。但对大多数软件开发者来说,谷歌I/O 是最重要的一场,因为全球数百万开发者都必须跟上搜索巨头在操作系统与服务层面的最 新变化。如今,谷歌的业务早已扩展至 Android、Chrome、搜索和 Workspace 以外 —— AI 是下一个主战场。从去年的 I/O 至今,公司已在 AI 领域推出多个重大进展。以下是谷歌I/O 大会 2025 中最重要的更新内容
谷歌 Meet 视频会议平台将上线 Gemini“AI 同传”,可还原声音、语气、情感 201 0 IT之家 5 月 21 日消息,在今日的 I/O 大会上,谷歌宣布将实时语音翻译功能引入 Meet 视频会议平台。该技术借助 Gemini 人工智能,可将用户语音实时翻译成对方所使用的语言。谷歌表示,Meet 将提供的 AI 翻译不仅能准确保留语义,还能还原说话者的声音、语气甚至情感表达。目前,该功能已向 Pro 和 Ultra 计划订阅用户开放,预计将在今年晚些时候推广到企业客户。在演示中,一