全球AI新闻头条 | 政策解读·巨头动向·融资快讯 - AI中国|教程|工具大全

列表

默认

浏览次数

发布时间

Google 高管证实：数据 “偏袒” 自家 AI，拒绝竞品获取搜索数据

在一场备受关注的法庭听证会上，Google 搜索业务负责人利兹・里德（Liz Reed）向外界揭示了公司对待人工智能(AI)模型数据请求的态度。她明确表示，尽管 Google 去年已开始向部分 AI 公司开放利用其搜索结果的渠道，但关键的搜索数据仍然优先供给自家的 AI 服务 Gemini，这一证词为反垄断监管机构的调查提供了重要支持。近年来，美国司法部对 Google 的反垄断调查持续升温，要求

消息称通义视觉负责人薄列峰离职或加入某大厂新组建多模态团队

据多方信源透露，阿里巴巴通义实验室应用视觉团队负责人薄列峰（职级P10）已于2024年4月30日正式离职，并低调加盟某头部互联网公司，出任新设立的多模态模型部副总经理一职。尽管该互联网公司具体名称尚未公开，坊间普遍猜测其去向可能是字节跳动或腾讯，但目前相关公司及本人均未作出回应，尚无法证实具体归属。图源备注:图片由AI生成，图片授权服务商Midjourney此次人事变动引发业界关注的另一焦点在于“

清华与星动纪元联合开源首个 AIGC 机器人大模型 VPP

近日，星动纪元宣布，已与清华大学叉院的 ISRLab 合作，开源了首个 AIGC（生成式人工智能内容）机器人大模型 ——VPP(视频预测策略)。这一创新成果有望在机器人领域带来革命性的进展。VPP 模型通过将视频扩散模型的泛化能力引入到通用机器人操作策略中，解决了以往机器人推理速度慢的问题。VPP 能够实时预测未来动作，从而极大提升机器人的策略泛化能力。值得注意的是，这一模型已在国际机器学习大会（

巨头砸钱、码农通宵！为何技术大佬集体高潮的MCP 普通人却无感？

最近几个月，AI 圈突然被MCP刷屏了。这个由 Anthropic 在2024年底推出的模型上下文协议（Model Context Protocol），被称为 "AI 世界的 USB-C 接口"。简单来说，它就像一个万能插座，让大模型能轻松连接外部工具、数据库甚至物理设备，实现从 "动口" 到 "动手" 的跨越。图源备注：图片由AI生成技术圈对 MCP 的追捧已经到了疯狂的程度:巨头扎堆:Open

阶跃星辰发布并开源音乐大模型——音跃ACE-Step

阶跃星辰与ACE Studio联合发布了开源音乐大模型ACE-Step（中文名:音跃），标志着音乐创作与生成技术的又一重要突破。ACE-Step是继语音、视频、图片、视觉推理等多模态大模型之后的又一成果，展现了音乐创作与生成的最新进展。ACE Studio是一家以生成式AI技术为核心的科技公司，其产品ACE Studio是一款Gen-AI为核心的音乐创作工作站产品，用户遍布全球，包括格莱美获奖者

小巧却强大！IBM发布新语言模型Granite 4.0 Tiny Preview：长上下文处理

IBM 发布了 Granite4.0Tiny Preview，这是即将推出的 Granite4.0系列语言模型中最小的一款的预览版本。该模型不仅具备高效的计算能力，还为开源社区提供了一个值得关注的实验平台。高效的性能与极小的内存需求 Granite4.0Tiny 在 FP8精度下，能够在消费级硬件上运行多个长上下文（128K）的并发任务，适用于市面上价格低于350美元的 GPU。尽管该模型目前仅经

清华与星动纪元联合发布首个 AIGC 机器人大模型 VPP

近日，清华大学叉院的 ISRLab 与北京星动纪元科技有限公司携手推出了首个 AIGC（人工智能生成内容）机器人大模型 ——VPP(视频预测策略)。这一创新成果在2025年国际机器学习大会(ICML2025)上荣获 Spotlight 论文奖，显示出其在全球 AI 研究领域的前沿地位。AIGC 技术近年来迅速崛起，从生成式文本模型到视频生成技术，其应用范围不断扩大。而 VPP 的诞生标志着这一技术

ChatGPT客户端界面更新，工具选项整合为滑块式设计

ChatGPT客户端于2025年5月6日迎来了一次细微但实用的界面更新。此次更新将图像生成、搜索、深度研究等多种工具选项整合为一个全新的滑块式图标，旨在提升用户操作效率与界面简洁性。社交媒体反馈显示，这一变化已逐步在iOS和Android平台的ChatGPT应用中上线，受到用户广泛关注。滑块式图标:一键展开多功能工具新版ChatGPT客户端的最大亮点在于将原本分散的工具选项（如图像生成、网页搜索、

# AI项目和框架

kimi-thinking-preview – 月之暗面推出的多模态思考模型

kimi-thinking-preview是什么kimi-thinking-preview 是月之暗面推出的多模态思考模型，具备深度推理能力，擅长解决复杂问题，如代码、数学和工作难题。模型基于 reasoning_content 字段展示推理过程，帮助用户理解回答背后的逻辑。kimi-thinking-preview 支持多轮对话，目前处于预览版，暂不支持工具调用、联网搜索、JSON 模式和上

# AI项目和框架

UniTok – 字节联合港大、华中科技推出的统一视觉分词器

UniTok是什么UniTok 是字节跳动联合香港大学和华中科技大学推出的统一视觉分词器，能同时支持视觉生成和理解任务。基于多码本量化技术，将视觉特征分割成多个小块，每块用独立的子码本进行量化，极大地扩展离散分词的表示能力，解决传统分词器在细节捕捉和语义理解之间的矛盾。UniTok 在 ImageNet 上的零样本分类准确率达到 78.6%，重建质量（rFID）仅为 0.38，显著优于现有分词

# AI项目和框架

Granite 4.0 Tiny Preview – IBM推出的语言模型

Granite 4.0 Tiny Preview是什么Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite 4.0 Tiny Preview用极高的计算效率和紧凑的模型结构为特点，在消费级 GPU 上能运行多个长上下文（128K）任务，性能接近 Granite 3.3 2B Instruct，内存需求减

# AI项目和框架

VPP – 清华和星动纪元推出的首个AIGC机器人大模型

VPP是什么VPP（Video Prediction Policy）是清华大学和星动纪元推出的首个AIGC机器人大模型。基于预训练的视频扩散模型，学习互联网上的大量视频数据，直接预测未来场景生成机器人动作。VPP能提前预知未来，实现高频预测和动作执行，支持跨人形机器人本体切换，显著降低对高质量机器人真机数据的依赖。VPP在Calvin ABC-D基准测试中取得接近满分的成绩，在真实世界的复杂灵

# AI项目和框架

ICEdit – 浙江大学联合哈佛大学推出的指令式图像编辑框架

ICEdit是什么ICEdit（In-Context Edit）是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器（Diffusion Transformer）的强大生成能力和上下文感知能力，用自然语言指令对图像进行精准编辑。ICEdit仅需0.1%的训练数据和1%的可训练参数，相比传统方法大幅减少资源需求，在多轮编辑和多任务编辑中表现出色。ICEdit具备开源、低成本、快速处

AI总结打击网页点击：谷歌搜索“基本盘”被撼动，股价暴跌7%

谷歌股价在周三美股交易中放量下跌7%，背后原因直指其长期稳固的搜索业务正遭遇颠覆性冲击。据彭博社报道，苹果高级副总裁埃迪·库在美国反垄断审判中透露，苹果正在“积极考虑”将AI搜索整合至Safari浏览器，明确评估的对象包括OpenAI、Anthropic和Perplexity AI，唯独未提谷歌。库还指出，Safari搜索量在上个月出现历史性下滑，背后正是AI搜索工具逐步改变用户行为习惯。尽管苹果

宇树科技回应Go1机器狗“后门漏洞”传言:确为云服务密钥被盗

针对近期网络博主声称“宇树科技Go1机器狗存在后门漏洞”的说法，宇树科技于近日正式发布安全声明，确认该问题为由第三方云服务密钥泄露导致的安全漏洞，并详细说明了事件成因及影响范围。根据声明，黑客非法获取了Go1所使用的**第三方云隧道服务（Zhexi Cloud）**的管理密钥，并借此以高级权限远程控制用户的Go1机器狗，包括修改程序、访问视频流等，严重威胁用户隐私和数据安全。宇树科技指出，该远程云

Gemini2.0Flash图像生成升级:视觉质量大幅提升，文字更清晰

Google于近日宣布，旗下Gemini2.0Flash图像生成功能迎来重要升级，用户现可通过Google AI Studio体验最新模型:gemini-2.0-flash-preview-image-generation。据介绍，本次升级带来三大核心改进:更高的视觉质量，相较于早期实验版本整体图像表现更自然、细节更丰富;文字渲染更精准，解决了AI生成图像中文字扭曲、不清晰等问题;内容安全机制优化