Google 高管证实:数据 “偏袒” 自家 AI,拒绝竞品获取搜索数据 118 0 在一场备受关注的法庭听证会上,Google 搜索业务负责人利兹・里德(Liz Reed)向外界揭示了公司对待人工智能(AI)模型数据请求的态度。她明确表示,尽管 Google 去年已开始向部分 AI 公司开放利用其搜索结果的渠道,但关键的搜索数据仍然优先供给自家的 AI 服务 Gemini,这一证词为反垄断监管机构的调查提供了重要支持。近年来,美国司法部对 Google 的反垄断调查持续升温,要求
消息称通义视觉负责人薄列峰离职 或加入某大厂新组建多模态团队 140 0 据多方信源透露,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级P10)已于2024年4月30日正式离职,并低调加盟某头部互联网公司,出任新设立的多模态模型部副总经理一职。尽管该互联网公司具体名称尚未公开,坊间普遍猜测其去向可能是字节跳动或腾讯,但目前相关公司及本人均未作出回应,尚无法证实具体归属。图源备注:图片由AI生成,图片授权服务商Midjourney此次人事变动引发业界关注的另一焦点在于“
清华与星动纪元联合开源首个 AIGC 机器人大模型 VPP 189 0 近日,星动纪元宣布,已与清华大学叉院的 ISRLab 合作,开源了首个 AIGC(生成式人工智能内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果有望在机器人领域带来革命性的进展。VPP 模型通过将视频扩散模型的泛化能力引入到通用机器人操作策略中,解决了以往机器人推理速度慢的问题。VPP 能够实时预测未来动作,从而极大提升机器人的策略泛化能力。值得注意的是,这一模型已在国际机器学习大会(
巨头砸钱、码农通宵!为何技术大佬集体高潮的MCP 普通人却无感? 77 0 最近几个月,AI 圈突然被MCP刷屏了。这个由 Anthropic 在2024年底推出的模型上下文协议(Model Context Protocol),被称为 "AI 世界的 USB-C 接口"。简单来说,它就像一个万能插座,让大模型能轻松连接外部工具、数据库甚至物理设备,实现从 "动口" 到 "动手" 的跨越。图源备注:图片由AI生成技术圈对 MCP 的追捧已经到了疯狂的程度:巨头扎堆:Open
阶跃星辰发布并开源音乐大模型——音跃ACE-Step 117 0 阶跃星辰与ACE Studio联合发布了开源音乐大模型ACE-Step(中文名:音跃),标志着音乐创作与生成技术的又一重要突破。ACE-Step是继语音、视频、图片、视觉推理等多模态大模型之后的又一成果,展现了音乐创作与生成的最新进展。ACE Studio是一家以生成式AI技术为核心的科技公司,其产品ACE Studio是一款Gen-AI为核心的音乐创作工作站产品,用户遍布全球,包括格莱美获奖者
小巧却强大!IBM发布新语言模型Granite 4.0 Tiny Preview:长上下文处理 182 0 IBM 发布了 Granite4.0Tiny Preview,这是即将推出的 Granite4.0系列语言模型中最小的一款的预览版本。该模型不仅具备高效的计算能力,还为开源社区提供了一个值得关注的实验平台。高效的性能与极小的内存需求 Granite4.0Tiny 在 FP8精度下,能够在消费级硬件上运行多个长上下文(128K)的并发任务,适用于市面上价格低于350美元的 GPU。尽管该模型目前仅经
清华与星动纪元联合发布首个 AIGC 机器人大模型 VPP 193 0 近日,清华大学叉院的 ISRLab 与北京星动纪元科技有限公司携手推出了首个 AIGC(人工智能生成内容)机器人大模型 ——VPP(视频预测策略)。这一创新成果在2025年国际机器学习大会(ICML2025)上荣获 Spotlight 论文奖,显示出其在全球 AI 研究领域的前沿地位。AIGC 技术近年来迅速崛起,从生成式文本模型到视频生成技术,其应用范围不断扩大。而 VPP 的诞生标志着这一技术
ChatGPT客户端界面更新,工具选项整合为滑块式设计 172 0 ChatGPT客户端于2025年5月6日迎来了一次细微但实用的界面更新。此次更新将图像生成、搜索、深度研究等多种工具选项整合为一个全新的滑块式图标,旨在提升用户操作效率与界面简洁性。社交媒体反馈显示,这一变化已逐步在iOS和Android平台的ChatGPT应用中上线,受到用户广泛关注。滑块式图标:一键展开多功能工具新版ChatGPT客户端的最大亮点在于将原本分散的工具选项(如图像生成、网页搜索、
# AI工具 # AI项目和框架 kimi-thinking-preview – 月之暗面推出的多模态思考模型 130 0 kimi-thinking-preview是什么kimi-thinking-preview 是月之暗面推出的多模态思考模型,具备深度推理能力,擅长解决复杂问题,如代码、数学和工作难题。模型基于 reasoning_content 字段展示推理过程,帮助用户理解回答背后的逻辑。kimi-thinking-preview 支持多轮对话,目前处于预览版,暂不支持工具调用、联网搜索、JSON 模式和上
# AI工具 # AI项目和框架 UniTok – 字节联合港大、华中科技推出的统一视觉分词器 117 0 UniTok是什么UniTok 是字节跳动联合香港大学和华中科技大学推出的统一视觉分词器,能同时支持视觉生成和理解任务。基于多码本量化技术,将视觉特征分割成多个小块,每块用独立的子码本进行量化,极大地扩展离散分词的表示能力,解决传统分词器在细节捕捉和语义理解之间的矛盾。UniTok 在 ImageNet 上的零样本分类准确率达到 78.6%,重建质量(rFID)仅为 0.38,显著优于现有分词
# AI工具 # AI项目和框架 Granite 4.0 Tiny Preview – IBM推出的语言模型 66 0 Granite 4.0 Tiny Preview是什么Granite 4.0 Tiny Preview 是 IBM 推出的 Granite 4.0 语言模型家族中最小的模型的预览版本。Granite 4.0 Tiny Preview用极高的计算效率和紧凑的模型结构为特点,在消费级 GPU 上能运行多个长上下文(128K)任务,性能接近 Granite 3.3 2B Instruct,内存需求减
# AI工具 # AI项目和框架 VPP – 清华和星动纪元推出的首个AIGC机器人大模型 184 0 VPP是什么VPP(Video Prediction Policy)是清华大学和星动纪元推出的首个AIGC机器人大模型。基于预训练的视频扩散模型,学习互联网上的大量视频数据,直接预测未来场景生成机器人动作。VPP能提前预知未来,实现高频预测和动作执行,支持跨人形机器人本体切换,显著降低对高质量机器人真机数据的依赖。VPP在Calvin ABC-D基准测试中取得接近满分的成绩,在真实世界的复杂灵
# AI工具 # AI项目和框架 ICEdit – 浙江大学联合哈佛大学推出的指令式图像编辑框架 84 0 ICEdit是什么ICEdit(In-Context Edit)是浙江大学和哈佛大学推出的指令式图像编辑框架。基于大规模扩散变换器(Diffusion Transformer)的强大生成能力和上下文感知能力,用自然语言指令对图像进行精准编辑。ICEdit仅需0.1%的训练数据和1%的可训练参数,相比传统方法大幅减少资源需求,在多轮编辑和多任务编辑中表现出色。ICEdit具备开源、低成本、快速处
AI总结打击网页点击:谷歌搜索“基本盘”被撼动,股价暴跌7% 171 0 谷歌股价在周三美股交易中放量下跌7%,背后原因直指其长期稳固的搜索业务正遭遇颠覆性冲击。据彭博社报道,苹果高级副总裁埃迪·库在美国反垄断审判中透露,苹果正在“积极考虑”将AI搜索整合至Safari浏览器,明确评估的对象包括OpenAI、Anthropic和Perplexity AI,唯独未提谷歌。库还指出,Safari搜索量在上个月出现历史性下滑,背后正是AI搜索工具逐步改变用户行为习惯。尽管苹果
宇树科技回应Go1机器狗“后门漏洞”传言:确为云服务密钥被盗 60 0 针对近期网络博主声称“宇树科技Go1机器狗存在后门漏洞”的说法,宇树科技于近日正式发布安全声明,确认该问题为由第三方云服务密钥泄露导致的安全漏洞,并详细说明了事件成因及影响范围。根据声明,黑客非法获取了Go1所使用的**第三方云隧道服务(Zhexi Cloud)**的管理密钥,并借此以高级权限远程控制用户的Go1机器狗,包括修改程序、访问视频流等,严重威胁用户隐私和数据安全。宇树科技指出,该远程云
Gemini2.0Flash图像生成升级:视觉质量大幅提升,文字更清晰 139 0 Google于近日宣布,旗下Gemini2.0Flash图像生成功能迎来重要升级,用户现可通过Google AI Studio体验最新模型:gemini-2.0-flash-preview-image-generation。据介绍,本次升级带来三大核心改进:更高的视觉质量,相较于早期实验版本整体图像表现更自然、细节更丰富;文字渲染更精准,解决了AI生成图像中文字扭曲、不清晰等问题;内容安全机制优化