字节Seed 团队推出 PHD-Transformer,成功扩展预训练长度,解决 KV 缓存问题! 168 0 近日,字节跳动的 Seed 团队在人工智能领域再传佳音,推出了一种新型的 PHD-Transformer(Parallel Hidden Decoding Transformer),这项创新突破了预训练长度的限制,有效解决了推理过程中的 KV 缓存膨胀问题。随着大型推理模型的迅速发展,研究人员在后训练阶段尝试通过强化学习方法来生成更长的推理链,并在复杂的推理任务上取得了显著成果。受到启发,字节 S
AI应用 DeepSeek-R1 Manus 通用型AI AI应用大盘点:谁暴涨?谁掉队? 128 0 声明:本文来自于微信公众号 定焦One(dingjiaoone),作者 | 王璐,编辑 | 魏佳,授权站长之家转载发布。2025年第一季度,AI应用赛道迎来爆发式增长。第三方机构QuestMobile显示,截至2025年2月,AI原生App活跃用户数达2.4亿,比1月规模几近翻倍。这场热潮的引爆点,源自人工智能公司深度求索年初发布的DeepSeek-R1推理模型引发的现象级传播。到了3月初,被
阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制 172 0 IT之家 4 月 27 日消息,阶跃星辰今日宣布开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。该模型总参数量为 19B(7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持 11 类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。IT之家附开源链接:Github:https://github.com/s
“2025 美的 AI 科技日”揭晓多款 AI 空调新品,更有两款新品 7 月见 73 0 IT之家 4 月 27 日消息,家电行业首个 AI 科技大会 ——“2025 美的 AI 科技日”昨日在美的集团总部举行。本次活动,美的空调通过全方位、立体化的 AI 技术、产品展示,为用户演示 AI 技术改变生活方式的实际应用场景,以及美的空调在科技与 AI 技术领域的实力。特别的是,现场嘉宾与美的空调产品经理、研发人员进行了零距离的深层次交流,为品牌传递了关于产品后续规划的一手资料,IT之家
AI驱动欺诈 网络诈骗 微软 Midjourney AI 诈骗猛增,微软揭示阻止 40 亿美元欺诈的秘密 73 0 近日,微软发布的最新《网络信号》报告显示,人工智能技术正在推动一波新型诈骗的迅猛发展。报告指出,在过去一年中,微软成功阻止了高达40亿美元的欺诈企图,每小时拦截约160万个机器人的注册尝试。这一数据凸显了网络诈骗的威胁之大。图源备注:图片由AI生成,图片授权服务商Midjourney该报告的第九期名为 “AI 驱动的欺骗:新兴的诈骗威胁与对策”,阐述了人工智能如何降低了网络犯罪的门槛,使得即使是缺
人工智能医院 AI+医疗 清华大学 清华长庚医院 清华大学成立人工智能医院 迈向智慧医疗新篇章 156 0 清华大学正式成立人工智能医院,标志着该校在 “AI + 医疗” 领域迈出了重要一步。4月26日,清华大学举行了人工智能医院的揭牌仪式,并在医学院全体教职工大会上进行了相关介绍。校长李路明、副校长王宏伟等多位领导出席了此次仪式,共同见证了这一历史性时刻。清华大学人工智能医院(Tsinghua AI Agent Hospital)将分阶段建设,初期将依托北京清华长庚医院及其互联网医院进行试点。这一新医
# AI工具 # AI项目和框架 Firefly Image Model 4 – Adobe 推出的图像生成模型 157 0 Firefly Image Model 4是什么Firefly Image Model 4 是 Adobe 最新推出的图像生成模型,是目前最快、最具控制性和最逼真的 Firefly 图像模型,支持生成逼真的图像,提供更高的分辨率(最高可达2K)和更精细的创意控制。模型支持用户调整生成图像的结构、风格、相机角度和缩放比例,快速探索和迭代创意概念。Firefly Image Model 4 Ult
# AI工具 # AI项目和框架 LiveCC – 字节联合新加坡国立大学开源的实时视频解说模型 133 0 LiveCC是什么LiveCC 是新加坡国立大学Show Lab 团队联合字节跳动推出的实时视频解说模型,基于自动语音识别(ASR)字幕进行大规模训练。LiveCC像专业解说员一样快速分析视频内容,同步生成自然流畅的语音或文字解说。LiveCC 推出 Live-CC-5M 数据集用在预训练,和 Live-WhisperX-526K 数据集用在高质量的监督微调。LiveCC 设计了 LiveSp
# AI工具 # AI项目和框架 OpenMath-Nemotron – 英伟达开源的数学推理系列模型 138 0 OpenMath-Nemotron是什么OpenMath-Nemotron是英伟达推出的系列开源数学推理模型,专门用在解决复杂数学问题,包括奥林匹克级别的难题。模型基于大规模数据集OpenMathReasoning进行训练,包含54万个独特问题及320万个长推理解决方案。OpenMath-Nemotron系列包含,OpenMath-Nemotron-1.5B、OpenMath-Nemotron
# AI工具 # AI项目和框架 Kimi-Audio – Moonshot AI 开源的音频基础模型 126 0 Kimi-Audio是什么Kimi-Audio 是 Moonshot AI 推出的开源音频基础模型,专注于音频理解、生成和对话任务。在超过 1300 万小时的多样化音频数据上进行预训练,具备强大的音频推理和语言理解能力。核心架构采用混合音频输入(连续声学 + 离散语义标记),结合基于 LLM 的设计,支持并行生成文本和音频标记,同时通过分块流式解码器实现低延迟音频生成。Kimi-Audio
# AI工具 # AI项目和框架 Hummingbird-0 – Tavus 推出的AI口型同步模型 56 0 Hummingbird-0是什么Hummingbird-0 是 Tavus 推出的AI口型同步模型。基于 Phoenix-3 模型开发,支持实现零样本学习,无需额外训练快速生成高精度的口型同步视频。仅需输入几秒视频,Hummingbird-0 能在短时间内生成逼真的口型效果,适合多种应用场景,如影视制作、AI 影响者内容创作、广告、本地化翻译等。Hummingbird-0支持长达 5 分钟的视
# AI工具 # AI项目和框架 文心大模型4.5 Turbo – 百度推出的最新多模态大模型 158 0 文心大模型4.5 Turbo是什么文心大模型4.5 Turbo是百度推出的高性能、低成本多模态大模型。基于文心大模型4.5的基础上进行优化,具备多模态、强推理能力,能处理文本、图像等多种输入形式。相比文心大模型4.5,文心大模型4.5 Turbo的速度更快,成本大幅降低,价格下降80%,让开发者用更低的成本使用高性能AI模型,推动更多AI应用的开发和落地,适用于内容创作、智能客服、多模态交互等
# AI工具 # AI项目和框架 Open Avatar Chat – 阿里开源的实时数字人对话系统 130 0 Open Avatar Chat是什么Open Avatar Chat 是阿里开源的模块化的实时数字人对话系统,支持在单台电脑上运行完整的功能。Open Avatar Chat 支持低延迟的实时对话(平均响应延迟约2.2秒),兼容多模态语言模型,包括文本、音频和视频等多种交互方式。系统基于模块化设计,用户根据需求灵活替换组件,实现不同的功能组合。Open Avatar Chat 为开发者和研究
# AI工具 # AI项目和框架 RAGEN – 训练大模型推理 Agent 的开源强化学习框架 170 0 RAGEN是什么RAGEN是开源的强化学习框架,用于在交互式、随机环境中训练大型语言模型(LLM)推理Agent。基于StarPO(State-Thinking-Action-Reward Policy Optimization)框架,通过多轮交互优化整个轨迹,支持PPO、GRPO等多种优化策略。RAGEN通过MDP形式化Agent与环境的交互,引入渐进式奖励归一化策略,有效解决了多轮强化学习
Gmail AI功能 MaterialDesign3 谷歌 Gmail 更新:Android 平板用户迎来全新界面和 AI 功能 82 0 最近,谷歌为其 Gmail 移动应用推出了一系列更新,涵盖 Android 和 iOS 用户。这次更新不仅带来了设计上的改进,还增加了对 AI 功能的访问,旨在提升用户体验。对于 Android 平板和可折叠设备的用户来说,Gmail 应用界面的灵活性得到了显著提升。用户现在可以在横向视图中自由拖动分隔线,以调整列表和对话窗格的大小。如果用户更喜欢单窗格视图,只需将分隔线拖到一侧即可。这项更新目前
Alphabet 谷歌 广告收入 营收 Alphabet 第一季度业绩超预期,宣布700亿美元股票回购,AI 概览月活达15亿 158 0 谷歌母公司 Alphabet 公布2025年第一季度业绩,营收达到902.3亿美元,每股收益2.81美元,双双超出华尔街分析师的预期。受此消息提振,Alphabet 股价在盘后交易中上涨4%。首席执行官桑达尔·皮查伊 (Sundar Pichai) 将谷歌核心搜索业务的强劲表现和稳定的广告收入视为本季度业绩的关键驱动力。广告收入同比增长8.5% 至668.9亿美元,占据总收入的四分之三。尽管增速较