全球AI新闻头条 | 政策解读·巨头动向·融资快讯 - AI中国|教程|工具大全

列表

默认

浏览次数

发布时间

上海人工智能实验室开源多模态大模型“书生・万象 3.0”：能同时处理文本和多模态输入

IT之家 4 月 17 日消息，据上海人工智能实验室官方公众号，4 月 16 日，上海人工智能实验室（上海 AI 实验室）升级并开源了通用多模态大模型书生・万象 3.0（InternVL3）。官方介绍，通过采用创新的多模态预训练和后训练方法，InternVL3 多模态基础能力全面提升，在专家级基准测试、多模态性能全面测试中，10 亿~780 亿参数的全量级版本在开源模型中性能均位列第一，同时大幅

微信首个 AI 助手上线：可与“元宝”在聊天框对话，还能添加好友

感谢IT之家网友風見暉一、MagicKong、imlufeng 的线索投递！IT之家 4 月 16 日消息，微信首个 AI 助手今日悄悄上线，用户在微信搜索“元宝”，即可找到“聊天”入口。IT之家测试，微信用户可以在聊天对话框中，与元宝进行实时交流，输入对话内容后，元宝甚至会提示“对方正在输入...”，就像真人聊天那样。此外，用户可以将元宝添加到通讯录，就可以在聊天列表和联系人名单中看到元宝

OpenAI 预告凌晨直播，满血版 o3 推理模型有望登场

感谢IT之家网友 GreatMOLA 的线索投递！IT之家 4 月 16 日消息，OpenAI 今日晚间 10 点发布预告，将在 o3 小时后进行直播。从官方特别用词来看，预计将发布满血版 o3 推理模型，时间为凌晨 1 点。OpenAI CEO 奥尔特曼本月初在社交平台 X 上发文称，可能在数周内发布 o3 和 o4-mini，未来几月内发布 GPT-5。o3 技术在 2024 年 12 月

中国航天科技集团：固体动力人工智能大模型平台完成升级并上线运行

感谢IT之家网友 Autumn_Dream 的线索投递！IT之家 4 月 16 日消息，据中国航天科技集团消息，近日，中国航天科技集团有限公司四院固体动力 AI（人工智能）大模型平台完成 DeepSeek 融合升级，平台功能和性能全面提升并正式上线运行。据介绍，在本次升级中，固体动力 AI 大模型应用平台通过深度集成 DeepSeek 大模型，不仅迭代优化了上下文理解能力、数学公式格式化输出、

豆包大模型

深度思考模型

文生图模型

豆包深度思考和文生图3.0模型正式开放API 对企业客户开放

豆包大模型近日发布了系列更新，其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API，供开发者和企业客户使用。这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平，并在视觉推理和图像生成方面取得了显著进展。豆包1.5·深度思考模型在专业领域推理任务中表现出色，数学推理 AIME2024测试得分追平 OpenAI o3-mini-high，编程竞赛 Codeforces

去中心化3D模型生成

404-GEN成为首个与Unity集成的去中心化3D模型生成平台，推动内容创作的民主化

瑞士初创公司404-GEN宣布，它已成为首个与Unity集成的去中心化3D模型生成平台。这一突破性的整合使得开发者和玩家能够在Unity环境中直接从Bittensor主网生成3D模型，标志着去中心化内容创作的新时代。404-GEN的AI模型通过创新的高斯溅射（Gaussian Splats）技术，为Unity用户带来了分散式的内容创作体验。与传统3D建模方式不同，高斯点云技术能通过扫描区域生成点云

书生·万象3.0

多模态大模型

上海人工智能实验室推出升级版多模态大模型 “书生・万象 3.0”

在人工智能迅速发展的今天，上海人工智能实验室再次引领潮流，推出了全新的多模态大模型 “书生・万象3.0”。这一升级版本不仅在技术上进行了全面提升，还在多模态预训练和后训练方法的加持下，展现出了更强大的基础能力和应用潜力。“书生・万象3.0” 具备同时处理文本和多种多模态输入的能力，这使得它在多个应用场景中都能表现出色。例如，在 GUI 智能体、建筑图纸理解和空间推理等方面，该模型的表现都相当领先。

多模态模型

AI日报：字节发布豆包1.5深度思考模型；微信首个AI助手 “元宝” 上线；OpenAI发布o4-mini、满血版o3

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI发布两款多模态推理模型o4-mini、满血版o3OpenAI在技术直播中推出了其最新的多模态模型o4-mini和满血版o3，这两款模型具备同时处理文本、图像和音频

飞牛私有云 fnOS 获 v0.8.47 系统更新，笔记本设备支持将内置电池作为 UPS 使用

感谢IT之家网友 2W、菜鸡叽叽叽、Roccoon、爱合租的线索投递！IT之家 4 月 17 日消息，飞牛私有云 fnOS 今日官宣获 v0.8.47 版本升级，主要更新内容包括支持将笔记本电池设置为 UPS、容器列表支持快捷访问、完善硬盘 SMART 检测属性名的中文翻译等。IT之家附飞牛私有云 fnOS 此次更新内容如下：UPSUSB UPS 在断电关机时支持同步通知 UPS 设备关机笔

跟上 ChatGPT 及 Gemini 步伐，马斯克 xAI 旗下 Grok 增加“记忆”功能

感谢IT之家网友往事2016 的线索投递！IT之家 4 月 17 日消息，马斯克创办的人工智能公司 xAI 正在让旗下聊天机器人 Grok 逐步追赶 ChatGPT 和谷歌 Gemini，努力缩小差距。xAI 今日宣布 Grok 新增“记忆”功能，能根据用户过去的对话内容记住相关细节。这样一来，当用户请求推荐时，Grok 将依据此前的互动经验，提供更贴合个人偏好的答案 —— 前提是用户的使用

全球首个人形机器人半马 4 月 19 日举办，参赛机器人全阵容发布

IT之家 4 月 17 日消息，据央视新闻报道，4 月 19 日，由中央广播电视总台北京总站参与联合主办的全球首个人形机器人半马即将在北京亦庄举办。参赛机器人全阵容发布。IT之家从“北京亦庄”公众号获悉，目前，来自北京、上海、江苏、广东等地的参赛队伍正陆续来到北京智慧电竞赛事中心，在这里进行开赛前的调试工作。作为全球首个人形机器人半程马拉松，本场赛事的设置方面也存在诸多亮点。现场，北京经开区管委

文心大模型4.5Turbo

李彦宏将于25日在Create2025百度AI开发者大会发表首场演讲，揭示百度AI新动态

今日，百度创始人李彦宏的25年首场演讲海报正式曝光。根据海报信息，李彦宏将在4月25日的Create2025百度AI开发者大会上带来一场为期1小时的主题演讲，题为《模型的世界，应用的天下》。演讲内容将聚焦AI领域的热门议题，包括MCP、智能体、数字人、模型成本等，引发业界广泛关注。此次大会的亮点之一是李彦宏将正式发布百度AI的最新产品和业务进展。此前，百度已预告将在大会上推出文心大模型4.5Tur

ModelContextProtocol(MCP)

FastAPI-MCP发布，零配置将FastAPI应用转化为MCP服务器

近日，开源社区迎来一款重量级工具——FastAPI-MCP。这款近乎零配置的工具能够自动将FastAPI应用的接口转换为Model Context Protocol（MCP）工具，为AI模型与后端服务的无缝交互开辟了新路径。据AIbase了解，FastAPI-MCP以其简单易用和高灵活性迅速引发开发者热议，广泛应用于AI驱动的自动化场景。项目现已开源，源代码可在GitHub获取，标志着AI与API

AI赋能自动化

ABB宣布将机器人业务100%分拆为独立上市公司，计划2026年第二季度启动

ABB集团正式宣布计划将其机器人业务单元进行100%的分拆，并拟提交2026年年度股东大会审议。这一计划旨在于2026年第二季度推动ABB机器人业务作为独立上市公司，开启独立交易。该举措将为ABB机器人业务带来更聚焦的资本结构和治理架构，同时提升业务增长潜力。ABB集团董事长傅赛在声明中表示:“董事会认为，通过将机器人业务独立上市，能够更好地优化两家公司在客户价值创造、业务增长和人才吸引方面的潜力

深度伪造检测器

联想推出深度伪造检测器防范AI换脸诈骗准确率超96%

随着人工智能技术的不断进步，AI 换脸技术逐渐被应用于各种领域，但与此同时，恶意使用此技术进行诈骗的风险也在上升。为应对这一日益严峻的挑战，联想集团推出了一项名为 “Deepfake 深度伪造技术检测器” 的新技术。这一技术的发布是在联想今日发布的一则宣传片《用 AI 守护 AI》中揭晓的。该检测器的核心优势在于其超高的准确率，达到了96%。基于 DeepSeek 开源大模型构建，这一技术能够在本

视频扩散革新技术FramePack：仅需6GB显存，1.5秒/帧

近年来，生成式AI技术的飞速发展不断推动着视频生成领域的创新。近日，一项名为FramePack的视频扩散技术引发了业界广泛关注。据AIbase从社交媒体平台X的最新信息整理发现，FramePack以其超低的显存需求和高效的生成性能，有望将视频生成技术推向全新的“大众GPU时代”。技术突破:仅需6GB显存，千帧视频生成无压力FramePack的最大亮点在于其极低的硬件门槛。传统视频扩散模型通常需要高