谷歌开源 MedGemma AI 模型,医疗图像与文本分析神器 145 0 IT之家 5 月 21 日消息,科技媒体 marktechpost 昨日(5 月 20 日)发布博文,报道称在 2025 年 I/O 开发者大会上,谷歌针对多模态医疗文本和图像理解,推出了 MedGemma 开源模型。MedGemma 基于 Gemma 3 架构,提供 4B 参数的多模态模型(分类)和 27B 参数的纯文本模型两种配置,4B 模型擅长分类和解读医疗图像,可生成诊断报告或解答图像相
教育部长怀进鹏谈“AI 代写作业被禁”:要确保学生会用、善用、不滥用 AI 144 0 IT之家 5 月 21 日消息,据南方都市报今日报道,近期学生“代劳式”使用 AI 乃至代写作业等现象频发,引发家校担忧。在上周武汉召开的 2025 世界数字教育大会上,教育部长怀进鹏在开幕式发言中提到,要引导学生合理使用 AI,全面推动大中小学开设人工智能课程,加强人工智能教材读本等资源开发,加强技术伦理教育,确保学生会用善用、不滥用人工智能。本月中旬,教育部基础教育教学指导委员会发布《中小学
腾讯大模型战略亮相 Turbo S 与 T1 模型全面升级 176 0 5月21日,腾讯宣布其混元大模型矩阵全面升级,标志着腾讯在人工智能领域的技术能力持续提升。此次升级涵盖了多个方面,包括旗舰快思考模型混元TurboS、深度思考模型混元T1的升级,以及基于TurboS基座新推出的视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。此外,腾讯还同步更新了混元图像2.0、混元3D v2.5及混元游戏视觉生成等一系列多模态模型。在全球公认的权威大语言模型
谷歌推出 MedGemma AI 模型:医疗图像与文本分析的革命性工具 58 0 在刚刚结束的2025年 I/O 开发者大会上,谷歌宣布开源全新医疗 AI 模型 ——MedGemma。这款基于 Gemma3架构的模型专为医疗领域设计,具备强大的多模态图像和文本理解能力,旨在提升医疗诊断与治疗效率。MedGemma 提供两种配置选项,分别为4B 和27B 参数模型。4B 参数模型主要用于医疗图像的分类和解读,能够生成详细的诊断报告或回答与图像相关的问题;而27B 参数模型则专注于
智元机器人灵犀X2定档5月22日开售,三款型号售价10万起 107 0 在今日举行的灵犀X2媒体沟通会上,智元机器人正式宣布旗下新一代人形机器人“灵犀X2”将于5月22日正式开售,用户现已可通过智元机器人官网登记留资选购。据智元机器人灵犀业务部总裁魏强介绍,灵犀X2定位为小尺寸室内人形机器人,高度为1.3米,支持直充充电,具备高自由度的运动能力与多模态人机交互方式,面向文娱商演、展厅导览、科研教育、情感陪伴等多元场景。新品共推出三个版本,分别为:灵犀X2(交互版):注
蚂蚁集团 数字化转型 企业级AI Web3技术 蚂蚁数科的AI深潜与RWA远航 177 0 声明:本文来自于微信公众号 光锥智能,作者:白鸽,授权站长之家转载发布。2024年3月,蚂蚁集团科技商业化板块蚂蚁数科,开始独立面向市场运营。而蚂蚁数科独立之后的第一任CEO,则是蚂蚁技术老兵赵闻飙。上任伊始,赵闻飙就对蚂蚁数科的核心战略和业务板块进行了梳理,明确要做企业数字化同路人。独立运营一年后,蚂蚁数科发生了哪些变化?光锥智能在梳理近一年的动作之后发现:今年的蚂蚁数科,持续向外找答案,探
人类决策研究 神经科学与AI 消费者行为分析 决策模式 对话帷幄叶生晅:AI卖的是know-how,花哨的明星公司们最终是牺牲自己教育市场 110 0 声明:本文来自于微信公众号 硅星人Pro,作者:王兆洋,授权站长之家转载发布。叶生晅痴迷于研究人类如何做决策。从弗吉尼亚大学计算机本科毕业后,他来到加州理工跟神经学大佬Christof Koch搞研究,看哪些模式在决定着人类复杂的决策。Christof Koch门徒诸多,其中包括后来变成AI科学家的李飞飞。这种对人类系统运转原理的研究,总会走向哲学甚至玄学的尽头。叶生晅更想接地气点,于是他又去
英伟达 RTX Pro 企业 AI 与工业 AI 运算平台发布,将进入量产阶段 69 0 IT之家 5 月 19 日消息,在今日的台北电脑展 2025 主题演讲中,英伟达 CEO 黄仁勋发布了 RTX Pro 企业 AI 与工业 AI 运算平台。黄仁勋展示了华擎、微星的两款产品,支持 30 PFLOPS FP4 AI 性能、3 PFLOPS RTX 显示性能、800GB 显存。黄仁勋还展示了 RTX Pro 的性能图表:IT之家从演讲中获悉,英伟达 RTX Pro 服务器将进入量产阶
谷歌在 Nest 音箱上测试 Gemini AI 助手,部分用户更新后“变砖” 123 0 IT之家 5 月 19 日消息,用户 Old_Bee_8587 上周于 Reddit 平台发文,称谷歌在 Nest 音箱上测试 Gemini AI 助手。▲ 用户 Old_Bee_8587 发文截图该用户文在文中表示,他的谷歌 Nest 音箱最近在唤醒时出现了蓝紫色渐变光效,同时 Gemini AI 助手替代了谷歌 Assistant 语音助手。▲ 谷歌于“智能助理帮助”页面发表的博文截图而根据
微软推出 Windows AI Foundry:用于本地人工智能开发的统一平台 186 0 IT之家 5 月 20 日消息,在 Build 2025 开发者大会上,微软宣布了一系列针对 Windows 平台的 AI 开发新工具与功能,其中包括 Windows AI Foundry 的推出,这一全新的统一平台旨在为本地 AI 开发提供强大的支持,整合了 Windows Copilot Runtime 以及多项新能力,进一步推动 Windows 生态内的 AI 应用发展。Windows A
透明、可控:微软发布 Magentic-UI 人机协作新工具,你的 AI 网络任务智能伙伴 188 0 IT之家 5 月 20 日消息,微软研究院昨日(5 月 19 日)发布博文,介绍了 Magentic-UI 开源研究原型。这是一款以人为中心的 AI 智能体,旨在通过网页浏览器,实时协助用户完成复杂的网络任务。微软表示现代生产力高度依赖网络,搜索信息、填写表单还是操作仪表板等许多任务仍需手动操作,耗时且重复。而 Magentic-UI 通过以人为中心的理念,协助用户处理这些任务,并为研究人员提供
火山引擎发布大模型生态广场 MCP Servers 83 0 火山引擎正式发布了其大模型生态广场——MCP Servers,这一创新平台的推出标志着AI开发进入了一个全新的模块化组装时代。通过“MCP Market(工具广场)+ 火山方舟(大模型服务)+ Trae(应用开发环境)”的深度协同,MCP Servers实现了从工具调用、模型推理到应用部署的全链路开发闭环,极大地简化了开发流程,让开发者能够以更高效的方式构建AI应用。MCP Servers被形象地
Anthropic发布AI代理开发“圣经”:超越提示工程的7大实战策略 187 0 Anthropic 最新发布了一份针对 AI 代理开发人员的重要指南,强调构建强大且实用的代理远不止巧妙地编写提示。这份“圣经”总结了以下7个核心策略:代理设计是结构化工作流: 不要将代理视为简单的无状态函数。成功的代理需要具备推理、行动、反思、重试和升级的结构化工作流程。内存即架构: 管理和传递上下文的方式至关重要。采用摘要、结构化文件和项目概述等方法进行检索,优于直接将完整文件放入提示。规划至
谷歌Jules测试版全球上线!挑战Codex,AI自主生成PR,每天5次免费任务 59 0 谷歌在全球范围内推出Jules测试版,一款基于Gemini2.5的AI编码代理,定位为OpenAI Codex的直接竞争对手。Jules能够自主分析代码库、制定多步骤计划并生成GitHub拉取请求(PR),每天提供5次免费任务,显著提升开发者效率。AIbase综合最新社交媒体动态,深入解析Jules的技术亮点及其对AI编码工具市场的潜在冲击。Jules核心功能:自主编码与GitHub无缝集成Jul
MLX-LM与Hugging Face实现无缝集成,助力Apple Silicon设备高效运行大语言模型 90 0 近日,MLX-LM现已直接集成到Hugging Face平台。这一里程碑式的更新为Apple Silicon设备(包括M1、M2、M3和M4芯片)用户提供了前所未有的便利,使其能够以最高速度在本地运行超过4400种大型语言模型(LLM),无需依赖云服务或等待模型转换。这一集成进一步推动了本地化AI开发的普及,为开发者和研究人员提供了更高效、灵活的工具。MLX-LM与Hugging Face的深度融
Salesforce BLIP3-o重磅登陆Hugging Face!全开源多模态模型,图像理解与生成一统江湖! 71 0 Salesforce AI Research在Hugging Face平台正式发布BLIP3-o应用,这款全开源的统一多模态模型家族以其卓越的图像理解与生成能力引发业界热议。BLIP3-o通过创新的扩散变换器架构,结合语义丰富的CLIP图像特征,不仅提升了训练效率,还显著优化了生成效果。AIbase综合最新社交媒体动态,深入解析BLIP3-o的技术突破及其对AI生态的影响。BLIP3-o核心:统一