首届具身智能机器人运动会在无锡举行:超 150 名“选手”上场比拼 148 0 IT之家 4 月 26 日消息,据《无锡日报》报道,首届具身智能机器人运动会于 4 月 25 日上午 9 时 35 分在无锡举行。IT之家从报道获悉,这次运动会有超 150 台机器人参与,涵盖竞速跑、越野跑、足球、篮球、舞蹈等 10 个项目,有 100 余家科研团队、知名企业及高校代表参与,场馆面积达 2000 平方米。运动会将评选出技术类、互动类、场景类、设计类 4 大类奖项,展现具身智能机器
“AI 编程”之争:Anthropic 因版权纠纷受批评,OpenAI 意外赢得用户好感 135 0 IT之家 4 月 27 日消息,据外媒 TechCrunch 今日报道,在 Anthropic 的 Claude Code 和 OpenAI 的 Codex CLI 两款“智能体”式 AI 编程工具的较量中,后者获得了更多开发者的青睐。部分原因在于,Anthropic 曾向一位试图逆向工程 Claude Code 的开发者发出了下架通知,而 Claude Code 的使用许可要比 Codex C
DeepMind AI伦理 军工AI 谷歌云 DeepMind 员工抗议谷歌与军工合同,引发工会组建潮 136 0 近日,谷歌旗下的 DeepMind 公司在英国的员工们正积极寻求组建工会,以对抗公司将人工智能技术出售给军工集团的决定,以及与以色列政府之间的合作关系。据悉,约有300名位于伦敦的 DeepMind 员工已向英国通信工人工会(CWU)递交了申请,期望通过工会的力量来改变公司现有的商业化策略。谷歌正在推动 DeepMind 寻找其技术的商业应用,这一过程引起了员工们的广泛担忧。2月份,谷歌对其人工智
DeepWiki CognitionAI 代码库文档生成 AI代码索引 DeepWiki:AI驱动的GitHub代码库百科全书正式亮相 55 0 2025年4月27日 AIbase报道,由Cognition AI推出的DeepWiki项目近日引发广泛关注。这一创新平台旨在为GitHub上的开源代码库生成动态、可交互的文档,堪称“代码库的维基百科”。规模宏大的代码索引DeepWiki的核心亮点之一是其惊人的数据处理能力。据悉,该平台已索引超过3万个热门GitHub仓库,处理了超过40亿行代码。这一庞大的数据基础不仅展示了DeepWiki的技术
GPT-4o ChatGPT 多模态模型 图像生成 GPT-4o图像生成功能现已集成至自定义GPTs 127 0 2025年4月26日 AIbase报道:OpenAI近日宣布,其旗舰多模态模型GPT-4o的图像生成功能现已正式集成至ChatGPT的自定义GPTs功能中。这一更新标志着用户创建的定制化AI助手能够直接生成和编辑图像,为内容创作、设计和教育等领域带来更多可能性。无缝集成的图像生成体验GPT-4o的图像生成功能此前已于2025年3月25日起在ChatGPT和Sora平台向免费、Plus、Pro和Te
Step1X-Edit 多模态大语言模型(MLLM) 扩散变换器(DiT) 图像编辑模型 Step1X-Edit:开源图像编辑新标杆 媲美GPT-4o等闭源模型 135 0 2025年4月27日,AIbase报道:由Stepfun AI团队推出的Step1X-Edit图像编辑模型于近日正式开源,引发业界广泛关注。这一通用图像编辑框架以其卓越性能和实用的开源特性,展现了媲美GPT-4o和Gemini 2 Flash等闭源模型的潜力。以下是对Step1X-Edit的全面解析,涵盖其技术亮点、应用场景及未来影响。创新技术架构Step1X-Edit采用多模态大语言模型(MLL
Apple智能 iOS18.5 生成式AI iPhone15Pro 国行版苹果AI智能要来了?iOS 18.5正式版预计5月份推送 105 0 苹果公司即将在5月向中国用户推送iOS18.5正式版更新,为国行版iPhone带来备受关注的Apple智能(Apple Intelligence)功能。此前,该AI功能已在美版、欧版iPhone上线,而中国用户则等待了近一个月的时间。这一更新标志着苹果在中国市场正式迈入生成式AI时代。据了解,Apple智能是一套基于个人场景的AI系统,能够提供智能辅助、图像创作等多样化服务。具体功能包括照片消除、
GPT-4o ChatGPT OpenAI AI模型 OpenAI 推出 ChatGPT 新版本:更智能、更直观的 GPT-4o 110 0 OpenAI 最近宣布对其 ChatGPT 的 GPT-4o 版本进行了更新。这次更新主要集中在如何保存记忆的时机以及在科学、技术、工程和数学(STEM)等领域的技能提升。此外,新版本还旨在更有效地引导对话朝着 “富有成效的结果” 发展。OpenAI 希望通过这些改进,使模型在各种任务中显得更加 “直观和高效”。OpenAI 首席执行官山姆・阿尔特曼表示,这次更新不仅提升了智能水平,还改善了模型的
MoonshotAI Kimi-Audio 音频基础模型 多模态AI Moonshot AI发布Kimi-Audio:开源音频基础模型树立新标杆 111 0 近日,Moonshot AI正式宣布推出Kimi-Audio,一款全新的开源音频基础模型,旨在推动音频理解、生成和交互领域的技术进步。这一发布引发了全球AI社区的广泛关注,被认为是多模态AI发展的重要里程碑。以下是对Kimi-Audio核心特性、性能表现及行业影响的全面报道。突破性特性:全能音频处理能力Kimi-Audio-7B-Instruct基于Qwen2.5-7B架构,并结合Whisper技
AgentUFO UFO² RPA 微软 微软发布全新Agent操作系统UFO² ,深度整合Windows与智能自动化 78 0 近日,微软宣布重磅升级其开源项目 AgentUFO,推出了全新的 UFO² 版本,该版本新增了操作系统功能,并与 Windows 系统实现了深度集成。此举不仅增强了自动化任务的执行效率,还使得用户能够更便捷地进行复杂操作。UFO² 的一个显著特点是其能够直接调用 Windows 的原生 API 和 COM 接口。这种方式相比传统的机器人流程自动化(RPA),能够在执行复杂业务时更加高效且精准。例如
Waymo 自动驾驶汽车 Alphabet Midjourney Waymo CEO暗示未来可能出售个人自动驾驶汽车 173 0 在最近的一次财报电话会议上,Alphabet 首席执行官桑达尔・皮查伊(Sundar Pichai)透露,Waymo 未来有可能会出售自动驾驶汽车供个人拥有。这一消息引起了广泛关注,皮查伊在会上被问及 Waymo 的长期商业模式时表示,除了与 Moove 和 Uber 等合作伙伴的扩展外,Waymo 还考虑 “个人所有权的未来选项”。图源备注:图片由AI生成,图片授权服务商Midjourney事实
EmaFusion 语言模型 级联判断系统 AI模型 Ema推新型语言模型EmaFusion:成本和准确性方面击败了 O3、Gemini 107 0 在 AI 行业竞争日益激烈的今天,Ema 公司推出了一款新型语言模型 EmaFusion,声称在成本和准确性上超越了包括 O3、Gemini 和 Sonnet 在内的多款知名 AI 模型。与传统的单一策略系统不同,EmaFusion 采用了一种 “级联” 判断系统,能够动态平衡成本和准确性,同时用户也可以根据具体任务的需求进行微调。Ema 的首席执行官 Surojit Chatterjee 表示,
AI座舱芯片 X10 芯驰科技 7B参数多模态大模型 芯驰发布新一代4纳米 AI 座舱芯片 X10,提升智能驾驶体验 166 0 在2025上海车展上,芯驰科技正式推出了最新研发的 AI 座舱芯片 ——X10。这款芯片采用了先进的4纳米制程工艺,具备强大的计算能力,能够支持7B 参数的多模态大模型在端侧的本地部署。这标志着芯驰科技在智能座舱芯片领域的一次重大突破,预计将大幅提升智能驾驶体验。从技术规格来看,X10芯片配备了200K DMIPS 算力的 Arm v9.2架构 CPU,搭载1.8TFLOPS 算力的 GPU 以及
Alphabet 谷歌 广告收入 营收 Alphabet 第一季度业绩超预期,宣布700亿美元股票回购,AI 概览月活达15亿 159 0 谷歌母公司 Alphabet 公布2025年第一季度业绩,营收达到902.3亿美元,每股收益2.81美元,双双超出华尔街分析师的预期。受此消息提振,Alphabet 股价在盘后交易中上涨4%。首席执行官桑达尔·皮查伊 (Sundar Pichai) 将谷歌核心搜索业务的强劲表现和稳定的广告收入视为本季度业绩的关键驱动力。广告收入同比增长8.5% 至668.9亿美元,占据总收入的四分之三。尽管增速较
Gmail AI功能 MaterialDesign3 谷歌 Gmail 更新:Android 平板用户迎来全新界面和 AI 功能 83 0 最近,谷歌为其 Gmail 移动应用推出了一系列更新,涵盖 Android 和 iOS 用户。这次更新不仅带来了设计上的改进,还增加了对 AI 功能的访问,旨在提升用户体验。对于 Android 平板和可折叠设备的用户来说,Gmail 应用界面的灵活性得到了显著提升。用户现在可以在横向视图中自由拖动分隔线,以调整列表和对话窗格的大小。如果用户更喜欢单窗格视图,只需将分隔线拖到一侧即可。这项更新目前
# AI工具 # AI项目和框架 Open Avatar Chat – 阿里开源的实时数字人对话系统 131 0 Open Avatar Chat是什么Open Avatar Chat 是阿里开源的模块化的实时数字人对话系统,支持在单台电脑上运行完整的功能。Open Avatar Chat 支持低延迟的实时对话(平均响应延迟约2.2秒),兼容多模态语言模型,包括文本、音频和视频等多种交互方式。系统基于模块化设计,用户根据需求灵活替换组件,实现不同的功能组合。Open Avatar Chat 为开发者和研究