# AI工具 # AI项目和框架 MAGI-1 – Sand AI 开源的首个自回归视频生成模型 142 0 MAGI-1是什么MAGI-1 是 Sand AI 开源的全球首个自回归视频生成大模型,采用自回归架构,通过逐块预测视频序列生成流畅自然的视频,支持无限扩展和一镜到底的长视频生成。模型原生分辨率可达 1440×2568,生成的视频动作流畅且细节逼真,具备可控生成能力,可通过分块提示实现平滑场景转换和细粒度控制。MAGI-1的主要功能高效视频生成:MAGI-1 能在短时间内生成高质量视频
# AI工具 # AI项目和框架 Infinite Mobility – 上海 AI Lab 推出的可交互物体生成模型 113 0 Infinite Mobility是什么Infinite Mobility 是上海AI Lab推出的可交互物体生成模型,基于程序化生成技术,高效生成高质量的可交互物体数据资产。Infinite Mobility支持22类常见可交互物体的生成,单个物体生成仅需约1秒,生成数量无上限。相比传统数据集(如PartNet-Mobility),Infinite Mobility生成的物体结构复杂度更高、
# AI工具 # AI项目和框架 ChatTS-14B – 字节开源的时间序列理解和推理大模型 107 0 ChatTS-14B是什么ChatTS-14B 是字节跳动研究团队开源的专注于时间序列理解和推理的大型语言模型,参数量达 140 亿。基于 Qwen2.5-14B-Instruct 微调而成,通过合成数据对齐技术显著提升了在时间序列任务中的表现。模型支持自然语言交互,用户可以通过简单的指令完成对时间序列数据的分析、预测和推理,例如金融市场趋势分析、天气预测或工业流程优化等任务。ChatTS-1
# AI工具 # AI项目和框架 Aether – 上海 AI Lab 开源的生成式世界模型 123 0 Aether是什么Aether 是上海AI Lab开源的生成式世界模型,完全基于合成数据训练。Aether 首次将三维时空建模与生成式建模深度融合,具备 4D 动态重建、动作条件视频预测和目标导向视觉规划三大核心能力。Aether 能感知环境、理解物体位置和运动关系,做出智能决策。Aether 在真实世界中展现出强大的零样本泛化能力,使用虚拟数据训练完成高效完成复杂任务,为具身智能系统提供强大
# AI工具 # AI项目和框架 SimpleAR – 复旦大学联合字节 Seed 团队推出的图像生成模型 93 0 SimpleAR是什么SimpleAR 是复旦大学视觉与学习实验室和字节 Seed 团队联合推出的纯自回归图像生成模型。采用简洁的自回归架构,通过优化训练和推理过程,实现了高质量的图像生成。SimpleAR 仅用 5 亿参数即可生成 1024×1024 分辨率的图像,在 GenEval 等基准测试中取得了优异成绩。训练采用“预训练 – 有监督微调 – 强化学习”的三阶段方法,显著提升了文本跟随
数据治理 RelyanceAI DataJourneys AI原生 告别 AI 数据盲区!Relyance AI 新平台实现端到端流向可视化 64 0 数据治理平台提供商 Relyance AI 在去年10月获得3210万美元 B 轮融资后,推出了全新的 Data Journeys 平台,旨在解决企业采用 AI 时面临的关键挑战:准确了解数据在复杂系统中的流转。该平台能够追踪数据在应用程序、云服务和第三方系统中的使用方式和原因,填补了传统数据沿袭方法的空白。Relyance AI 首席执行官兼联合创始人 Abhi Sharma 强调,Data J
NvidiaBlackwell AI超级计算机 TSMC 富士康 Nvidia 将首次在美国制造 AI 超级计算机,打造自主供应链 151 0 Nvidia 近期宣布,将在美国本土首次制造其 AI 超级计算机。这一举措标志着该公司与一系列制造合作伙伴共同合作,旨在在美国工厂内建造、包装、测试和组装下一代 Blackwell 系统。目前,Blackwell 芯片的生产已经在位于亚利桑那州的 TSMC 半导体制造厂展开,而超级计算机的组装则将在德克萨斯州进行,由富士康在休斯顿和纬创在达拉斯进行扩展。此外,负责包装和测试的安靠和矽品,也在亚利桑
任务特定人工智能模型 Gartner报告 通用大语言模型 Midjourney Gartner报告:2027年,任务特定AI使用频率将是通用AI的三倍 186 0 根据最新发布的 Gartner 报告,到2027年,企业将使用任务特定的人工智能模型的频率将是通用大语言模型的三倍。报告指出,尽管通用大语言模型在语言处理方面具备强大的能力,但在需要深入理解特定业务领域的任务时,它们的响应准确性会下降。因此,越来越多的企业开始关注能够满足特定需求的定制化模型。图源备注:图片由AI生成,图片授权服务商MidjourneyGartner 副总裁兼分析师 Sumit A
生成式蛋白质语言模型 ProGen3 生物计算 AI药物研发 AI生物大模型ProGen3:重新定义蛋白质设计的未来 70 0 在生命科学的前沿,AI 技术正在引发一场革命。最近,生物计算公司 ProFluent 推出了 ProGen3,一款强大的生成式蛋白质语言模型(PLM),它有望在抗体、工业酶及基因编辑领域带来重大突破。研究显示,ProGen3的规模和设计优化能够生成功能强大的新型蛋白质,甚至重塑我们对生物学的理解。蛋白质是生命体内的关键分子,负责多种生理功能。从催化反应到识别病原体,它们的作用不可小觑。然而,设计新
Grok xAI 多模态AI 生成式人工智能 Grok大更新!视觉能力、多语言音频处理与实时搜索功能震撼上线 193 0 由xAI打造的生成式人工智能聊天机器人Grok迎来了一次里程碑式的更新,其功能全面升级,不仅新增了视觉处理能力,还实现了多语言音频处理以及语音模式下的实时搜索功能。这一更新标志着Grok在多模态AI领域的重大突破,为用户提供了更智能、更便捷的交互体验。以下,AIbase将为您详细解析此次更新的亮点与意义。视觉能力突破Grok的视觉处理能力是此次更新的核心亮点之一。尽管早在2024年4月,xAI曾宣
AI幻灯片工具 Genspark 人工智能 自动生成报告 Genspark AI幻灯片工具发布,革新专业演示文稿创作 76 0 Genspark推出全新AI幻灯片工具,旨在通过人工智能简化专业演示文稿的创作流程。据AIbase了解,该工具能够快速整合复杂多格式数据、自动生成综合报告,并支持交互式修改与多样化艺术风格,显著提升演示文稿的质量与效率。Genspark的这一创新已在开发者与企业用户中引发热烈反响,项目详情通过Genspark官网与GitHub公开。视频来自官方,翻译:小互核心功能:智能整合与交互式创作Genspa
AvatarFX Character.AI 视频生成模型 扩散模型 Character.AI 推出 AvatarFX 模型:让静态图片中的人物“开口说话” 134 0 Character.AI 近日宣布推出全新视频生成模型 AvatarFX,这一突破性技术能够将静态图片转化为具有真实感的可说话视频角色,赋予图像中的人物动态表情、唇部同步以及自然肢体动作。AvatarFX 的核心是其最先进的基于扩散模型的动态生成技术。该技术依托经过精心筛选的数据集进行训练,融合了创新的音频条件化、蒸馏和推理策略,使得用户能够以极高的速度生成高保真、时间一致性强的视频。无论是长序列
Kortix-AI Suna 开源AI智能体 Manus Manus开源平替!Kortix-AI正式发布开源通用AI智能体平台Suna 56 0 Kortix-AI正式发布开源通用AI智能体平台Suna,定位为热门AI工具Manus的开源替代品。据AIbase了解,Suna集成了浏览器自动化、文件管理、网络爬虫、扩展搜索、命令行执行、网站部署及API集成等功能,通过自然语言对话实现复杂任务的自动化处理。项目已在GitHub上线,凭借其强大的功能集与开源特性,迅速成为AI开发者和自动化爱好者的关注焦点。核心功能:多维能力驱动智能自动化Suna
AI翻译耳机 真我BudAir7Pro 讯飞星火认知大模型 真我GT7 真我推出首款 AI 翻译耳机 Bud Air7 Pro,支持 32 种语言翻译! 185 0 真我手机官方微博宣布,其首款 AI 翻译耳机 Bud Air7Pro 即将于4月23日下午16时正式上市。这款耳机将搭载讯飞的星火认知大模型4.0Ultra,具备强大的翻译能力,不仅能够支持中文与32种语言的面对面翻译,还具备同声传译功能,为用户的跨语言交流提供了极大的便利。这款耳机的发布将与真我 GT7手机的新品发布会一起进行,届时将展示更多创新技术。真我 GT7手机搭载的是天玑9400+ 芯片
座舱端侧大模型 腾讯混元 车载AI 腾讯云 腾讯云发布座舱端侧大模型,车载 AI 迎来“边开边提醒”时代 82 0 在4月22日上海车展开幕前夕的 TIME DAY 腾讯智慧出行技术开放日上,腾讯云重磅推出全新的座舱端侧大模型。该模型基于腾讯混元2B 小参数模型打造,并结合汽车行业专业知识数据进行精细调整和本地知识检索增强(RAG),旨在实现通用及车载知识领域的精准问答。借助该座舱端侧大模型,车辆能够为用户提供包括驾驶行为建议、车辆操作指导、故障处理以及潜在驾驶安全风险提醒等实时服务,真正实现“边开边提醒”的智
AINose Ainos 气味数字化 人形机器人 全球首款!Ainos AI 鼻成功植入ugo人形机器人,机器拥有“嗅觉” 163 0 人工智能气味数字化领导者 Ainos.宣布,其专有的 AI Nose 嗅觉模块已成功安装到日本顶级服务机器人公司 ugo, Inc. 开发的人形机器人上。此次于2025年4月9日完成的安装,标志着全球首个具备功能性嗅觉的机器人诞生,为机器人技术、人工智能和人机交互开创了全新纪元。图源备注:图片由AI生成,图片授权服务商MidjourneyAinos 的 AI Nose 系统整合了高精度气体传感器阵