字节跳动

字节跳动推出Vidi多模态模型,引领超长视频理解与编辑新潮流

字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任务上性能超越GPT-4o与Gemini等主流模型。这一突破性技术已在AI社区引发热烈讨论,相关细节通过字节跳动官方渠道与GitHub公开。核心功能:精准时间检索与多模态协同Vidi以其强大的时间检索与多模

字节跳动推出DreamActor-M1:实现Runway Act 功能,挑战动画生成新高度

近日,字节跳动(ByteDance)正式公布了其最新AI项目“DreamActor-M1”,一项旨在革新视频生成技术的前沿成果。这款模型通过结合一张静态照片和一段参考动作视频,能够将照片中的人物无缝替换到视频场景中,生成表情细腻、动作自然且画质高清的动态影像。这一技术的亮相,不仅标志着字节跳动在生成式AI领域的又一次突破,也被视为对现有动画生成工具(如Runway的Act-One)的有力挑战。Dr

扣子空间Coze Space正式开启内测 支持 MCP 扩展集成

字节跳动技术团队宣布,其全新 AI 协同办公平台“扣子空间”(Coze Space)正式开启内测。“扣子空间”旨在成为用户与 AI Agent 协同办公的最佳场所,提供从回答问题到解决问题的全方位服务,帮助用户更高效地完成工作。“扣子空间”具有多项创新特点,能够自动分析用户需求并拆解为多个子任务,自主调用工具(如浏览器、代码编辑器等)执行任务,并输出完整的结果报告,如网页、PPT、飞书文档等。此外