Vidi 多模态模型 时间检索 字节跳动 字节跳动推出Vidi多模态模型,引领超长视频理解与编辑新潮流 ⭐0 👥0 字节跳动宣布推出全新多模态模型Vidi,专注于视频理解与编辑,首版核心能力为精准的时间检索功能。据AIbase了解,Vidi能够处理视觉、音频和文本输入,支持长达一小时的超长视频分析,在时间检索任务上性能超越GPT-4o与Gemini等主流模型。这一突破性技术已在AI社区引发热烈讨论,相关细节通过字节跳动官方渠道与GitHub公开。核心功能:精准时间检索与多模态协同Vidi以其强大的时间检索与多模
MegaTTS3 字节跳动 文本转语音(TTS) AI语音合成 字节跳动在Hugging Face发布MegaTTS3:轻量化语音合成新突破 ⭐0 👥0 北京——字节跳动(ByteDance)近日在人工智能开源社区Hugging Face上正式发布了其最新的文本转语音(TTS)模型MegaTTS3。这一发布迅速引起了全球AI研究者和开发者的关注,因其在轻量化设计和多语言支持方面的突破性表现。根据技术社区反馈和官方信息,MegaTTS3 被誉为语音合成领域的一次重要进步。MegaTTS3 的核心亮点MegaTTS3 是一款由字节跳动与浙江大学合作开发
字节跳动 火山引擎 豆包・语音播客模型 豆包・实时语音模型 字节火山引擎发布豆包·语音播客模型和豆包・实时语音模型 ⭐0 👥0 字节跳动火山引擎发布了两款全新的豆包语音大模型,旨在提升语音识别和语音生成的智能水平。这两款模型分别是豆包・语音播客模型和豆包・实时语音模型,均在多项技术指标上实现了显著的突破。豆包・语音播客模型根据官方介绍,只需输入一句话、网页链接、长文本或文档,语音播客模型即可快速搜索学习,生成播客脚本后创作出来;模型可秒级生成双人对话式播客作品,效果自然,具有互相附和、插话、犹豫等播客节奏;自带的深度搜索功
字节跳动 AILab Seed团队 推荐算法 大动作!字节AI Lab并入Seed,AI布局迎新变 ⭐0 👥0 据AI科技评论消息,近日字节AI Lab即将全部并入Seed团队,这一变动标志着字节内部AI研发架构迎来重大调整。据悉。字节AI Lab成立于 2016 年,曾是字节跳动AI研发的核心部门,由马维英负责,直接向张一鸣汇报。当时团队规模达 150 人,研究覆盖人工智能前沿技术,字节的推荐算法、短视频特效等都源于此,为抖音等产品的崛起立下汗马功劳,也助力字节在国内AI领域领先。但后来随着抖音、TikT
剪小映 字节跳动 AI 火山引擎豆包大模型 字节推出全新 AI 剪辑应用 “剪小映”,轻松记录生活瞬间 ⭐0 👥0 最近,字节跳动公司发布了一款名为 “剪小映” 的新应用,其宣传口号 “捕捉美好,智创影片” 引发了广泛关注。这款应用的推出,标志着字节在视频编辑领域的又一次创新,同时也是继 “即梦 AI” 之后的又一力作。借助火山引擎的豆包大模型技术,“剪小映” 旨在为用户提供更加便捷、高效的视频创作体验。“剪小映” 不仅延续了剪映品牌一贯的易用性,还将 AI 技术深度融入视频创作的每一个环节。用户在使用这款应用
Seaweed-7B AI视频生成 字节跳动 文生视频 字节跳动发布Seaweed-7B视频模型,AI视频生成迈向新高度 ⭐0 👥0 人工智能视频生成领域迎来新的里程碑。AIbase从社交媒体获悉,字节跳动近期发布了其全新视频生成模型Seaweed-7B的论文与演示,展示了一系列突破性功能,包括音视频同步生成、长镜头叙事和实时高分辨率生成。这一发布标志着字节跳动在AI视频技术上的加速布局,以下是AIbase对Seaweed-7B的深度报道,解析其技术亮点与行业影响。Seaweed-7B震撼亮相:多功能视频生成Seaweed-7B
字节跳动 Trae Cursor Windsurf 字节内部禁用Cursor等第三方AI编程工具,力推自家Trae工具 ⭐0 👥0 据第一财经消息,字节跳动正在加强内部数据安全管控,并推动自研AI工具的内部应用。近日字节跳动安全与风控部门发布内部邮件,宣布出于防范数据泄露风险考虑,将自6月30日起分批次禁用第三方AI开发软件。此次禁用的第三方AI开发软件包括目前市场上颇受欢迎的AI编程工具Cursor、Windsurf等。这些工具在开发者群体中拥有较高使用率,但字节跳动选择将其全面替换为自研产品。字节跳动提出的替代方案是其自主
字节跳动 多语言数据集 大模型自动修复 SWE-bench 提升大模型自动修Bug能力 豆包正式开源首个多语言类SWE数据集 ⭐0 👥0 快科技4月10日消息,今日,字节跳动豆包大模型团队宣布,正式开源首个多语言类SWE数据集Multi-SWE-bench,可用于评估和提升大模型自动修 Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言(Java、Go、Rust、C、C、TypeScript、JavaScript),是真正面向全栈工程”的评测基准。Multi-SWE
高效预训练长度缩放技术 PHD-Transformer 大语言模型(LLM) 字节跳动 字节跳动发布高效预训练长度缩放技术,突破长序列训练瓶颈 ⭐0 👥0 字节跳动宣布推出高效预训练长度缩放技术(Efficient Pretraining Length Scaling),通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架,显著提升大语言模型(LLM)在长序列预训练中的效率与性能。据AIbase了解,该技术在保持推理效率的同时,支持高达2048K(2M)的上下文长度训练,解决了传统框
豆包大模型 火山引擎 智能客服 字节跳动 火山引擎豆包日调用量突破16.4万亿,市占率高达46.4% ⭐0 👥0 在今日举行的“火山引擎FORCE原动力大会”上,火山引擎总裁谭待披露了一组引人注目的数据:截至2025年5月底,豆包大模型的tokens日均调用量已达到16.4万亿,是其发布初期的137倍。谭待表示,豆包大模型自推出以来持续迭代优化,广泛应用于内容创作、智能客服、数据分析等多个场景,成为企业智能化转型的重要引擎。根据IDC最新市场数据显示,火山引擎目前已占据**46.4%**的大模型市场份额,稳居