字节跳动 - AI中国|教程|工具大全

字节跳动在Hugging Face发布MegaTTS3：轻量化语音合成新突破

北京——字节跳动（ByteDance）近日在人工智能开源社区Hugging Face上正式发布了其最新的文本转语音（TTS）模型MegaTTS3。这一发布迅速引起了全球AI研究者和开发者的关注，因其在轻量化设计和多语言支持方面的突破性表现。根据技术社区反馈和官方信息，MegaTTS3 被誉为语音合成领域的一次重要进步。MegaTTS3 的核心亮点MegaTTS3 是一款由字节跳动与浙江大学合作开发

AI热点 3周前 0 点赞 0 评论 74 浏览

字节跳动推出Vidi多模态模型，引领超长视频理解与编辑新潮流

字节跳动宣布推出全新多模态模型Vidi，专注于视频理解与编辑，首版核心能力为精准的时间检索功能。据AIbase了解，Vidi能够处理视觉、音频和文本输入，支持长达一小时的超长视频分析，在时间检索任务上性能超越GPT-4o与Gemini等主流模型。这一突破性技术已在AI社区引发热烈讨论，相关细节通过字节跳动官方渠道与GitHub公开。核心功能:精准时间检索与多模态协同Vidi以其强大的时间检索与多模

AI热点 3天前 0 点赞 0 评论 71 浏览

字节跳动发布高效预训练长度缩放技术，突破长序列训练瓶颈

字节跳动宣布推出高效预训练长度缩放技术（Efficient Pretraining Length Scaling），通过创新的Parallel Hidden Decoding Transformer(PHD-Transformer)框架，显著提升大语言模型(LLM)在长序列预训练中的效率与性能。据AIbase了解，该技术在保持推理效率的同时，支持高达2048K(2M)的上下文长度训练，解决了传统框

AI热点 3天前 0 点赞 0 评论 204 浏览

字节跳动

首页

字节跳动

列表

默认

浏览次数

发布日期

字节跳动在Hugging Face发布MegaTTS3：轻量化语音合成新突破

字节跳动推出Vidi多模态模型，引领超长视频理解与编辑新潮流

字节跳动发布高效预训练长度缩放技术，突破长序列训练瓶颈

字节跳动 首页 字节跳动

列表 默认 浏览次数 发布日期

字节跳动在Hugging Face发布MegaTTS3：轻量化语音合成新突破

字节跳动推出Vidi多模态模型，引领超长视频理解与编辑新潮流

字节跳动发布高效预训练长度缩放技术，突破长序列训练瓶颈

字节跳动

首页

字节跳动

列表

默认

浏览次数

发布日期