AI-GitHub

AI-GitHub

行业佼佼者

0

粉丝

57

文章

9.88K

总浏览

0

平均评分

关于我

AI领域资深专家

#大语言模型 #机器学习 #深度学习 #自然语言处理

热门文章

国产开源版Genie 3：昆仑万维开源交互世界模型Matrix-Game 2.0！

开源项目 9月前

国产开源版Genie 3：昆仑万维开源交互世界模型Matrix-Game 2.0！

AI-GitHub

AI-GitHub

189 0

专为AI伴侣开源的记忆框架！MemU：让AI虚拟助手拥有长期记忆能力

开源项目 9月前

专为AI伴侣开源的记忆框架！MemU：让AI虚拟助手拥有长期记忆能力

AI-GitHub

AI-GitHub

183 0

智谱开源全球100B级效果最佳的开源视觉推理模型：GLM-4.5V！

开源项目 10月前

智谱开源全球100B级效果最佳的开源视觉推理模型：GLM-4.5V！

AI-GitHub

AI-GitHub

284 0

字节开源视频虚拟试穿项目！DreamVVT：精准还原服装的纹理！

开源项目 10月前

字节开源视频虚拟试穿项目！DreamVVT：精准还原服装的纹理！

字节跳动联合清华大学推出全新开源视频虚拟试穿框架：DreamVVT！该框架的核心优势在于其天然适配非配对人物数据，显著提升了系统在实际复杂应用中的泛化能力。技术原理关键帧高保真生成：系统首先从输入视频中智能提取具有代表性的关键帧（通常选择运动变化显著的帧）。结合视觉语言模型（VLM）的强大语义理解能力与多帧试穿模型，为这些关键帧生成高保真、语义一致的试穿图像。此阶段生成的图像为后续整个视频的合

AI-GitHub

AI-GitHub

304 0

最强开源深度研究模型：MiroMind ODR ，以82.4分成绩超越OpenAI！

基础研究 10月前

最强开源深度研究模型：MiroMind ODR ，以82.4分成绩超越OpenAI！

AI-GitHub

AI-GitHub

230 0

腾讯AI Lab开源Cognitive Kernel-Pro:多模块、层次化的智能体框架

开源项目 10月前

腾讯AI Lab开源Cognitive Kernel-Pro:多模块、层次化的智能体框架

AI-GitHub

AI-GitHub

239 0

小米开源声音理解大模型 MiDashengLM-7B，22项评测刷新SOTA！

开源项目 10月前

小米开源声音理解大模型 MiDashengLM-7B，22项评测刷新SOTA！

8月4日，小米公司正式宣布开源其自研的声音理解大模型 MiDashengLM-7B。该模型在22个公开评测集上刷新了多模态大模型的最好成绩（SOTA），并在推理效率上实现了显著突破，标志着小米在音频多模态AI领域取得重要进展。功能亮点音频描述：将音频内容（包括语音、环境声、音乐等）转化为自然语言描述，帮助用户快速理解音频信息。音频分类：识别音频中的特定类别（如语音、环境声、音乐等），用在环境声音识

AI-GitHub

AI-GitHub

302 0

腾讯混元开源高效图像生成项目：混元MixGRPO！训练时间减半！

开源项目 10月前

腾讯混元开源高效图像生成项目：混元MixGRPO！训练时间减半！

AI-GitHub

AI-GitHub

293 0

黑森林团队开源Flux.1 Krea：告别AI感的文生图模型，照片级写实感

开源项目 10月前

黑森林团队开源Flux.1 Krea：告别AI感的文生图模型，照片级写实感

AI-GitHub

AI-GitHub

180 0

昆仑万维开源Skywork UniPic！图像理解、生成与编辑全能力统一！

开源项目 10月前

昆仑万维开源Skywork UniPic！图像理解、生成与编辑全能力统一！

AI-GitHub

AI-GitHub

287 0