AI热点 1月前 125 阅读 0 评论

Meta 联合发布 OMol25 数据集与 UMA 模型,AI 助力全球化学创新

作者头像

AI技术专栏作家 | 发布了 246 篇文章

Meta 联合发布 OMol25 数据集与 UMA 模型,AI 助力全球化学创新
Meta 联合发布 OMol25 数据集与 UMA 模型,AI 助力全球化学创新

IT之家 5 月 16 日消息,Meta AI 公司于 5 月 14 日发布博文,发布了全新化学数据集 Open Molecules 2025(OMol25)以及通用原子模型 Universal Models for Atoms(UMA)。

OMol25 数据集:化学研究新利器

OMol25 是迄今为止规模最大的分子模拟数据集,由 Meta 与美国能源部劳伦斯伯克利国家实验室(Berkeley Lab)联合打造,该数据集包含超过 1 亿个 3D 分子快照,基于密度泛函理论(DFT)计算而成。

DFT 是一种强大的工具,能精确模拟原子间相互作用,帮助科学家预测每个原子的受力及系统能量,从而揭示分子运动和化学反应的规律。

传统的 DFT 计算需要巨大的计算资源,随着分子规模增大,计算需求呈指数级增长,使用最先进的计算设备,也难以模拟现实世界中复杂的分子系统。

基于 DFT 数据训练的机器学习原子间势(MLIPs)能以快 1 万倍的速度提供同等精度的预测,让科学家能在普通计算系统上模拟大型原子系统。OMol25 作为化学多样性最高的分子数据集,为训练 MLIPs 提供了前所未有的数据支持。

UMA 模型:通用预测工具问世

Meta 公司还推出 UMA,是一个基于过去五年 Meta FAIR 公开数据集构建的通用原子间势能模型群,覆盖分子、材料、触媒等化学领域,利用超过 50 亿个原子组成的 3D 结构作为训练数据。

UMA 分为 UMA-small 和 UMA-medium 两种规模,采用“Mixture of Linear Experts”创新架构,其中 UMA-medium 模型拥有 14 亿参数,但单结构计算仅用约 5000 万参数,加快推理速度。

UMA 模型无需微调,仅通过预训练即可应对多种化学任务,性能媲美甚至超越现有专用模型。研究表明,UMA 在分子特性预测、材料设计、触媒开发、能量存储及半导体制造等领域表现出色,高精度与快速计算能力为科学研究和工业应用开辟了新路径,推动跨领域技术革新。

IT之家附上参考地址

  • The Open Molecules 2025 (OMol25) Dataset, Evaluations, and Models

  • Sharing new breakthroughs and artifacts supporting molecular property prediction, language processing, and neuroscience

  • Computational Chemistry Unlocked: A Record-Breaking Dataset to Train AI Models has Launched - Berkeley Lab – Berkeley Lab News Center

  • UMA: A Family of Universal Models for Atoms | Research - AI at Meta

  • facebook/OMol25 · Hugging Face

  • facebook/UMA · Hugging Face

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!