瑞士三强联合发布开源大模型Apertus 挑战美国科技巨头

AIbase基地

发布了 1093 文章

近日，瑞士联邦理工学院洛桑分校（EPFL）、苏黎世联邦理工学院（ETH Zurich）以及瑞士国家超级计算中心（CSCS）联合发布了一个名为 “Apertus” 的大规模开源语言模型。该模型的名字在拉丁语中意为 “开放”，而其开发理念恰恰体现了这一精神。

与当前市场上如 OpenAI 的 GPT 系列、Meta 的 Llama 和 Anthropic 的 Claude 等美国大型模型相比，Apertus 不仅注重技术本身，更以其透明度赢得了广泛的关注。这款模型的所有内容，包括模型权重、架构设计、训练代码以及数据来源等，全部实现了公开，甚至连训练过程的完整文档也毫无保留。这种 “开放” 策略让 Apertus 成为了一个值得期待的新选择。

在这个 AI 快速发展的时代，“数据黑箱” 的现象依然普遍存在。许多大型科技公司在发布他们的模型时，往往对外界隐瞒了大量关键细节，导致了行业的不信任感。而 Apertus 则打破了这一常规，力求通过开源的方式来促进技术的共享与合作。研究人员和开发者们可以在此基础上进行创新与改进，推动整个行业的进步。

这项研究的团队表示，Apertus 的推出不仅旨在为研究提供便利，更希望激励全球的 AI 研究者和开发者共同参与到开源生态中来。通过这种方式，Apertus 希望能够降低 AI 技术的门槛，让更多的人能够参与到 AI 的开发和应用中，从而加速科技进步。

Apertus 的出现标志着瑞士在全球 AI 领域的一次重要尝试，预示着未来可能会有更多类似的开源项目涌现，推动整个行业向前发展。随着这一项目的持续推进，我们期待看到更多的创新和突破。