近日,瑞士联邦理工学院洛桑分校(EPFL)、苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)联合发布了一个名为 “Apertus” 的大规模开源语言模型。该模型的名字在拉丁语中意为 “开放”,而其开发理念恰恰体现了这一精神。
与当前市场上如 OpenAI 的 GPT 系列、Meta 的 Llama 和 Anthropic 的 Claude 等美国大型模型相比,Apertus 不仅注重技术本身,更以其透明度赢得了广泛的关注。这款模型的所有内容,包括模型权重、架构设计、训练代码以及数据来源等,全部实现了公开,甚至连训练过程的完整文档也毫无保留。这种 “开放” 策略让 Apertus 成为了一个值得期待的新选择。
在这个 AI 快速发展的时代,“数据黑箱” 的现象依然普遍存在。许多大型科技公司在发布他们的模型时,往往对外界隐瞒了大量关键细节,导致了行业的不信任感。而 Apertus 则打破了这一常规,力求通过开源的方式来促进技术的共享与合作。研究人员和开发者们可以在此基础上进行创新与改进,推动整个行业的进步。
这项研究的团队表示,Apertus 的推出不仅旨在为研究提供便利,更希望激励全球的 AI 研究者和开发者共同参与到开源生态中来。通过这种方式,Apertus 希望能够降低 AI 技术的门槛,让更多的人能够参与到 AI 的开发和应用中,从而加速科技进步。
Apertus 的出现标志着瑞士在全球 AI 领域的一次重要尝试,预示着未来可能会有更多类似的开源项目涌现,推动整个行业向前发展。随着这一项目的持续推进,我们期待看到更多的创新和突破。