Midjourney操作界面

程序员挑战极限:在古老的 DOS 系统上成功运行 Llama 2 模型

4.8
0热度
ChatGPT APP

在科技飞速发展的今天,一位勇敢的程序员选择回归经典,尝试在老旧的 DOS 环境中运行 Meta 公司最新发布的大语言模型 Llama2。Yeo Kheng Meng,这位因开发 ChatGPT DOS 客户端而声名鹊起的程序员,花费了一个周末的时间,成功地将这个大型语言模型移植到传统计算环境中,展现了无与伦比的技术创造力。项目的起步得益于开源代码的便利。Meng 使用了名为 “llama2.c”

在科技飞速发展的今天,一位勇敢的程序员选择回归经典,尝试在老旧的 DOS 环境中运行 Meta 公司最新发布的大语言模型 Llama2。Yeo Kheng Meng,这位因开发 ChatGPT DOS 客户端而声名鹊起的程序员,花费了一个周末的时间,成功地将这个大型语言模型移植到传统计算环境中,展现了无与伦比的技术创造力。

项目的起步得益于开源代码的便利。Meng 使用了名为 “llama2.c” 的项目,这是一个专门设计用来加速 Llama2模型在不同系统和硬件上的移植工作。然而,适配到古老的 DOS 环境并非易事。尽管 llama2.c 旨在提高可移植性,Meng 仍需进行多次编码调整,以解决传统计算平台带来的各种挑战。

在实现过程中,Meng 面临了内存的限制。在 DOS 系统中,通常只能访问640KB 的常规内存,因此他必须选择合适的 DOS 扩展工具,以便能够使用更大的 RAM。此外,由于 llama2.c 需要一个功能较强的 C 编译器,Meng 还对 OWC 编译器进行了修改,以确保能够顺利编译代码。

image.png

经过多次尝试和测试,Meng 最终成功创建了一个在 DOS 系统上可运行的 llama2二进制文件,并在多台不同性能的电脑上进行了基准测试。从老旧的486DX266MHz 计算机到现代基于 Ryzen 的台式机,测试结果显示,新系统无疑提供了更快的推理速度。而令人惊讶的是,搭载1.7GHz Pentium M 处理器的 ThinkPad T42竟然在性能上超过了16年后发布的 ThinkPad X13G1,这一发现令许多人感到意外。

Meng 将这次成功的移植和测试过程视为一个充实且富有成就感的周末项目。他也特别感谢 Andrej Karpathy 开源的 llama2.c 代码,正是这份贡献使得这一切成为可能。这次挑战不仅彰显了技术的力量,也证明了在任何平台上实现创新的可能性。

点赞(0)

评论列表 共有 0 条评论

暂无评论
发表
评论
顶部