self-llm – 专为中国开发者推出的开源大模型教程
# AI工具,# AI项目和框架 AI视频

self-llm – 专为中国开发者推出的开源大模型教程

AI中国 AI中国 20小时前 184 阅读
4.8 (1280评分)

self-llm是什么

self-llm (开源大模型食用指南)是Datawhale专为国内初学者打造的开源大模型教程,基于Linux平台,提供从环境配置到模型部署、微调的全流程指导,涵盖LLaMA、ChatGLM等主流模型。项目能简化开源大模型的使用流程,帮助学生和研究者快速上手。教程提供多种模型的详细教程、微调方法(如LoRA、ptuning)及应用案例,适合不同层次的学习者。项目鼓励社区参与,共同完善内容,推动开源大模型的普及和应用。

self-llm的主要功能

  • 环境配置指导:提供基于Linux平台的开源大模型环境配置指南,帮助用户搭建适合不同模型运行的基础环境。
  • 模型部署教程:涵盖国内外主流开源大模型(如LLaMA、ChatGLM、InternLM等)的本地部署方法,包括命令行调用、在线Demo部署等。
  • 微调方法指导:提供全量微调、LoRA微调、ptuning等高效微调方法的详细教程,帮助用户根据需求对模型进行定制化优化。
  • 应用开发指导:结合LangChain等框架,指导用户如何将开源大模型集成到实际应用中,打造领域特色的私域模型。
  • 社区共创与支持:鼓励用户提交问题(issue)或贡献代码(PR),共同完善教程内容,形成开源社区的协作与支持体系。

self-llm支持的模型

  • GLM-4.1-Thinking
    • GLM-4.1V-Thinking vLLM 部署调用
    • GLM-4.1V-Thinking Gradio 部署
    • GLM-4.1V-Thinking LoRA 微调及 SwanLab 可视化记录
    • GLM-4.1V-Thinking Docker 镜像
  • GLM-4.5-Air
    • GLM-4.5-Air vLLM 部署调用
    • GLM-4.5-Air EvalScope 智商情商评测
    • GLM-4.5-Air LoRA 微调
    • GLM-4.5-Air Ucloud Docker 镜像
  • ERNIE-4.5
    • ERNIE-4.5-0.3B-PT LoRA 微调及 SwanLab 可视化记录
    • ERNIE-4.5-0.3B-PT LoRA Docker 镜像
  • Hunyuan-A13B-Instruct
    • Hunyuan-A13B-Instruct 模型架构解析
    • Hunyuan-A13B-Instruct SGLang 部署调用
    • Hunyuan-A13B-Instruct LoRA SwanLab 可视化微调
    • Hunyuan-A13B-Instruct LoRA Docker 镜像
  • Qwen3
    • Qwen3 模型结构解析
    • Qwen3-8B vllm 部署调用
    • Qwen3-8B Windows LMStudio 部署调用
    • Qwen3-8B Evalscope 智商情商评测
    • Qwen3-8B LoRA 微调及 SwanLab 可视化记录
    • Qwen3-30B-A3B 微调及 SwanLab 可视化记录
    • Qwen3 Think 解密
    • Qwen3-8B Docker 镜像
    • Qwen3-0.6B 的小模型用途
    • Qwen3-1.7B 医学推理式对话微调及 SwanLab 可视化记录
    • Qwen3-8B GRPO 微调及 SwanLab 可视化
  • Kimi-VL-A3B
    • Kimi-VL-A3B 技术报告解读
    • Kimi-VL-A3B-Thinking WebDemo 部署(网页对话助手)
  • Llama4
    • Llama4 对话助手
    • SpatialLM
    • SpatialLM 3D点云理解与目标检测模型部署
    • Hunyuan3D-2
    • Hunyuan3D-2 系列模型部署
    • Hunyuan3D-2 系列模型代码调用
    • Hunyuan3D-2 系列模型 Gradio 部署
    • Hunyuan3D-2 系列模型 API Server
    • Hunyuan3D-2 Docker 镜像
  • Gemma3
    • Gemma-3-4b-it FastApi 部署调用
    • Gemma-3-4b-it ollama + open-webui 部署
    • Gemma-3-4b-it Evalscope 智商情商评测
    • Gemma-3-4b-it LoRA 微调
    • Gemma-3-4b-it Docker 镜像
    • Gemma-3-4b-it GRPO 微调及 SwanLab 可视化
  • DeepSeek-R1-Distill
    • DeepSeek-R1-Distill-Qwen-7B FastApi 部署调用
    • DeepSeek-R1-Distill-Qwen-7B Langchain 接入
    • DeepSeek-R1-Distill-Qwen-7B WebDemo 部署
    • DeepSeek-R1-Distill-Qwen-7B vLLM 部署调用
    • DeepSeek-R1-0528-Qwen3-8B-GRPO 及 SwanLab 可视化
  • MiniCPM-o-2_6
    • MiniCPM-o-2.6 FastApi 部署调用
    • MiniCPM-o-2.6 WebDemo 部署
    • MiniCPM-o-2.6 多模态语音能力
    • MiniCPM-o-2.6 可视化 LaTeX_OCR LoRA 微调
  • InternLM3
    • InternLM3-8b-instruct FastApi 部署调用
    • InternLM3-8b-instruct Langchain 接入
    • InternLM3-8b-instruct WebDemo 部署
    • InternLM3-8b-instruct LoRA 微调
    • InternLM3-8b-instruct o1-like 推理链实现
  • phi4
    • phi4 FastApi 部署调用
    • phi4 Langchain 接入
    • phi4 WebDemo 部署
    • phi4 LoRA 微调
    • phi4 LoRA 微调 NER任务 SwanLab 可视化记录版
    • phi4 GRPO 微调及 SwanLab 可视化
  • Qwen2.5-Coder
    • Qwen2.5-Coder-7B-Instruct FastApi 部署调用
    • Qwen2.5-Coder-7B-Instruct Langchain 接入
    • Qwen2.5-Coder-7B-Instruct WebDemo 部署
    • Qwen2.5-Coder-7B-Instruct vLLM 部署
    • Qwen2.5-Coder-7B-Instruct LoRA 微调
    • Qwen2.5-Coder-7B-Instruct LoRA 微调 SwanLab 可视化记录版
  • Qwen2-vl
    • Qwen2-vl-2B FastApi 部署调用
    • Qwen2-vl-2B WebDemo 部署
    • Qwen2-vl-2B vLLM 部署
    • Qwen2-vl-2B LoRA 微调
    • Qwen2-vl-2B LoRA 微调 SwanLab 可视化记录版
    • Qwen2-vl-2B LoRA 微调案例 – LaTeXOCR
  • Qwen2.5
    • Qwen2.5-7B-Instruct FastApi 部署调用
    • Qwen2.5-7B-Instruct Langchain 接入
    • Qwen2.5-7B-Instruct vLLM 部署调用
    • Qwen2.5-7B-Instruct WebDemo 部署
    • Qwen2.5-7B-Instruct LoRA 微调
    • Qwen2.5-7B-Instruct o1-like 推理链实现
    • Qwen2.5-7B-Instruct LoRA 微调 SwanLab 可视化记录版
  • Apple OpenELM
    • OpenELM-3B-Instruct FastApi 部署调用
    • OpenELM-3B-Instruct LoRA 微调
  • Llama3_1-8B-Instruct
    • Llama3_1-8B-Instruct FastApi 部署调用
    • Llama3_1-8B-Instruct Langchain 接入
    • Llama3_1-8B-Instruct WebDemo 部署
    • Llama3_1-8B-Instruct LoRA 微调
    • 动手转换 GGUF 模型并使用 Ollama 本地部署
  • Gemma-2-9b-it
    • Gemma-2-9b-it FastApi 部署调用
    • Gemma-2-9b-it Langchain 接入
    • Gemma-2-9b-it WebDemo 部署
    • Gemma-2-9b-it Peft LoRA 微调
  • Yuan2.0
    • Yuan2.0-2B FastApi 部署调用
    • Yuan2.0-2B Langchain 接入
    • Yuan2.0-2B WebDemo 部署
    • Yuan2.0-2B vLLM 部署调用
    • Yuan2.0-2B LoRA 微调
  • Yuan2.0-M32
    • Yuan2.0-M32 FastApi 部署调用
    • Yuan2.0-M32 Langchain 接入
    • Yuan2.0-M32 WebDemo 部署
  • DeepSeek-Coder-V2
    • DeepSeek-Coder-V2-Lite-Instruct FastApi 部署调用
    • DeepSeek-Coder-V2-L

self-llm的项目地址

  • GitHub仓库:https://github.com/datawhalechina/self-llm

self-llm的应用场景

  • 教育与学习:为初学者提供从环境配置到模型微调的全流程指导,助力学生和开发者快速掌握开源大模型的使用方法。
  • 企业应用开发:帮助企业根据自身业务需求对开源大模型进行定制化微调,开发智能客服、知识管理等专属应用。
  • 个人项目开发:支持个人开发者利用开源大模型开发智能写作助手、个人智能助手等项目,提升个人生产力。
  • 研究与创新:为研究人员提供实验平台,支持对开源大模型的架构优化、训练方法改进等研究工作。

评分

4.8 (1280 人评分)

评论 (0)

睡觉动画