国产AI大模型DeepSeek 使用方法及API接入全流程详解

国产AI大模型 DeepSeek 直接登顶多个国家 AppStore 免费App排行榜第一，为什么DeepSeek会如此火爆？

第一：免费好用

电脑使用直接访问DeepSeek官网即可，手机可在各大应用市场下载，全部免费使用。

官网：https://chat.deepseek.com/
App：在应用市场搜索 “DeepSeek”

使用效果

首先它使用起来非常简单，无需复杂的提示词技巧（记得勾选上【深度思考】模式）。比如我让它：用鲁迅口吻写一份拒绝加班的声明

首先它会先进行深度思考，整个深度思考过程：从用户需求的分析到该怎么来写，最后还有检查机制，不得不说这思考真非常深度，给小编23天也想不出来，而它只用了23秒！！

最后看下思考过后的输出

不得不说，这篇声明绝了！把加班比作"拆卖魂魄"，报表说成"黄表纸裁的工时簿"，精准戳中打工人痛点。用老典故骂新世道，句句都是我们想说不敢说的硬话，最后那句"人得站着走路"直接封神，堪称现代社畜的文言文嘴替。

如何更好的使用推理模型？

在这篇文章《o1 isn’t a chat model (and that’s the point)》提到了两个使用技巧：

原文：https://www.latent.space/p/o1-skill-issue

1. 提供丰富的背景信息

使用推理模型时要像跟朋友详细诉说难题一样，把问题背景、尝试过的办法等相关细节都告诉它。

案例：

你想给家里的小花园重新规划一下，就可以这样说：“我家小花园面积大概20平米，呈不规则形状。目前里面种了一些花，但布局有点乱。之前我试着按照颜色分区种植，但效果不太好，显得有些杂乱。我希望能打造一个有特色、美观的小花园，平时还能种点蔬菜。我比较喜欢自然清新的风格，预算有限。”

2. 关注目标，明确输出

告诉推理模型你最终想要的结果就行，别管它具体怎么做。

案例：

“我需要一份小花园重新规划的方案，包括植物布局、蔬菜种植区域划分、整体风格设计，要体现自然清新风格，且要考虑低成本。”

第二：技术开源

DeepSeek 模型开源 License 统一采用标准化、宽松的 MIT License，完全开源，不限制商用，无需申请。

开源地址：https://github.com/deepseek-ai/DeepSeek-LLM
HuggingFace 链接：https://huggingface.co/deepseek-ai

技术实力

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

论文：https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

DeepSeek-R1通过引入「冷启动数据」和「多阶段训练」进一步提升了推理性能，达到了与OpenAI-o1-1217相当的水平。此外，通过「蒸馏技术」成功将推理能力转移到更小的密集模型中，显著提高了这些模型的推理性能。

冷启动数据：

DeepSeek-R1在开始大规模强化学习之前，先使用一小部分高质量的“冷启动”数据进行微调。这些数据帮助模型快速进入一个较好的状态，减少了从零开始训练所需的迭代次数和时间。

多阶段训练：

DeepSeek-R1采用了一个多阶段的训练流程。首先，通过强化学习来增强模型的推理能力；然后，在接近收敛时，结合监督数据进行进一步的微调。这种方法确保了模型在不同任务上的表现都能得到优化。

蒸馏技术：

蒸馏是一种将大型模型的知识转移到小型模型的技术。DeepSeek-R1作为教师模型，生成了大量用于训练的样本。这些样本被用来微调较小的模型，使它们能够继承大型模型的推理能力。这种方法不需要对小型模型进行大规模的强化学习，从而节省了计算资源。

同等性能的情况下 DeepSeek-R1 API 价格比 OpenAI o1 API 价格便宜几十倍，堪称性价比之王！

如果你要结成到自己的业务中可以使用API的方式

如何接入DeepSeek-R1 API？

进入DeepSeek官网
https://www.deepseek.com/

注册并登录账户，进入工作后台
https://platform.deepseek.com/usage

选择API菜单，创建API Keys，并将其复制保存。
API文档地址
https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

推理模型会在输出最终回答之前，模型会先输出一段思维链内容，以提升最终答案的准确性。

在每一轮对话过程中，模型会输出思维链内容（reasoning_content）和最终回答（content）。在下一轮对话中，之前轮输出的思维链内容不会被拼接到上下文中，如下图所示：

在使用 deepseek-reasoner 时，请先升级 OpenAI SDK 以支持新参数。

pip3 install -U openai

下面的代码以 Python 语言为例，展示了如何访问思维链和最终回答，以及如何在多轮对话中进行上下文拼接。

from openai import OpenAIclient = OpenAI(api_key="", base_url="https://api.deepseek.com")# Round 1messages = [{"role": "user", "content": "9.11和9.8，哪个更大？"}]response = client.chat.completions.create( model="deepseek-reasoner", messages=messages)reasoning_content = response.choices[0].message.reasoning_contentcontent = response.choices[0].message.content