国产AI大模型DeepSeek 使用方法及API接入全流程详解
图文教程

国产AI大模型DeepSeek 使用方法及API接入全流程详解

AI中国 AI中国 5 months ago 89 阅读
4.8 (1280 Rating)
15,328 People learned

国产AI大模型 DeepSeek 直接登顶多个国家 AppStore 免费App排行榜第一, 为什么DeepSeek会如此火爆?

第一:免费好用

电脑使用直接访问DeepSeek官网即可,手机可在各大应用市场下载,全部免费使用。

  • 官网:https://chat.deepseek.com/
  • App:在应用市场搜索 “DeepSeek”

使用效果

首先它使用起来非常简单,无需复杂的提示词技巧(记得勾选上【深度思考】模式)。比如我让它:用鲁迅口吻写一份拒绝加班的声明

首先它会先进行深度思考,整个深度思考过程:从用户需求的分析到该怎么来写,最后还有检查机制,不得不说这思考真非常深度,给小编23天也想不出来,而它只用了23秒!!

最后看下思考过后的输出

不得不说,这篇声明绝了!把加班比作"拆卖魂魄",报表说成"黄表纸裁的工时簿",精准戳中打工人痛点。用老典故骂新世道,句句都是我们想说不敢说的硬话,最后那句"人得站着走路"直接封神,堪称现代社畜的文言文嘴替。

如何更好的使用推理模型?

在这篇文章《o1 isn’t a chat model (and that’s the point)》提到了两个使用技巧:

原文:https://www.latent.space/p/o1-skill-issue

1. 提供丰富的背景信息

使用推理模型时要像跟朋友详细诉说难题一样,把问题背景、尝试过的办法等相关细节都告诉它。

案例

你想给家里的小花园重新规划一下,就可以这样说:“我家小花园面积大概20平米,呈不规则形状。目前里面种了一些花,但布局有点乱。之前我试着按照颜色分区种植,但效果不太好,显得有些杂乱。我希望能打造一个有特色、美观的小花园,平时还能种点蔬菜。我比较喜欢自然清新的风格,预算有限。”

2. 关注目标,明确输出

告诉推理模型你最终想要的结果就行,别管它具体怎么做。

案例

“我需要一份小花园重新规划的方案,包括植物布局、蔬菜种植区域划分、整体风格设计,要体现自然清新风格,且要考虑低成本。”

第二:技术开源

DeepSeek 模型开源 License 统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。

  • 开源地址:https://github.com/deepseek-ai/DeepSeek-LLM
  • HuggingFace 链接:https://huggingface.co/deepseek-ai

技术实力

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

论文:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

DeepSeek-R1通过引入「冷启动数据」和「多阶段训练」进一步提升了推理性能,达到了与OpenAI-o1-1217相当的水平。此外,通过「蒸馏技术」成功将推理能力转移到更小的密集模型中,显著提高了这些模型的推理性能。

  • 冷启动数据:
  • DeepSeek-R1在开始大规模强化学习之前,先使用一小部分高质量的“冷启动”数据进行微调。这些数据帮助模型快速进入一个较好的状态,减少了从零开始训练所需的迭代次数和时间。
  • 多阶段训练:
  • DeepSeek-R1采用了一个多阶段的训练流程。首先,通过强化学习来增强模型的推理能力;然后,在接近收敛时,结合监督数据进行进一步的微调。这种方法确保了模型在不同任务上的表现都能得到优化。
  • 蒸馏技术:
  • 蒸馏是一种将大型模型的知识转移到小型模型的技术。DeepSeek-R1作为教师模型,生成了大量用于训练的样本。这些样本被用来微调较小的模型,使它们能够继承大型模型的推理能力。这种方法不需要对小型模型进行大规模的强化学习,从而节省了计算资源。

同等性能的情况下 DeepSeek-R1 API 价格比 OpenAI o1 API 价格便宜几十倍,堪称性价比之王!

如果你要结成到自己的业务中可以使用API的方式

如何接入DeepSeek-R1 API?

  1. 进入DeepSeek官网
  2. https://www.deepseek.com/

  1. 注册并登录账户,进入工作后台
  2. https://platform.deepseek.com/usage

  1. 选择API菜单,创建API Keys,并将其复制保存。
  2. API文档地址
  3. https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

推理模型会在输出最终回答之前,模型会先输出一段思维链内容,以提升最终答案的准确性。

在每一轮对话过程中,模型会输出思维链内容(reasoning_content)和最终回答(content)。在下一轮对话中,之前轮输出的思维链内容不会被拼接到上下文中,如下图所示:

在使用 deepseek-reasoner 时,请先升级 OpenAI SDK 以支持新参数。

pip3 install -U openai

下面的代码以 Python 语言为例,展示了如何访问思维链和最终回答,以及如何在多轮对话中进行上下文拼接。

from openai import OpenAIclient = OpenAI(api_key="", base_url="https://api.deepseek.com")
# Round 1messages = [{"role": "user", "content": "9.11和9.8,哪个更大?"}]response = client.chat.completions.create( model="deepseek-reasoner", messages=messages)
reasoning_content = response.choices[0].message.reasoning_contentcontent = response.choices[0].message.content

总结

DeepSeek的爆火绝非偶然,技术普惠从来不是空话,而是镌刻在每一行开源代码中的自由精神,更是技术平权浪潮里永不褪色的承诺

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。

Rating

4.8 (1280 Rating)

Comment (11)

User avatar

DeepSeek真香!免费又好用,太适合大众!

User avatar

免费就意味着更多人能接触到知识,这才是真的!

User avatar

这玩意儿,感觉就像一个超级聪明的宠物,太可爱了!

User avatar

感觉整个世界都快被AI洗劫了,有点害怕又好笑!

User avatar

免费就免费,谁不喜欢免费啊?太棒了!

User avatar

这玩意儿,简直是智商的象征,我有点羡慕!

User avatar

我开始怀疑,是不是真的要被AI取代了!

User avatar

免费好用,跟未来世界有点像,有点不真实!

User avatar

感觉未来人类都得靠它来思考,真奇妙!

User avatar

免费?这简直是上帝的恩赐,太绝了!

睡觉动画