提示词的有效性背后,是一整套模型认知的支撑。本文将从产品经理视角,拆解大模型训练的关键原理,帮助你建立提示词设计的底层心智,让“翻车”变“飞车”。

AI大模型就像一个超级博学的朋友。但这个朋友有个特点–他需要你说得非常清楚,他才能给你最好的回答。
如果你只是随便说”给我写点东西”,他可能会写出完全不是你想要的内容。但如果你说”帮我写一封正式的求职邮件,应聘软件工程师职位”,他就能给你还不错的回复了。
其实,这真不能全怪大模型“笨”,因为大模型不是真的在“思考”,而是靠着海量文本训练出的 “猜词本能”,一个又一个地猜下一个词。
而你写下的提示词,就是给它定好 “猜词” 的起点。搞懂这个底层逻辑,你才能写出让AI理解你需求的提示词,再也不用对着屏幕叹气说 “它怎么又不懂我”。
比如,你给它一句话的开头:“我喜欢”,它会根据学到的知识预测下一个最可能的词是什么。可能是“代码”、“模型”,或者其他词。它会计算每个词出现的概率,然后选择最合适的那个。下面是笔者做的示意图。

这个预测下一个单词的过程叫做“自回归生成”。大模型采用自回归机制,逐个单词地生成目标句子。
对于每个时间点t,解码器会利用先前生成的单词来预测第t个目标单词。然后在下一个时间点t+1,大模型需要结合刚预测出的第t个目标单词,去预测第t+1个目标单词。就像写作文一样,你写完第一个词,再根据前面的内容写第二个词,以此类推。
那么,大模型是怎么依赖这种自回归机制,变得知识渊博的呢?
大语言模型能力的提升来自预训练和微调两个阶段的训练。
第一阶段:预训练
预训练是大模型能力的基础,输入是大规模的无标注文本片段,比如书籍、网页、论文等,输出是对 “下一个词” 的预测。
举例来说,模型的输入是一段连续文本– “人工智能是指让计算机模拟人类智能的”,训练目标是让模型预测 “的” 后面最可能出现的词(比如 “技术”)。通过海量数据训练,模型会学习到:
- 语法、句式等人类语言规则:比如“的”后面通常接名词;
- 概念、逻辑等基本知识:比如“人工智能”常与“机器学习”“深度学习”关联;
- 任务指令:比如看到“总结:”时,后续文本倾向于简洁概括前文;比如看到“问题:”时,后面应该跟着回答。
通过这样的学习,模型掌握了语言的规律、知识之间的关系,以及不同场景下应该如何表达。
第二阶段:微调
就像一个人专门训练某个技能。比如,专门训练大模型去学习文学、小说,这让模型在特定的写作任务上表现更好。
为了让模型更适配专业知识问答、专业内容创作等具体任务,我们可以对大模型进行微调。这里的常见输入是用户可能提出的问题(question)和专家的标准回答(answer)。比如在电商客服场景:
[
{
“question”: “收到的商品有破损,怎么处理?”,
“answer”: “非常抱歉给您带来不便!请您先拍摄商品破损处及快递面单的清晰照片,然后联系在线客服上传图片,我们会为您安排补发或退款,运费由我们承担。”
},
{
“question”: “衣服尺码不合适,可以退换吗?”,
“answer”: “您好,支持7天无理由退换哦~ 请确保商品吊牌完整、未穿洗,您可以在订单页申请退换货,系统会引导您完成后续流程,退回运费在商品验收后会自动返还。”
},
{
“question”: “优惠券怎么使用?”,
“answer”: “下单时在结算页面,点击「优惠券」选项,选择您想使用的优惠券即可抵扣相应金额。注意每张优惠券都有使用门槛和有效期哦~”
}
]
这类数据能让大模型学习客服场景的专业话术、问题解决流程和用户沟通技巧,微调后模型可以更自然地处理用户咨询,减少人工客服的工作量。
现在你明白了,大模型本质上是根据前文来猜测后面应该写什么。但问题来了:它学会了太多东西!它可以写诗、写代码、回答问题、编故事…没有你的指引,它根本不知道你想要哪种回复。这就像你走进一个超大的图书馆,如果没有索引和指引,你很难找到你要的那本书。
而提示词,就是你的“图书馆索引”,通过描述清晰、具体的用户需求,引导大模型激活正确的知识和生成模式。提示词的能力具体体现在三个层面:
1、定义任务目标,选定知识来源
提示词通过明确任务类型,比如写一首诗、翻译这句话等,让大模型知道调用哪方面的人类知识去完成任务。比如输入”月亮”,大模型可能写:
- 科学知识:“月亮是地球的卫星…”
- 诗歌:“月亮像一把弯弯的镰刀…”
- 故事:“月亮上住着嫦娥…”
但如果你说”用科学的角度解释月亮的形成过程”,AI就知道要调用天体物理学的知识,而不是文学创作能力。
2、提供约束条件,缩小生成范围
提示词可以通过补充格式、长度、风格等具体的细节要求,进一步约束模型的生成范围。例如:
- 输入“写一篇关于环保的短文,分3段,每段不超过50字”:明确了结构和长度;
- 输入“用幽默的语气解释量子力学”:明确了风格。
3、符合大模型的以往认知,降低生成误差
大模型对在预训练/微调节点的训练数据是很敏感的。好的提示词会模仿被模型训练过的文本结构,让模型更容易完成知识检索和语言的组织,提升回答的质量。
例如,大模型在预训练中见过大量的列表式总结,比如 “1. … 2. … 3. …”。因此,提示词内容包含 “总结以下内容,分 3 点:XXX” ,会比 “随便总结一下 XXX” 更有效 。因为,模型对前者的分布更熟悉,生成的结构更规整。
了解了大模型的工作原理,你就能明白为什么提示词这么重要了。它不是什么神秘的技术,而是一种有效沟通的方法。记住几个要点:
- 大模型是根据你给的“提示词”来生成回复的。
- 清晰、具体的指令能帮大模型更好地理解你的需求。
- 好的提示词能激活大模型相关的知识和能力。
- 不断练习和调整,你会越来越擅长与大模型对话。
在这个AI时代,会写提示词就像会使用百度搜索一样重要。它不仅能帮你更高效地完成任务,更能让你真正释放AI这个强大工具的潜力。
本文由 @明思AI 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务