玩转AI：从提示词到智能体的上下文工程 - ListenHub

Cover

玩转AI：从提示词到智能体的上下文工程

Von Fred

1

7-4

本文清晰阐述了“提示词”、“提示词工程”和“上下文工程”这三个与AI交互相关的核心概念。它详细定义了提示词作为AI输入，提示词工程作为优化提示词的系统过程，并着重介绍了上下文工程作为一门为AI设计和构建动态上下文的学科，特别强调了其在AI Agent背景下的重要性。

提示词 (Prompt)

给AI模型的输入文本，即直接向模型输入的问题或指令。
例如：让ChatGPT总结文本、调用模型API传入提示词去翻译文章。
本质上是一段文本，类似于代码。

提示词工程 (Prompt Engineering)

系统化地设计、测试、优化提示词的过程。
类似软件工程，通过科学方法论（如敏捷开发）来优化和迭代，以产生更有效的提示词版本。
示例：通过尝试CoT（思维链）等方法，对翻译提示词进行反复设计、测试和优化，以提升翻译效果。
核心目标是产生优化后的提示词。

上下文工程 (Context Engineering)

一门为AI设计和构建动态上下文的学科，旨在为大语言模型提供恰当的信息和工具，帮助模型高效完成任务。
“上下文”指模型生成回答前所看到的一切信息，包括系统提示词、用户输入、对话历史、长期记忆、工具返回信息等。
构建上下文的过程是完全动态的，模型能根据当前状态自主调用工具（如日期工具、搜索工具）补齐所需信息。
这一概念在AI Agent爆发背景下诞生，是AI Agent工作原理的核心。

概念区分与适用人群 (Concept Distinction and Target Audience)

提示词： 发送给AI的问题或指令文本。
提示词工程： 系统化地设计、测试、优化提示词的过程。
上下文工程： 为大语言模型提供恰当的上下文、帮助模型高效完成任务的科学和艺术。
适用人群： 普通人掌握提示词即可；开发AI应用需考虑提示词工程；开发动态AI智能体（AI Agent）则需掌握上下文工程。

Outline

本文清晰阐述了“提示词”、“提示词工程”和“上下文工程”这三个与AI交互相关的核心概念。它详细定义了提示词作为AI输入，提示词工程作为优化提示词的系统过程，并着重介绍了上下文工程作为一门为AI设计和构建动态上下文的学科，特别强调了其在AI Agent背景下的重要性。

提示词 (Prompt)

给AI模型的输入文本，即直接向模型输入的问题或指令。
例如：让ChatGPT总结文本、调用模型API传入提示词去翻译文章。
本质上是一段文本，类似于代码。

提示词工程 (Prompt Engineering)

系统化地设计、测试、优化提示词的过程。
类似软件工程，通过科学方法论（如敏捷开发）来优化和迭代，以产生更有效的提示词版本。
示例：通过尝试CoT（思维链）等方法，对翻译提示词进行反复设计、测试和优化，以提升翻译效果。
核心目标是产生优化后的提示词。

上下文工程 (Context Engineering)

一门为AI设计和构建动态上下文的学科，旨在为大语言模型提供恰当的信息和工具，帮助模型高效完成任务。
“上下文”指模型生成回答前所看到的一切信息，包括系统提示词、用户输入、对话历史、长期记忆、工具返回信息等。
构建上下文的过程是完全动态的，模型能根据当前状态自主调用工具（如日期工具、搜索工具）补齐所需信息。
这一概念在AI Agent爆发背景下诞生，是AI Agent工作原理的核心。

概念区分与适用人群 (Concept Distinction and Target Audience)

提示词： 发送给AI的问题或指令文本。
提示词工程： 系统化地设计、测试、优化提示词的过程。
上下文工程： 为大语言模型提供恰当的上下文、帮助模型高效完成任务的科学和艺术。
适用人群： 普通人掌握提示词即可；开发AI应用需考虑提示词工程；开发动态AI智能体（AI Agent）则需掌握上下文工程。

Script

宇轩: 你知道吗，现在身边好多朋友都在玩儿AI，天天跟ChatGPT聊天，让它帮忙写邮件啊、做总结啊。我们输入那些问题或者指令，看着好像挺简单的，但它背后到底是怎么回事儿？这些咱们敲进去的文字，在AI那个神秘的世界里，到底扮演着一个什么样的角色呢？

若云: 哎呀，你这个问题可算是问到点子上了！咱们输入的这些文字，不管是问句还是指令，它都有一个特别高大上的学名，叫做“提示词”，英文就是Prompt。说白了，它就是咱们跟AI小脑瓜子搭上线的那根“金线”，是给它下达“圣旨”最直接的方式。你想啊，你让ChatGPT帮你总结一段文章，或者通过API调取模型去翻译一句话，你敲进去的那些内容，那可就是实打实的提示词啊。

宇轩: 你说它像命令，我脑子里突然冒出一个词儿，它是不是有点像咱们写代码那样？为什么说提示词有点像代码呢？它在AI世界里到底有多重要，能跟代码相提并论吗？

若云: 没错，你这个比喻简直绝了！说它像代码，那是因为它就是咱们用来“编程”或者“指挥”大语言模型的秘密武器。就像程序员用代码告诉计算机“你给我干这个！”一样，我们就是用提示词来引导AI去“思考”，去生成咱们想要的内容。它是所有AI交互的起点，毫不夸张地说，你的提示词写得好不好，直接就决定了AI给你的答案是“哇塞”还是“什么玩意儿”。一个模棱两可的提示词，就像你代码里埋了个坑，最后出来的东西肯定不是你想要的那味儿。

宇轩: 好的，所以提示词就是咱们跟AI对话的“开山斧”，是驱动AI跑起来的“代码”。但话说回来，很多时候咱们就觉得，随便敲几个字好像不太够用，AI给的回答那真是时好时坏，跟开盲盒似的。那如果我想要AI表现得更聪明、更精准，我们该怎么系统性地把这些“代码”的质量提上去呢？

若云: 哈哈，你这盲盒开得还挺形象的。这一下就引出了一个更深层次的概念，叫做“提示词工程”，英文是Prompt Engineering。它可就不是咱们随手写句话那么简单了，它就像咱们搞软件工程一样，有一套非常系统化的方法论。我跟你说，原文里有一个特别生动的翻译案例，简直就是把这个过程讲得明明白白，太经典了！

宇轩: 哦？你刚才提到怎么系统性地提升提示词质量，这个翻译案例听起来就很有故事性。它完美地展示了从一个普通指令到不断优化的“进化史”。快快快，给我们讲讲这个“翻译优化之旅”吧！

若云: 当然啦！一开始，咱们的指令可能简单粗暴，就一句“请把下面的英文内容翻译为中文”。这当然能用，但效果嘛，可能就差强人意了。为了“精装修”一下，我们可以引入一个叫做“思维链”的技术，英文是Chain-of-Thought，简称CoT。说白了，就是让AI先“动动脑子”再给你回答。比如，把提示词改成：“请你先仔细阅读下面的英文内容，然后翻译成中文，接着检查翻译是否通顺流畅，最后再把最终版本输出给我。”你看，是不是严谨多了？

宇轩: 听起来确实复杂了一些，但感觉也更靠谱了。这就算提示词工程了吗？

若云: 嗨，这只是个开胃菜！真正的工程化，那得是没完没了地测试和迭代。比如，咱们用这个加了思维链的提示词去翻译，可能就会发现，虽然结果是更准确了，但它“烧”的计算资源，也就是Token，也蹭蹭地往上涨，成本就高了。而且有时候，AI的“思考”过程可能还会跑偏，跟咱们想要的地道表达差了十万八千里。所以工程师们就会继续折腾，不断测试，最后搞不好会发现一个意想不到的“最优解”，比如把指令改成“请用中文重写下面的英文内容”。你仔细品品，“重写”这个词，是不是比“翻译”更能激发模型去生成地道、流畅的中文？这真是个小小的魔法！

宇轩: 哇塞，这个例子太棒了！它不仅展示了思维链的巧妙应用，更体现了那种“不折腾不舒服斯基”的不断测试和迭代精神。那么，在这样的优化过程中，咱们通常会遇到哪些“拦路虎”呢？比如你刚才提到的Token消耗或者AI跑偏的问题，咱们该怎么在这些挑战之间找到平衡点呢？

若云: 权衡啊，这可是提示词工程的“核心武功”！一方面咱们追求高质量的输出，恨不得AI能把咱们的心思都猜透；另一方面又得考虑成本和效率，毕竟“烧钱”这事儿谁都不想。就拿思维链来说，它确实厉害，但原文也提醒咱们了，可不是步骤越多就越好。有时候你把指令搞得过于复杂，反而会把模型给“绕晕”了，最后它给你吐出来的东西可能就奇奇怪怪的了。所以，优化的边界就在于找到那个“性价比”最高的点，在效果、成本和稳定性之间，找到一个完美的“甜蜜点”。

宇轩: 我明白了。通过这个翻译的例子，咱们就清清楚楚地看到了提示词工程是怎么把AI的响应从“能用”提升到“好用”的。但话说回来，AI模型在生成回答的时候，除了咱们输入的提示词，它还会“看到”和“记住”些啥呢？这一下就引出了下一个重量级概念——“上下文”。

若云: 没错！咱们通常都以为AI只看到了咱们当前输入的这一句话，但实际上啊，它看到的东西可比这多得多！这个“它看到的一切信息”，咱们就统称为“上下文”，也就是Context。

宇轩: 你有没有想过，当AI回答你的问题时，它可不仅仅是依赖你当下输入的几个字？原文用了一个特别绝的例子，“今天有什么重要的AI新闻”，一下就揭示了AI在回答前，其实会“看到”非常非常多的信息。你能给我们详细扒一扒，这些信息都包括哪些？

若云: 这个例子简直是教科书级别的。当你问“今天有什么重要的AI新闻”的时候，AI看到的“上下文”可能包括好几层：第一层，是系统提示词，这就像给AI设定了一个“人设”，比如“你是一个专业的AI新闻播报员”。第二层，才是你问的那个用户问题。第三层，它能用的“工具箱”，比如一个搜索引擎的接口。第四层，它的“长期记忆”，可能存着你之前喜欢看哪类新闻的偏好。第五层，最近的对话历史，它得知道咱们之前聊到哪儿了。最后，如果它调用了工具，那工具返回的新闻搜索结果，也会被一股脑地加到上下文里。所有这些东西加起来，才是它做决策的全部依据，是不是挺颠覆认知的？

宇轩: 哇，所以AI在回答我们问题的时候，它眼中的“世界”远比我们想象的要丰富和辽阔得多。那么，从AI模型的角度来看，为什么这些看似“额外”的信息，比如系统提示词或者长期记忆，对它理解和完成任务会如此关键呢？

若云: 因为大语言模型本质上就是一个“续写”机器，它可没有真正意义上的记忆或者理解力。你给它什么上下文，它就基于这个上下文去“猜”下一个最可能的词是什么。所以，系统提示词告诉它“你得演这个角色”，历史对话让它知道“咱们聊到这儿了”，工具返回的信息给了它“事实依据”。没有这些丰富的上下文，它就只是一个空空荡荡的语言生成器，根本没法完成任何有意义的任务，就像一个只会说话的鹦鹉，没有灵魂。

宇轩: 原来如此。但我好像也听说，模型的上下文窗口不是无限的，就像人的短期记忆一样，容量有限。这么说来，控制上下文就变得非常重要了。这其中会涉及到哪些挑战呢？AI是如何在有限的“小窗户”里，既不遗漏关键信息，又能避免信息过载的呢？

若云: 这可就是最烧脑的地方了！上下文窗口是有限的，而且“租金”特别贵，用得越多越烧钱。所以，你必须像个“图书管理员”一样，小心翼翼、精挑细选地决定哪些“书”（信息）要放在这个小小的书架上。这就需要很多高超的技术了，比如把历史对话“压缩”成一个总结，或者用一些算法（比如RAG）从海量资料库里只检索最最相关的信息塞进上下文。如何高效地管理这个有限的“小空间”，是现在AI领域一个非常核心的“老大难”问题。

宇轩: 我们现在理解了AI眼中的“上下文”是多么的丰富和动态。那么，如何系统地、巧妙地为AI构建和填充这些动态的上下文，让它能更智能地完成那些复杂的任务呢？我猜，这正是“上下文工程”的核心，对吧？

若云: 完全正确！你简直就是我的知音！随着AI Agent，也就是咱们说的“AI智能体”像雨后春笋一样冒出来，AI的自主性那可是越来越强了。它不再是等你给一个指令，它就乖乖地执行一个任务那么简单了。它现在需要自己“动脑子”决定下一步该干什么。这时候啊，咱们之前说的那些简单的提示词工程就有点“力不从心”了，“上下文工程”（Context Engineering）就应运而生了，它就是为这些更聪明的AI准备的。

宇轩: 为什么说原有的提示词工程已经无法满足AI Agent的需求了？上下文工程具体又是做什么的？

若云: 因为提示词工程，说到底，还是咱们人在给AI设计一个固定的“流水线”。但AI Agent需要的是那种能“随机应变”的决策能力。它得能自己判断：“我现在的信息够了吗？不够的话，我是不是得赶紧去调用个工具查点新东西啊？”上下文工程，就是为这个智能体设计它所处的整个“信息生态环境”。这包括给它提供哪些“趁手”的工具、定义它和工具之间怎么“眉来眼去”地沟通、以及怎么动态地组织所有信息，帮助它在每一步都能做出最优的自主决策。这可比之前复杂多了！

宇轩: 我听过一个特别形象的比喻，说特斯拉前AI总监Andrej Karpathy把上下文工程比作“烹饪一道精致的菜肴”。这其中涉及到的“配料”和“火候”，比如如何组合任务描述、样例、工具、状态等等，以及如何进行信息压缩，你能用更通俗的方式来解释一下吗？

若云: 这个比喻简直是神来之笔！所谓的“配料”，就是咱们前面提到的那些形形色色的上下文信息：系统指令啊、用户需求啊、它能用的工具啊、历史数据啊等等。而“烹饪”，就是把这些“配料”巧妙地组合、压缩、调味，然后像喂宝宝一样喂给AI。比如，当上下文窗口快满的时候，你不能简单粗暴地把最早的对话给扔了，可能需要把它“浓缩”成一句总结。什么时候该给它“生肉”（原始数据），什么时候该给它“精炼”（总结），什么时候该悄悄提醒它“该用那个工具了”，这些决策就像大厨控制火候一样，需要那种“分寸感”，差一点都不行。

宇轩: Karpathy还说它是一门“艺术”，需要操作者掌握一种近似“心理学”的直觉。这种“艺术性”体现在哪里？在实际操作中，这种直觉是如何帮助我们更好地进行上下文工程的？

若云: 艺术性就体现在，它压根儿就没有标准答案！每个大模型都有自己的“脾气”和“性格”，就像每个人都有自己的小九九一样。你需要像一个“AI心理医生”一样，去揣摩这个模型的“心智模型”。比如，用什么样的措辞它更容易“开窍”？什么样的信息组合能激发它更强的创造力？怎么问问题才能避免它陷入某些固有的“思维定式”？这种对模型行为的深刻洞察和直觉，那就是超越了纯粹科学的“艺术”，也是那些顶尖AI工程师的核心“法宝”啊！

宇轩: 从最初的提示词，到系统化的提示词工程，再到为AI Agent构建动态环境的上下文工程，我们看到AI技术正在不断演进，简直是芝麻开花节节高啊。那么，对于不同的人群和不同的AI应用场景，我们究竟需要关注哪一个层次的概念呢？

若云: 这是一个非常好的问题，因为它很实际。毕竟不是所有人都需要成为“上下文工程”的大师。这三个概念其实是一个层层递进的“技能树”。对于咱们绝大多数普通用户来说，能清清楚楚、明明白白地写出自己的需求，也就是把“提示词”写好，就已经足够了。这就像会用筷子吃饭一样，是基本功。

宇轩: 那什么样的人需要关心“提示词工程”和“上下文工程”呢？

若云: 如果你想开发一个AI应用，比如说一个能稳定帮你写营销文案的“AI小助手”，那你可就得一头扎进“提示词工程”的领域了。因为你需要通过系统化的测试和优化，确保你的应用在各种“妖魔鬼怪”的场景下，都能稳定地输出高质量的结果。而如果你想开发的是那种更前沿的、能自主完成复杂任务的AI智能体，比如一个能帮你把旅行规划得妥妥帖帖，连机票酒店都能自动预订的“AI管家”，那你可就必须深入到“上下文工程”这个层面了。这就像从“会做饭”到“开米其林餐厅”的升级。

宇轩: 所以，这就像一个层层递进的技能树，非常形象。那么，对于那些想从普通用户晋升到AI应用开发者，或者从应用开发者进阶到AI智能体开发者的人来说，他们应该如何逐步学习和掌握这些更高级的概念呢？

若云: 是的，一个非常棒的学习路径是这样的：首先，大量地去使用AI，就像玩游戏一样，练习写出精准的提示词，这是你的“内功心法”。然后，如果你是开发者，可以开始学习如何“评判”AI输出的质量，如何对提示词进行版本管理和A/B测试，这就是提示词工程的实践，你开始有了“套路”。最后，要进入上下文工程，那可就得学习更复杂的系统设计了，比如如何为AI设计它能用的“工具箱”、如何管理它的“记忆”和“状态”，以及如何应用信息检索和压缩技术。这就像从“练武”到“排兵布阵”的飞跃。

宇轩: 非常感谢你今天的精彩分享，它为我们清晰地勾勒出了AI时代人机交互的演进路径，真是醍醐灌顶！最后，我想请你用一句话来总结一下今天讨论的核心启示。

若云: 核心启示就是，咱们跟AI的互动啊，那可是以光速在深化。所谓的“玩转AI”，已经从单纯地写好一句提示词，演变成了一门为AI智能体构建动态决策环境的科学与艺术。只有真正理解了这个演进，咱们才能牢牢把握住未来智能应用的核心脉搏！