核心要点
- 上下文工程(Context Engineering)本质是信息管理,通过优化信息的组织和呈现方式,可以显著提升大语言模型(LLM)的表现
- 上下文窗口(Context Window)是模型的“工作记忆”,容量有限,是我们与 LLM 交互的主要方式
- 设计智能体(Agent)的关键在于规划信息流:需要什么信息,信息从哪儿来、怎么存、需要的时候怎么精准获取
P.S. 尝试从模型视角来编写提示和工具文档(共情一下同是“打工”的 Agent),你会发现一切变得特别好理解
内容大纲
- 什么是上下文工程(及其类型)
- 为什么上下文工程很重要(长上下文引发的问题)
- 如何优化上下文工程(四大策略和六项技术)
什么是上下文工程
在工作中,我们可能常抱怨“需求不清晰”,比如老板提出了一个抽象想法,或者是同事写的文档又臭又长,让人无从下手。同理,你需要输入完整、清晰且结构化的相关准确信息,大模型才能把活干好。
Context engineering is building dynamic systems to provide the right information and tools in the right format such that the LLM can plausibly accomplish the task. @LangChain
翻译版:上下文工程指构建动态系统,以合适的格式提供必要信息与工具,使 LLM 能够合理完成任务。
人话版:由于上下文窗口容量是有限的(就像你也记不住很多东西一样),上下文工程的核心任务,就是决定在 LLM 运行的每一步中,哪些信息需要被加载到上下文窗口中。
LLM 所需的信息可分为三类:
- 指令(Instructions):
- 系统提示和用户请求
- 记忆(跨多个会话保留的用户偏好或历史交互信息)
- 少量示例(提供输入输出样例以引导模型行为)
- 工具描述(解释可用工具的功能和参数)
- 知识(Knowledge):通过 RAG 等技术检索到的事实、文档和代码等
- 工具(Tools):包括调用记录、工具反馈(如API返回结果或错误信息)等
浅浅总结一下,
优秀的上下文 =
给模型的提示词/指令
检索得到的文档/数据
过程中产生的数据(历史状态/工具调用记录/执行结果等)
跨对话记忆(相关历史消息或事件)
输出规范(需要什么格式的数据)
Q:和提示词工程(Prompt Engineering)的区别?
A:顾名思义,提示词工程专注于通过编写有效提示词来优化 LLM 的输出效果。上下文工程则是为 Agent 提供完整且结构化上下文的一系列策略,比如检索(在调用大模型前动态获取并插入相关信息),记忆管理(如生成对话摘要、记录用户偏好等)。
为什么上下文工程很重要
上下文工程对 Agent 非常关键,原因如下:
- 任务的复杂性与长期性: Agent 通常需要执行多步骤、长时间运行的任务,导致多轮交互中信息持续累积
- 工具的使用:Agent 可以调用工具与外部环境交互(如联网搜索),并需要保存工具返回的结果,信息进一步变多
Agent 需要正确信息来执行任务,而执行过程又会产生新信息,所有这些信息都会存在上下文窗口中。信息过多(即长上下文)可能导致以下问题:超出上下文窗口容量、增加成本与延迟,降低输出质量。
另外,Agent 需要记住的信息越多,出错的概率也会越大(是的谁不会犯错呢),所以如何管理上下文就变得很重要。
Q:什么是 Agent?和 LLM 的区别?
Agent 通过交替调用 LLM 和工具,根据工具的反馈(Observation)来决定下一步操作,循环迭代直到完成任务,通常用于处理长时间运行的复杂任务。Agent 是能调用工具的 LLM。
长上下文的问题(Context Rot)
在《How Long Contexts Fail》一文中,Drew Breunig 指出了长上下文可能导致的问题:
上下文污染(Context Poisoning):幻觉或错误信息进入上下文后被反复引用,导致模型输出错误内容
上下文干扰(Context Distraction):上下文过多时,模型过度关注某些信息而忽略当前任务
上下文混淆(Context Confusion):不相关的上下文内容影响输出质量,因为模型倾向于使用所有可用信息
上下文冲突(Context Clash):累积的上下文中存在相互矛盾的信息,从而削弱模型的推理能力
我们可以用一个小剧场来理解以上问题:
假设你是一个项目经理,正负责写一份复杂的行业研究报告。你的办公桌(上下文窗口)就是工作区,桌子的容量固定且有限(临时工作记忆),且你只能从桌上的文件查找需要的信息。
每完成一个分析步骤,你的助手们(工具调用)都会将完整未压缩的反馈报告(调用结果)堆放在你的桌上。由于空间有限,报告迅速堆满,导致无法放新文件,任务陷入停滞——内存限制。
桌上堆满冗长且不重要的原始数据,你的注意力被大量细节分散,难以从中提取关键信息并聚焦下一步要完成的任务,导致效率低下——上下文干扰。
除了必要的报告外,桌上还有数百份功能相似的工具说明书,这些不相关的文件让你难以选择正确的工具或行动——上下文混淆。
其中两位助手提交了关于同一主题但结论矛盾的报告,导致你在确定最终结论时感到困惑——上下文冲突。
项目初期,你在核心项目计划书(上下文历史)中误写了一个错误数据。由于这份计划书一直放在你的桌上,并被反复参考,这个错误的前提“污染”了后续所有分析,导致项目偏离正轨——上下文污染。
下一篇会继续分享如何优化上下文工程,欢迎留言讨论!
想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享!
👇👇扫码免费领取全部内容👇👇
一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势
想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI:
1. 100+本大模型方向电子书
2. 26 份行业研究报告:覆盖多领域实践与趋势
报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:
- 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
- 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
- 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
- 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。
3. 600+套技术大会 PPT:听行业大咖讲实战
PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:
- 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
- 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
- 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
- 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。
二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走
想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!
1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位
面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析:
2. 102 道 AI 大模型真题:直击大模型核心考点
针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:
3. 97 道 LLMs 真题:聚焦大型语言模型高频问题
专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:
![]()
三、路线必明: AI 大模型学习路线图,1 张图理清核心内容
刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!
路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。
L1阶段:启航篇丨极速破界AI新时代
L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。
L2阶段:攻坚篇丨RAG开发实战工坊
L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。
L3阶段:跃迁篇丨Agent智能体架构设计
L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。
L4阶段:精进篇丨模型微调与私有化部署
L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。
L5阶段:专题集丨特训篇 【录播课】
![]()
四、资料领取:全套内容免费抱走,学 AI 不用再找第二份
不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:
👇👇扫码免费领取全部内容👇👇
2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!