news 2026/6/20 1:03:57

一文梳理上下文工程(上):如果Agent没做好,大概率是信息没给对

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
一文梳理上下文工程(上):如果Agent没做好,大概率是信息没给对
核心要点
  • 上下文工程(Context Engineering)本质是信息管理,通过优化信息的组织和呈现方式,可以显著提升大语言模型(LLM)的表现
  • 上下文窗口(Context Window)是模型的“工作记忆”,容量有限,是我们与 LLM 交互的主要方式
  • 设计智能体(Agent)的关键在于规划信息流:需要什么信息,信息从哪儿来、怎么存、需要的时候怎么精准获取

P.S. 尝试从模型视角来编写提示和工具文档(共情一下同是“打工”的 Agent),你会发现一切变得特别好理解

内容大纲
  • 什么是上下文工程(及其类型)
  • 为什么上下文工程很重要(长上下文引发的问题)
  • 如何优化上下文工程(四大策略和六项技术)

什么是上下文工程

在工作中,我们可能常抱怨“需求不清晰”,比如老板提出了一个抽象想法,或者是同事写的文档又臭又长,让人无从下手。同理,你需要输入完整、清晰且结构化的相关准确信息,大模型才能把活干好。

Context engineering is building dynamic systems to provide the right information and tools in the right format such that the LLM can plausibly accomplish the task. @LangChain

翻译版:上下文工程指构建动态系统,以合适的格式提供必要信息与工具,使 LLM 能够合理完成任务。

人话版:由于上下文窗口容量是有限的(就像你也记不住很多东西一样),上下文工程的核心任务,就是决定在 LLM 运行的每一步中,哪些信息需要被加载到上下文窗口中。

LLM 所需的信息可分为三类:

  1. 指令(Instructions):
  • 系统提示和用户请求
  • 记忆(跨多个会话保留的用户偏好或历史交互信息)
  • 少量示例(提供输入输出样例以引导模型行为)
  • 工具描述(解释可用工具的功能和参数)
  1. 知识(Knowledge):通过 RAG 等技术检索到的事实、文档和代码等
  2. 工具(Tools):包括调用记录、工具反馈(如API返回结果或错误信息)等

浅浅总结一下,

优秀的上下文 =

给模型的提示词/指令

  • 检索得到的文档/数据

  • 过程中产生的数据(历史状态/工具调用记录/执行结果等)

  • 跨对话记忆(相关历史消息或事件)

  • 输出规范(需要什么格式的数据)

Q:和提示词工程(Prompt Engineering)的区别?

A:顾名思义,提示词工程专注于通过编写有效提示词来优化 LLM 的输出效果。上下文工程则是为 Agent 提供完整且结构化上下文的一系列策略,比如检索(在调用大模型前动态获取并插入相关信息),记忆管理(如生成对话摘要、记录用户偏好等)。

为什么上下文工程很重要

上下文工程对 Agent 非常关键,原因如下:

  1. 任务的复杂性与长期性: Agent 通常需要执行多步骤、长时间运行的任务,导致多轮交互中信息持续累积
  2. 工具的使用:Agent 可以调用工具与外部环境交互(如联网搜索),并需要保存工具返回的结果,信息进一步变多

Agent 需要正确信息来执行任务,而执行过程又会产生新信息,所有这些信息都会存在上下文窗口中。信息过多(即长上下文)可能导致以下问题:超出上下文窗口容量、增加成本与延迟,降低输出质量。

另外,Agent 需要记住的信息越多,出错的概率也会越大(是的谁不会犯错呢),所以如何管理上下文就变得很重要。

Q:什么是 Agent?和 LLM 的区别?

Agent 通过交替调用 LLM 和工具,根据工具的反馈(Observation)来决定下一步操作,循环迭代直到完成任务,通常用于处理长时间运行的复杂任务。Agent 是能调用工具的 LLM。

长上下文的问题(Context Rot)

在《How Long Contexts Fail》一文中,Drew Breunig 指出了长上下文可能导致的问题:

  • 上下文污染(Context Poisoning):幻觉或错误信息进入上下文后被反复引用,导致模型输出错误内容

  • 上下文干扰(Context Distraction):上下文过多时,模型过度关注某些信息而忽略当前任务

  • 上下文混淆(Context Confusion):不相关的上下文内容影响输出质量,因为模型倾向于使用所有可用信息

  • 上下文冲突(Context Clash):累积的上下文中存在相互矛盾的信息,从而削弱模型的推理能力

我们可以用一个小剧场来理解以上问题:

假设你是一个项目经理,正负责写一份复杂的行业研究报告。你的办公桌(上下文窗口)就是工作区,桌子的容量固定且有限(临时工作记忆),且你只能从桌上的文件查找需要的信息。

每完成一个分析步骤,你的助手们(工具调用)都会将完整未压缩的反馈报告(调用结果)堆放在你的桌上。由于空间有限,报告迅速堆满,导致无法放新文件,任务陷入停滞——内存限制。

桌上堆满冗长且不重要的原始数据,你的注意力被大量细节分散,难以从中提取关键信息并聚焦下一步要完成的任务,导致效率低下——上下文干扰。

除了必要的报告外,桌上还有数百份功能相似的工具说明书,这些不相关的文件让你难以选择正确的工具或行动——上下文混淆。

其中两位助手提交了关于同一主题但结论矛盾的报告,导致你在确定最终结论时感到困惑——上下文冲突。

项目初期,你在核心项目计划书(上下文历史)中误写了一个错误数据。由于这份计划书一直放在你的桌上,并被反复参考,这个错误的前提“污染”了后续所有分析,导致项目偏离正轨——上下文污染。

下一篇会继续分享如何优化上下文工程,欢迎留言讨论!

想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享

👇👇扫码免费领取全部内容👇👇

一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI

1. 100+本大模型方向电子书

2. 26 份行业研究报告:覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:

  • 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
  • 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
  • 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
  • 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT:听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:

  • 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
  • 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
  • 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
  • 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!

1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析

2. 102 道 AI 大模型真题:直击大模型核心考点

针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:

3. 97 道 LLMs 真题:聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:


三、路线必明: AI 大模型学习路线图,1 张图理清核心内容

刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!

路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段:攻坚篇丨RAG开发实战工坊

L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段:跃迁篇丨Agent智能体架构设计

L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。

L4阶段:精进篇丨模型微调与私有化部署

L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。

L5阶段:专题集丨特训篇 【录播课】


四、资料领取:全套内容免费抱走,学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/20 11:37:04

FaceFusion在广告创意中的应用案例分享

FaceFusion在广告创意中的应用案例分享 你有没有刷到过这样的短视频:一个普通用户的脸,自然地“嵌入”到某大牌口红广告中,她对着镜头微笑、眨眼、说话,仿佛真的成了品牌代言人?这类内容近年来在抖音、小红书等平台频繁…

作者头像 李华
网站建设 2026/6/20 8:25:11

视频创作者必备:FaceFusion开源镜像带来极致人脸融合体验

视频创作者必备:FaceFusion开源镜像带来极致人脸融合体验 在短视频、虚拟偶像和AI内容创作席卷全球的今天,一个普通创作者是否还能仅靠剪辑软件脱颖而出?答案或许是否定的。越来越多的内容制作者开始转向更高级的视觉技术——尤其是高保真的人…

作者头像 李华
网站建设 2026/6/20 17:36:58

如何用最少Token完成最大规模的FaceFusion批量处理任务?

如何用最少Token完成最大规模的FaceFusion批量处理任务? 在视频内容爆发式增长的今天,AI换脸已从实验室走向工业化生产。影视后期、虚拟主播、社交娱乐等场景对高质量人脸替换的需求激增,而云服务按计算资源计费的模式,使得“每帧…

作者头像 李华
网站建设 2026/6/19 16:49:05

Node.js body-parser全面解析:让HTTP请求数据处理变得简单高效

Node.js body-parser全面解析:让HTTP请求数据处理变得简单高效 【免费下载链接】body-parser Node.js body parsing middleware 项目地址: https://gitcode.com/gh_mirrors/bo/body-parser 在现代Web开发中,处理HTTP请求数据是每个Node.js开发者必…

作者头像 李华
网站建设 2026/6/20 14:36:55

5个MySQL WITH AS在企业中的实际应用场景

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个MySQL实战案例展示系统,包含5个使用WITH AS的业务场景:1) 月度销售报表生成(递归计算环比);2) 用户访问路径分析;3) 商品关联…

作者头像 李华
网站建设 2026/6/15 15:27:44

yazi终端文件管理器终极指南:快速上手指南

💥 还在为终端文件管理效率低下而烦恼吗?yazi这款基于Rust的极速终端文件管理器将彻底改变你的工作流!它采用非阻塞异步I/O架构,让文件操作快到飞起~本文将带你从核心亮点到实战配置,轻松掌握这款神器&…

作者头像 李华