oracle数据库做的网站,做网站怎么租个域名,聊城网站建设设计实力公司,法律行业网站建设文章全面分析了AI Agent技术的发展现状与未来趋势#xff0c;详细介绍了Agent的定义、能力水平划分(L0-L5)、模态分类和应用场景。深入探讨了Agent的核心架构、设计模式和规划模块#xff0c;并构建了完整的评测体系。最后对多个开源Agent项目进行了专业评测#xff0c;包括…文章全面分析了AI Agent技术的发展现状与未来趋势详细介绍了Agent的定义、能力水平划分(L0-L5)、模态分类和应用场景。深入探讨了Agent的核心架构、设计模式和规划模块并构建了完整的评测体系。最后对多个开源Agent项目进行了专业评测包括Dify、MetaGPT等并对Agent的未来范式如Generative Agents进行了展望。文章为开发者提供了从理论到实践的完整Agent技术指南。Agent的发展在25年大概是巅峰赛季了层出不穷agent的定义不断地被横向或者纵向的扩展总之范式不断地被颠覆。这是一篇过期的文章…关于范式的定义、开源的评测、未来的探索…针对Agent的探索以及开源项目进行了深度的分析并综合给出了个人层面对于Agent的进化历程。相关重点PaperUnderstanding the planning of LLM agents: A survey(https://arxiv.org/pdf/2402.02716)HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging Facehttps://arxiv.org/pdf/2303.17580、https://github.com/microsoft/JARVISWhy Do Multi-Agent LLM Systems Fail?https://arxiv.org/abs/2503.13657API Agents vs. GUI Agents: Divergence and Convergencehttps://arxiv.org/pdf/2503.11069从多个维度如模态、可靠性、效率、可用性、灵活性、安全性、可维护性、透明度和类人交互对API代理和GUI代理进行了全面评估A Survey on (M)LLM-Based GUI Agentshttps://arxiv.org/pdf/2504.13865GUI Agent的综述Agent范式阐述Autonomous agents 又被称为智能体Agent。能够通过感知周围环境、进行规划以及执行动作来完成既定任务。这个图大概是对Agent阐述最多的了。作为一个经典的Agent框架图也是最基础的明确说明了现在Agent所涉及的模块以及模块涉及的技术点但随着国内技术的一日千里描述也稍有欠缺了。AI Agent的能力水平划分L0-没有人工智能仅有基本的工具能实现感知和行为能力L1-规则符号智能基于规则的 AI包含早期NLP的任务规则L2-推理决策智能基于互动学习(IL)/强化学习(RL)的 AI并增添推理和决策能力典型的就是Dify、manus为代表的流程编排L3-记忆反思智能基于LLM的 AI 替换互动学习/强化学习的方式并增加记忆Memory自我反思reflectionL4-自主学习智能在 L3的基础上加强自我学习泛化的能力L5-个性群体智能在 L4的基础上增加了个性情感性格和协作行为MultiAgentAgent模态上划分基于语言的智能体**基于视觉的智能体**SpiritSight视觉-语言混合智能体MobileFlow推荐paper:- AppAgentXEvolving GUI Agents as Proficient Smartphone UsersMobileFlowA Multimodal LLM for Mobile GUI Agent移动设备专用OS AgentsA Survey on MLLM-based Agents for General Computing Devices UseSpiritSight AgentAdvanced GUI Agent with One Look.Levels of AI Agents: from Rules to Large Language ModelsAgent按照应用场景划分OS AgentsGUI AgentsComputer-Using Agent, CUA下图作为当前大部分Agent的核心架构其实完全足够了大家基本是在其基础上对模块进行补充扩展。源自Executable Code Actions Elicit Better LLM Agentshttps://arxiv.org/pdf/2402.01030源自Character-LLM: A Trainable Agent for Role-Playinghttps://aclanthology.org/2023.emnlp-main.814v2.pdf下面的五种Agent模式能非常准确的反应当前Agent的演变路线反射模式Reflection patternReflection是指Agent能够对自己的行为和决策进行推理和分析的能力工具使用模式Tool use pattern查询矢量数据库、执行 Python 脚本、调用 API 等利用外部工具和资源来提升自己的决策和执行能力。ReActReason and Act 模式ReAct 结合了上述两种模式Agent 可以反映生成的输出。它可以使用工具与世界交互。Agent根据环境的变化做出反应。这种设计范式涉及到Agent如何根据环境的变化来调整自己的决策和行为。Planning pattern规划模式规划是Agent AI 的一个关键设计模式我们使用大型语言模型自主决定执行哪些步骤来完成更大的任务。Multi-agent pattern多智能体模式常见的Agent包括Manus、Deep Research大部分都是LLMWrapper(Prompt、Function CallMCP、A2A等)。此时此刻对于Agent到底是个什么Agent核心Plan模块核心思想任务分解 反思和提炼Understanding the planning of LLM agents: A survey任务分解Task Decomposition分治思想。分解优先Decomposition-First先分解再计划如HuggingGPT、Plan-and-Solve、ProgPrompt交错分解Interleaved:一边分解任务一边制定计划如ReAct、COT、POT多计划选择Multi-Plan Selection投票思想。给智能体一个“选择轮”生成多个计划然后选择最优计划来执行。多计划生成利用LLM在解码过程中的不确定性比如通过温度采样或top-k采样获得多个不同推理路径。最优选择启发式搜索算法, 比如 简单的多数投票策略或者利用树结构来辅助多计划搜索如Self-consistency投票的方式Tree-of-Thought(ToT)**树搜索BFS/DFS**算法使用LLM评估多个动作并选择最优动作Graph-of-Thought(GoT)同ToTLLM-MCTS 和 RAP树结构辅助多规划搜索但采用MCTS算法进行搜索推荐paper:- Chain-of-Thought Prompting Elicits Reasoning in Large Language Modelshttps://arxiv.org/abs/2201.11903thought_prompt f 角色名称{self.name} 初始记忆{self.seed_memory} 当前心情{self.mood} 任务根据角色当前的相关记忆相关知识,对话上下文进行分析基于角色第一视角进行思考给出角色的心理反应对和相关事件的判断。 字数限制不超过100字。 相关记忆“{memory[description]}” 相关知识“{knowledge_text}” 对话上下文 {self.language_style} {context} 请仅返回{self.name}第一人称视角下的思考内容不要添加额外信息或格式。 response_prompt f 角色名称{self.name} 初始记忆{self.seed_memory} 当前心情{self.fsm.mood} 任务基于角色的思考内容和对话上下文进行回复。 字数限制不超过100字。 思考内容“{thought}” 对话上下文 {self.language_style} {context} 请在思考内容和对话上下文的基础上以{self.name}的身份回复。不要扮演其他角色或添加额外信息不要添加其他格式。 辅助规划External Planner-Aided Planning借助外部规划器**在旁边出谋划策**在特定场景约束下LLM能力不足如高P场景、数学推导等辅助规划的思想主要是在对LLM本身比如通过强化学习或模仿学习技术训练的深度模型针对特定领域展现出有效的规划能力或者借助外部Model来进行辅助补丁。反思细化Reflection and Refinemen执行计划过程中能够停下来反思然后改进计划。LLM 规划过程中可能会产生幻觉**或因为理解不足而陷入“思维循环”反馈和改进是规划过程中不可或缺的组成部分增强了LLM Agent 规划的容错能力和错误纠正能力。**思想生成、反馈和改进如Self-refine利用迭代过程包括生成、反馈和精炼Reflexion扩展ReAct方法通过引入评估器来评估轨迹CRITIC使用外部工具如知识库和搜索引擎**验证LLM生成的动作**InteRecAgentReChain的自我纠正机制LEMA收集错误的规划样本然后使用更强大的GPT-4进行纠正推荐paper:- Self-Refine: Iterative Refinement with Self-Feedback- CRITIC: Large Language Models Can Self-Correct with Tool-Interactive Critiquing记忆增强Memory-Augmented Planning使用过去经验为将来规划提供帮助。通过记忆来增强 LLM-Agents 规划能力的方法:RAG记忆和参数记忆如Generative Agents以文本形式存储类似于人类的日常经验并根据当前情况的相关性和新鲜度来检索记忆。MemoryBank、TiM和RecMind记忆编码成向量并使用索引结构如FAISS库来组织这些向量。MemGPT:借鉴了计算机架构中的多级存储概念将LLM 上下文视为RAM并将额外的存储结构视为磁盘。REMEMBER将历史记忆以Q值表的形式存储每个记录是一个包含环境、任务、动作和Q值的元组Agent的评测体系推荐paper:Survey on Evaluation of LLM-based Agentshttps://arxiv.org/pdf/2503.16416评测主要来自paper有一定的参考意义。智能体评测CUP的上层体系Capacity: 有什么样的力。能做什么Under standing: 深度理解能力。能听懂么Performance: 性能评估。智能体做得怎么样LLM Agent 利用大语言模型的强大理解与推理能力结合外部工具如数据库查询、代码执行、网页访问实现多轮交互、长期记忆与自主规划能够主动解决复杂、多步骤的现实问题。Agent当前处于一个蓬勃探索期随着LLM本身能力跃迁式的变化评测体系也在不断地演变但万变不离其宗可靠性、安全性、效率等始终是其核心确保在实际应用中可靠有效Agent 在真实场景下会碰到大量意外情况或长尾需求必须用严格的测试来检验其鲁棒性。指导下一步研发和迭代良好的评测可以帮研发者发现 Agent 的「短板」和错误模式从而持续改进。安全与合规随着 Agent 能调用外部工具甚至有权限访问企业数据库如果无法正确评测安全性就会产生较大的潜在风险。成本与效率评测还应包含成本、效率等以免 Agent 可以完成任务但不切实际或代价过高。主要有以下四大维度智能体的基础能力Agent Capabilities规划与多步推理Planning Reasoning评测集数学推理【GSM8K小学数学、MATH高等数学、AQUA-RAT选择题推理】、多跳问答【HotpotQA、StrategyQA】、科学推理【ARC】、逻辑推理【FOLIO】、日常任务【MUSR】。评测要点任务分解、状态追踪、自我纠错、因果推断评测BenchToolEmu【测试 Agent 在出错后能否调整】、PlanBench【发现 Agent 在长期规划上的短板】、NaturalPlan【用自然语言描述真实世界任务】工具调用与函数使用Tool Use评测要点意图识别、工具选择、参数匹配、执行工具调用、结果整合评测BenchToolBench、APIBench、BFCL【是否会调用给定的 API、调用参数是否正确】、ToolSandbox、NESTFUL【涉及多轮对话、多步嵌套调用场景更加贴近真实复杂需求】自我反思与自我纠错Self-Reflection评测要点感知新信息、信息更新、决策调整评测思路单步校验、多轮反馈评测BenchLLFBench【围绕自反性进行基准构建测试 Agent 在多回合得到外部反馈时的能力】、ReflectionBench【从认知科学的角度试图把「新信息识别、记忆复用、惊讶时的 belief 更新、决策调整」等拆解构建更精细化的评测】长期记忆Memory评测方法长文本阅读场景、多回合信息集成、动作 - 状态跟踪特定应用领域的智能体Application-Specific Agents网页智能体Web Agents评测思路能否正确理解网页结构、多步网页操作、安全性与合规评测Bench**MiniWoB、WebShop、**WebArena / Visual-WebArena【更逼真的在线购物或网页浏览环境并包含动态变化】、AssistantBench【测试 Agent 在跨网站、多步长任务下的效率】软件开发智能体Software Engineering Agents评测BenchHumanEval、MBPP【考察函数实现正确率】、SWE-bench【从真实开源项目的 issue 切片而来提供更复杂多文件、多步骤的问题】、AgentBench【让 Agent 跟真实的开发环境或模拟环境进行多次交互评测其多轮对话、工具调用、调试等能力】科学研究智能体Scientific Agents评测方法科学知识回忆与推理、文献理解与摘要、实验设计与执行、代码生成与结果复现对话式智能体Conversational Agents评测BenchABCD、MultiWOZ、**SMCalFlow【**基于人工众包数据涵盖了多种对话场景和功能调用】、**ALMITA【自动生成各种客户服务对话路径然后测试 Agent 对不同对话走向的应对能力】、\tau-Bench【**人工构建了航空、零售两大典型行业场景用模拟用户和真实数据库来考评 Agent 执行任务的正确率】、IntellAgent通用型智能体Generalist Agents综合多项能力适用于多种复杂环境开发与评测工具框架Evaluation Frameworks各类辅助开发者持续评测智能体性能的工具与平台Agent 开发的过程中对每一次推理调用做记录监控日志和输出然后自动或人工来标注对错、分析错误原因通常叫 Observability 或 Monitoring。多粒度的评测最终输出 (Final Response) 评测 Agent出的最后答案是否满足需求可使用人工或 LLM 批改逐步动作 (Stepwise) 评测针对 Agent 每一步对话、调用、工具执行都做结果验证能更准确定位问题完整执行轨迹 (Trajectory) 评测分析 Agent 从头到尾的动作序列是否合理高级一点还能做与「最优路径」对比。数据管理与标注A/B 测试可视化与比较目前代表性的平台有 LangSmith、Langfuse、Google Vertex AI evaluation service、Arize AI、Galileo Agentic Evaluation、Patronus AI、Databricks Mosaic AI Agent Evaluation 等。Agent的未来范式探索Generative Agents: Interactive Simulacra of Human Behavior斯坦福25个AI智能体「小镇」25个AI智能体不仅能在这里上班、闲聊、social、交友甚至还能谈恋爱而且每个Agent都有自己的个性和背景故事。Paperhttps://arxiv.org/pdf/2304.03442GitHubhttps://github.com/joonspk-research/generative_agentshttps://twitter.com/drjimfan/status/1689315683958652928架构:记忆流Memory Stream: 长期记忆模块以自然语言记录虚拟人个人经历的总列表。思考Reflection: 将记忆综合成具有时间序列的高级推理使得虚拟人能够对自身和他人做出总结以便很好地操控自身行为。规划Plan: 结论和当前环境转化为高级行动规划然后递归地转化为详细的行为和反应。GRUtopia: Dream General Robots in a City at Scale上海人工智能实验室 OpenRobotLab 等机构的一批研究者也打造了一个虚拟小镇。https://arxiv.org/pdf/2407.10943https://arxiv.org/pdf/2503.06580行业最流行的一句话模型即服务受限统一一下口径现阶段的开源Agent项目还是集中在流程编排智能体这个阶段即L2具体架构如下典型的当前Agent架构非常典型的应用模式流程编排式替换上一个时期的重复性功能的能力重点聚焦于单点能力。在对话场景开源Agent项目评测短短一年社区开源的agent项目如同雨后春笋感叹开源大佬们精力旺盛开源项目实在是太优秀了…而且是乱花渐欲迷人眼不知何从选择从个人维度来说方便自身快速部署、修改、使用重要的点开源关注度当然支持度是多多益善代表的就是大家的认可度但是关注度 认可度 ! 好产品行业的竞争其实导致了很多的重复性产品个人认为同质性产品差异不大最后有没有胜出者就犹未可知了ToB的应用并没有太大门槛自建成本也不是很高语言特性前端、后端、算法比如前端vue、JS、ST如今的agent产品主打一个可拖拽LLM的统一导致并没有太多的算法成分唯一一个比较重的大概就是RAG了存在一定的定制化未来大概就是一个tool工具的存在。能力范围项目是为了解决什么样的问题流程编排、RAG、agent等支持的能力怎么样阅读理解、问答、检索。注个人工作范畴算法应用所以主要语言是python以上仅为个人比较浅显的理解推断非喜勿喷开源ProjectStarsLanguage项目简介能力初评 (带*表示重点评估)推荐指数 (颜色表示)*Dify96.3kTS:56.4% PY:30.5%(算法) JS:8%Workflow流程编排目前最完备的流程编排工具(不依赖langchainllama_index)★★★★★langflow59.7kPY:42.2%(算法) JS: 29.7% TS: 27.2%Workflow 对话编排工具对话流程设计工具★★Flowise36.8kJS: 37.6% TS: 62%Workflow流程编排流程agent设计工具★★FastGPT24kPY:41.8%(算法) JS: 29.7% TS: 27.2%Workflow流程编排RPA的架构思想 NextJs TS ChakraUI MongoDB PostgreSQL (PG Vector 插件)/Milvus★MaxKB16.5kPY:53.2%(算法) vue: 33.1% TS: 12.4%RAG Workflow流程编排基于LangChain架构构建★ragflow51.7kPY:46.1% TS: 51%Agent Workflow流程编排文档RAG编排问答引擎★★★*OpenHands54kPY:78.6% TS: 17.4%Code assistant代码助手支持代码修改、命令行、访问网页★★★★*MetaGPT55.4kPY:97.5%纯Agent架构逼近真正的Agent架构★★★★★Graphrag25kPY:95.7%RAG架构图谱问答top one★★★★anything-llm43.8kJS: 97.6%RAG架构标准JS的RAG感觉对于算法定制不太友好前端颜值好看★*quivr37.6kPY:99.3%RAG架构具备记忆能力的对话问答brain支持File问答★★★★*Langchain-Chatchat34.5kPY:25.3% TS:65.9%RAG架构标准的Langchain的问答★*LightRAG13.3kPY:76.1% TS23.3%RAG架构标准RAG: 仅支持keyword、emb、graph三种检索非llama_index★★★注①、带*号的表示有深度评估②、本人技术栈偏向于PY,评测会具有PY倾向③、注意不同颜色表示不同领域评测仅对同领域内进行对比推荐附件参考截图来源于github评估比较浅显对于应用落地价值不是很大但可以供参考Code:https://github.com/All-Hands-AI/OpenHandshttps://github.com/Mintplex-Labs/anything-llmhttps://github.com/QuivrHQ/quivrhttps://github.com/chatchat-space/Langchain-Chatchathttps://github.com/microsoft/graphraghttps://github.com/FlowiseAI/Flowisehttps://github.com/lFahttps://github.com/infiniflow/ragflowhttps://github.com/HKUDS/LightRAGhttps://github.com/microsoft/graphraghttps://github.com/2noise/ChatTTSDify深度评测Code: https://github.com/langgenius/dify项目特性1. Workflow: 可视化可拖拽式构建工作流.Comprehensive model support: 开源LLM API接入覆盖GPT, Mistral, Llama3, and any OpenAI 等对于国内本地LLM支持度也不错.Prompt IDE: 具备直观的ui用于chat、prompt配置等.RAG Pipeline: 完善的RAG能力支持从文档解析、处理、chunk等操作.5. Agent capabilities: 支持自定义tool、Function Calling、ReAct、或者开源built-in toolsGoogle Search, DALL·E, Stable Diffusion and WolframAlpha等.6. LLMOps: 日志监控分析系统的闭环反馈.7. Backend-as-a-Service: 支持产品独立部署拆分适用于业务.Dify能力简述对应用场景抽象拆分至独立子任务借助万能的LLM映射至抽取参数提取、分类控制流转、生成自适应响应算法任务维度基于可视化的work flow进行拖拽式的流程编排。对于三类算法任务LLM基本能够完全覆盖兼顾到准确率和效率核心RAG组件参考部署方案https://blog.csdn.net/u013563715/article/details/136764707https://zhuanlan.zhihu.com/p/7851207343**个人评测1、对于模型的支持LLM\Embedding\Reranker\API\ollama支持是最完善2、RAG板块所有开源项目中最好的代码结构、向量数据库、数据流处理本人比较推荐3、RAG并非基于LLamaIndex实现: 在RAG的技术深度上个人认为有所欠缺同时由于整个代码耦合度很高改造比较困难依赖modelInstance和LB4、标准的工作流制造工具非Agent形态5、多模态的交互支持比较一般主要用于企业级的RPA-Agent构建很成熟接入第三方IM一般6、暂不支持MCP**langflow深度评测Code: https://github.com/langflow-ai/langflow项目特性1. Visual Builderto get started quickly and iterate.2. Access to Codeso developers can tweak any component using Python.3. Playgroundto immediately test and iterate on their flows with step-by-step control.4. Multi-agentorchestration and conversation management and retrieval.5. Deploy as an APIor export as JSON for Python apps.6. Observabilitywith LangSmith, LangFuse and other integrations.7. Enterprise-readysecurity and scalability.**个人评测1、LangFlow 是一个它专注于对话流程的可视化设计和管理直观的界面和工具可以帮助开发者设计和管理对话流程包括对话节点、条件逻辑和回复等。LangFlow 还支持多语言和多渠道的对话流程设计**4. 整体上和Fowise其实比较接近场景侧重点有所不同langflow只想干好对话所以基本不支持RAG。应用可参考下面的设计案例就是一个RAP的流程编排…****具体可参考https://docs.langflow.org/WorkFlow设计案例Document QA包含chat输入、Prompt、OpenApi、chat输出、文件加载等组件Memory chatbot对话机器人增加了chat memory组件支持历史信息的思考逻辑Math Agent flow数学agent在对话机器人的基础上新增tool calling agent、Python REPL tool、Calculator组件。Sequential tasks agent序列任务agent任务编排器针对具体场景定制,在对话机器人的基础上新增YFinancetool、Tavily AI Searchtool、Calculatortool 组件。Travel planning agent旅行agent在对话机器人的基础上新增tool calling agent、Python REPL tool、Calculator组件。Flowise深度评测项目特性Multi-Agents简单的来说就是 LLM FuncCalling基于supervisor进行选择agent进行跳转和任务执行Sequential Agents利用LLM的推理能力、FuncCalling能力、rag能力等根据具体小场景的预设流程进行自动跳转Flowise的整个后台能力支持多workspace管理对义变量设计支持images, audio, and other files的问答主要借助OpenAI LLM的能力…主要基于JSTS构建在工程设计上应该很多投入不在我的关注范围上太复杂个人评测项目基于LLM的语义理解能力聚焦解决简单的RPA工作就是agent的能力都包含但都不是那么有指向通用型的RAP agent 对话编排工具支简单RAG内存型用于支持agent问答中的文档内检索如paper问答语义理解和对话管理功能可以处理复杂的对话场景并支持多轮对话和上下文理解支持预训练的模型和工具可以加速对话系统的开发过程具体可参考https://docs.flowiseai.com/using-flowiseFastGPT深度评测Code: https://github.com/labring/FastGPTFastGPT通过 Flow 可视化进行工作流编排从而实现复杂的问答场景.评测结论1、整个后端基于TS构建py负责模型加载部分工作推荐阅读①、https://doc.tryfastgpt.ai/docs/intro/②、企业微信/飞书接入Laf FastGPT 把AI知识库装进企业微信 https://www.bilibili.com/video/BV1Tp4y1n72T/?spm_id_from333.999.0.0vd_source5526e4b54a23d0b2af7aca06ec8c6f36MetaGPT深度评测Code: https://github.com/geekan/MetaGPTMulti-Agent Framework:MetaGPT takes aone line requirementas input and outputsuser stories / competitive analysis / requirements / data structures / APIs / documents, etc.Internally, MetaGPT includesproduct managers / architects / project managers / engineers.It provides the entire process of asoftware company along with carefully orchestrated SOPs.智能体 大语言模型LLM 观察 思考 行动 记忆多智能体 智能体 环境 标准流程SOP 通信 经济能力介绍系统主要接口能力内部机制多Agent实例个人评测**1、依托GPT-4的能力构建助手支持发布为openai兼容的接口除ollama外但需要做改动不支持直接本地化部署调用**2、Agent/Multi-Agent架构依托LLM本身的语义理解能力进行多轮交互3、问答模式对于多模态场景的支持比较弱4、基本python实现整个架构比较清晰5、有点接近终极Agent架构非流程编排式的workflow, agent大脑设计模式狼人杀https://github.com/geekan/MetaGPT/tree/main/metagpt/environment/werewolf斯坦福小镇https://github.com/geekan/MetaGPT/tree/main/metagpt/environment/stanford_town安卓模拟器https://github.com/geekan/MetaGPT/tree/main/metagpt/environment/androidmaxKB深度评测CODE: https://github.com/1Panel-dev/MaxKB基于RAG pipeline构建的一个知识问答编排器重点是以RAG为核心构建利用LLM的prompt生成能力构建RPA的自动化助手。特性说明RAG pipeline: 说是支持文档的splitting向量化但是从源码上看其能力支持一般比如splitting、vector支持度都比较一般2.Agentic Workflow流程编排能力3.Seamless Integration…没啥用4.Model-Agnostic: …大家都有5.Multi Modal: support for input and output text, image, audio and video.个人评测1. 不支持自定义变量、FuncCalling能力比较受限2. RAG本身能力其实也不够深入Langchain-Chatchat深度评测code: https://github.com/chatchat-space/Langchain-Chatchat依托于 langchain 框架支持通过基于 FastAPI 提供的 API 调用服务或使用基于 Streamlit 的 WebUI进行操作。项目特性可使用 Xinference、Ollama 等框架接入 GLM-4-Chat、 Qwen2-Instruct、 Llama3 等模型2.主流的开源 LLM、 Embedding 模型与向量数据库可实现全部使用开源模型离线私有部署。从 0.3.0 版本起Langchain-Chatchat 不再根据用户输入的本地模型路径直接进行模型加载涉及到的模型种类包括 LLM、Embedding、Reranker 及后续会提供支持的多模态模型等均改为支持市面常见的各大模型推理框架接入如 Xinference、Ollama、LocalAI、FastChat、One API 等。个人评测**1、本质上还是一个对话RAG能力的实现2.基于标准的langchain插件实现标准版**anything-llm深度评测code: https://github.com/Mintplex-Labs/anything-llm全栈的RAG应用。项目特性支持MCP支持多模态问答集成了多用户权限管理标准RAG能力栈文档切片、向量化、LLM等官方表示在产品化上很强部署、云端、ui等支持TTS、ASR的接入个人评测简化版的流程编排Agent以JS为主要开发语言的同学可以重点研究一下向量数据库支持偏弱毕竟不是为国人开源的LightRAG深度评测code: https://github.com/HKUDS/LightRAG全栈的RAG应用。AI时代未来的就业机会在哪里答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具到自然语言处理、计算机视觉、多模态等核心领域技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。掌握大模型技能就是把握高薪未来。那么普通人如何抓住大模型风口AI技术的普及对个人能力提出了新的要求在AI时代持续学习和适应新技术变得尤为重要。无论是企业还是个人都需要不断更新知识体系提升与AI协作的能力以适应不断变化的工作环境。因此这里给大家整理了一份《2025最新大模型全套学习资源》包括2025最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题等带你从零基础入门到精通快速掌握大模型技术由于篇幅有限有需要的小伙伴可以扫码获取1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。5. 大模型行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。为什么大家都在学AI大模型随着AI技术的发展企业对人才的需求从“单一技术”转向 “AI行业”双背景。企业对人才的需求从“单一技术”转向 “AI行业”双背景。金融AI、制造AI、医疗AI等跨界岗位薪资涨幅达30%-50%。同时很多人面临优化裁员近期科技巨头英特尔裁员2万人传统岗位不断缩减因此转行AI势在必行这些资料有用吗这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。大模型全套学习资料已整理打包有需要的小伙伴可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】