
LLM、Agent、MCP、Tool、Skills 分别是什么一文看懂大模型、智能体与工具调用的区别很多人刚接触 AI 应用时最容易混淆几个词LLM、Skills、Tool、Agent、MCP。它们经常一起出现但其实并不是同一层的东西。如果只用一句话来概括LLM是“大脑”Tool是“手和脚”Skills是“经验和方法”Agent是“会自己拆解任务并行动的执行者”MCP是“让模型安全接工具的标准接口”这篇文章尽量用概念化、非技术门槛太高的方式把它们讲清楚。1. LLM 是什么LLM全称是Large Language Model中文通常叫“大语言模型”。它的核心能力是基于海量数据训练后具备理解自然语言生成自然语言做总结、改写、翻译、问答一定程度上的推理、规划、代码生成你可以把它理解成一个“会读、会写、会思考语言问题的大脑”。但是要注意LLM本身通常只有“认知能力”并不天然拥有访问你本地文件的能力调用数据库的能力打开浏览器点击页面的能力下单、发邮件、操作系统的能力也就是说LLM很聪明但如果不给它外部连接能力它就更像“只会说和想”的大脑。常见的 LLM 例子GPT系列OpenAI 的代表性大模型ClaudeAnthropic 的大模型GeminiGoogle 的大模型LlamaMeta 开源模型系列Qwen通义千问阿里推出的大模型DeepSeek国内外都很受关注的大模型MiniMaxMiniMax 提供的模型能力也属于 LLM 范畴豆包大模型字节跳动相关模型能力这里容易混淆的一点像ChatGPT这样的产品严格说并不只是LLM它是“基于 LLM 构建出来的 AI 应用”。但因为ChatGPT背后主要依赖 GPT 模型所以很多人也会顺口把它当成 LLM 的代表产品。2. Tool 是什么Tool就是“工具”。如果说LLM是大脑那么Tool就是大脑可以调用的外部能力。它让模型不只是“会说”而是“真的能做事”。比如一个模型接上工具后可以查询天气搜索网页读取本地文件执行代码访问数据库调用企业内部 API控制浏览器Tool 的本质Tool的本质不是“模型本身的能力”而是“模型可以调用的外部函数或服务”。所以你可以把它理解成LLM负责判断“什么时候该用工具”Tool负责真正执行动作执行结果再回给LLMLLM再整理成用户看得懂的答案常见的 Tool 例子搜索工具Google Search、Bing Search、SerpAPI浏览器工具Playwright、Browser Use、Chrome DevTools 相关能力代码执行工具Python REPL、Node.js REPL、Code Interpreter数据库工具MySQL 查询接口、PostgreSQL 查询接口办公工具发邮件 API、飞书/钉钉机器人、日历接口地图工具高德地图 API、Google Maps API支付/业务工具订单查询 API、CRM 接口、ERP 接口面向普通用户的产品里也有 Tool 的影子ChatGPT的联网搜索、文件分析、代码执行本质上都可以看作工具能力很多 AI 编程助手里的“读文件”“跑测试”“改代码”本质也是工具调用3. Skills 是什么Skills可以理解成“技能包”或者“能力模板”。它不是模型本身也不是单个工具而是一套被整理好的做事方法。通常会包含什么时候做这件事按什么步骤做优先使用哪些工具输出格式长什么样遇到异常怎么处理如果说LLM是大脑Tool是手脚那么Skills更像是“做某类任务的经验手册”。Skills 解决的是什么问题模型虽然聪明但如果没有约束和流程很容易每次做法都不一样输出风格不稳定工具选择不稳定明明有现成方法却重复摸索而Skills的作用就是把“会做某件事”沉淀成可复用的标准动作。常见的 Skills 例子写代码修 Bug 的技能生成周报的技能文档润色技能代码 Review 技能数据分析技能生成 PPT 的技能创建插件的技能在一些 AI Agent 平台里Skills可能体现为预设 Prompt工作流模板任务 SOP插件化能力包所以Skills更像“经验层”不是最底层能力但非常重要。4. Agent 是什么Agent通常翻译为“智能体”。它不是单纯一个模型而是“模型 记忆 规划 工具调用 执行动作”的组合体。一个Agent往往具备这些特征能理解目标能把大任务拆成小步骤能根据情况选择工具能执行后观察结果能根据结果继续下一步有时还能保存上下文和长期记忆为什么 Agent 比普通聊天更进一步普通聊天更像你问一句模型答一句而Agent更像你给它一个目标它自己思考怎么完成中间调用多个工具必要时多轮执行最后把结果交付给你Agent 的典型例子AI 编程 Agent能读项目、改代码、跑测试、修错误客服 Agent能查询订单、查物流、处理售后流程办公 Agent能整理会议纪要、发邮件、安排日程数据 Agent能拉取数据、分析、出图、写结论常见产品例子ChatGPT在接入工具、记忆、任务执行能力后可以表现出 Agent 特征OpenAI Codex / Codex 类编程助手偏编程 AgentClaude配合工具后也可作为 Agent 使用扣子Coze偏 Agent 搭建平台Dify支持工作流和 Agent 形态AutoGPT早期很典型的 Agent 项目CrewAI多 Agent 协作框架LangGraph适合构建更可控的 Agent 流程所以Agent重点不在“模型多强”而在“它能不能围绕目标自己完成事情”。5. MCP 是什么MCP全称是Model Context Protocol。它可以理解成一种“让大模型安全、标准化连接外部能力”的协议。一句话解释MCP想做的事是把原本五花八门的工具接入方式变成统一规范。也就是说过去不同工具、不同平台、不同服务接法都不一样有了MCP之后模型和工具之间可以按照统一协议通信。MCP 主要解决什么问题它主要解决三个问题工具怎么被发现工具怎么被调用上下文和资源怎么被安全传递这带来的好处是工具接入更标准Agent 框架更容易复用不同工具不同客户端和服务端更容易协作权限边界更清晰你可以把 MCP 理解成什么如果Tool是一个个具体工具那MCP更像“工具连接的插座标准”。它不是某一个工具而是一种协议一套通信规范一种模型接外部世界的标准化方式MCP 相关例子文件系统 MCP ServerGitHub MCP Server数据库 MCP Server文档检索 MCP Server企业内部业务系统 MCP Server这些都不是“模型”而是“按 MCP 规范暴露能力的服务端”。6. 五者之间到底是什么关系最容易理解的方式是看它们所处的层级关系图决定何时调用约束执行方式返回执行结果用户目标 / 用户问题Agent负责理解目标、拆解任务、组织执行LLM负责理解、推理、生成Skills提供做事方法、流程模板、经验规则Tools提供搜索、执行代码、读文件、访问系统等能力MCP提供模型与外部能力之间的标准化连接协议最终结果 / 可交付内容你也可以把这张图直接理解成一句话用户给 Agent 一个目标Agent 调用 LLM 来思考参考 Skills 来决定怎么做再通过 Tool 去真正执行而 MCP 负责把这些外部能力用统一标准接进来。第一层LLM负责理解、推理、生成内容。它是整个系统的大脑。第二层Tool负责提供实际动作能力。比如查资料、执行代码、访问系统。第三层Skills负责沉淀某类任务的最佳实践。它告诉模型“这类事通常怎么做更稳”。第四层Agent负责把LLM Tool Skills组织起来围绕目标持续执行。它是“会做事的 AI 执行体”。第五层MCP负责让模型和外部能力之间有统一标准接口。它更像“连接规范层”。7. 用一个现实类比彻底理解假设你要开一家智能餐厅LLM像大脑和语言中枢负责理解客人要什么Tool像厨房设备、收银机、电话、外卖系统Skills像店长培训手册告诉员工怎么接待、怎么出餐、怎么处理投诉Agent像真正上岗的店长能自己安排流程、调用资源、完成目标MCP像所有设备统一遵守的接口标准让不同机器可以顺畅协同这个类比下几者就非常清楚了没有LLM系统不会思考没有Tool系统不会行动没有Skills系统做事不稳定没有Agent系统不会主动完成复杂任务没有MCP系统接各种工具会很混乱8. 常见产品分别属于哪一类下面用一个表快速对照常见产品到底更偏哪一类。产品/平台更偏向哪一类说明ChatGPTAI 应用 / Agent 入口 / 基于 LLM背后是 GPT 模型前台是产品形态不只是单纯 LLMGPT 系列LLM典型大语言模型ClaudeLLM / AI 应用既可指底层模型也可指其产品入口GeminiLLM / AI 应用同时是模型系列和产品入口MiniMaxLLM 平台提供模型能力核心归类是大模型能力提供方DeepSeekLLM典型国产大模型代表通义千问 QwenLLM阿里系大模型豆包AI 应用 / 基于 LLM面向用户的产品背后依赖模型能力CopilotAI 应用 / Agent 化助手本质是基于模型构建的编程助手DifyAgent / 工作流平台用来搭建 AI 应用、工作流和 AgentCoze扣子Agent 平台偏向搭建 Bot 与 AgentLangChainAgent 开发框架帮你组织模型、提示词、工具LangGraphAgent 工作流框架更适合复杂流程和状态控制AutoGPTAgent 项目典型早期自治型 Agent 代表PlaywrightTool浏览器自动化工具Python REPLTool代码执行工具搜索 APITool信息检索工具GitHub MCP ServerMCP 服务按 MCP 协议提供 GitHub 能力文件系统 MCP ServerMCP 服务按 MCP 协议提供文件访问能力9. 一个最容易记住的判断方法如果你还会混可以直接用这几句话判断它主要负责“思考和生成”吗是的话多半是LLM它主要负责“执行某个动作”吗是的话多半是Tool它主要负责“沉淀某类任务的做法”吗是的话多半是Skills它主要负责“围绕目标自主完成任务”吗是的话多半是Agent它主要负责“标准化连接模型和工具”吗是的话多半是MCP10. 总结最后用一句更完整的话收尾一个现代 AI 应用通常不是只有一个LLM而是由LLM负责思考Tool负责执行Skills负责方法沉淀Agent负责任务编排MCP负责统一接入标准共同组成的完整系统。如果你是刚入门最推荐的理解顺序是先理解LLM是大脑再理解Tool是外部能力然后理解Agent是会调用工具完成目标的执行者再补上Skills是经验模板最后理解MCP是标准化连接协议这样会非常清晰。11. 一段适合放在文章结尾的话过去大家讨论 AI更多是在讨论“模型强不强”但现在真正决定 AI 应用上限的往往不只是模型本身而是模型 工具 工作流 协议的整体协同能力。也就是说未来比拼的不只是“谁的 LLM 更强”更是“谁能把 LLM、Tool、Skills、Agent、MCP 这几层真正组合起来做成稳定可用的系统”。如果你理解了这几个词之间的关系基本就能看懂当下大多数 AI 产品和 Agent 平台在做什么了。