【Agent Harness】从“提示词玩具”到“认知操作系统”:Gliding Horse 如何重新定义 AI Agent

发布时间:2026/6/30 3:42:31
【Agent Harness】从“提示词玩具”到“认知操作系统”:Gliding Horse 如何重新定义 AI Agent SEO 摘要本文深入解析 Gliding Horse流马——一款用 Rust 编写的 AI Agent 操作系统。与 Claude Code、Codex CLI、OpenClaw、Hermes 等传统 AI 编码工具不同Gliding Horse 采用 CPU 缓存式四层记忆、JSON‑LD 统一语义总线、硬约束质量门禁等创新架构将 LLM 视为 CPU为其配备完整的缓存、内存、文件系统、权限管理和进程调度。文章详细对比了主流 AI Agent 工具的核心差异并展示了 Gliding Horse 在动态 PDCA 编排、技能图谱与知识图谱桥接、上下文 Token 经济学等方面的七大亮点设计适合对 AI Agent 架构、Rust 系统编程、认知操作系统感兴趣的开发者阅读。关键词Gliding Horse流马AI Agent 操作系统Rust Agent 框架认知操作系统多 Agent 协作JSON‑LD 语义总线四层记忆架构PDCA 编排技能图谱知识图谱AI 编码工具对比Claude CodeCodex CLIOpenClawHermesAI 系统可靠性Token 经济学硬约束质量门禁从“提示词玩具”到“认知操作系统”Gliding Horse 如何重新定义 AI Agent几个月前我在做一个多 Agent 协作的软件工程实验时被市面上的 AI 编码工具折磨得够呛。Claude Code 聊了 20 轮忘了第 3 轮的约定Codex CLI 在多个任务间切换时状态全丢OpenClaw 的 Skill 管理一多就变成灾难……这些工具都很强但都像“聪明但散漫的实习生”——你需要时刻盯着关键事情还得自己把关。于是我决定自己动手。不是写一个 Prompt 模板或编排脚本而是从零构建一个 AI Agent 操作系统。它叫Gliding Horse流马全部用 Rust 写成内核级硬约束图数据库当大脑JSON‑LD 当语言。今天我就把它的核心设计扒开给你看以及它和 Claude Code、OpenAI Codex、OpenClaw、Hermes 这些当红工具的本质区别到底在哪。一、与市面上 Agent 的基因差异先把结论放在最前面Gliding Horse 与 Claude Code、Codex CLI、OpenClaw、Hermes 等工具不在同一个品类。维度Claude CodeCodex CLIOpenClawHermesGliding Horse定位编码助手Agent Runtime终端 AI Agent插件化 Agent 网关自进化个人 Agent 框架常驻消息平台跨会话Agent 操作系统语言TypeScriptPythonNode.ts6452 TSPython 3.11 主业务 Node.js 工具链/ElectronRust记忆会话文件 MEMORY.md 自动记忆 AutoDream 跨会话巩固会话内上下文 AGENTS.md 注入偏薄插件内部状态 ~/.openclaw本地SQLite FTS5 会话 策展 MD Honcho 可插拔 6 providerL0-L3 四层图记忆 MESI 一致性数据模型文本流 工具 JSON文本/JSONJSON WS-RPC SchemaJSON SQLite Markdown(Skill)JSON-LD 语义图 IRI 统一地址总线安全约束Prompt 软约束 Permission Mode HooksmacOS sandbox-exec TOML 审批 Prompt自托管 插件权限配置级凭据池轮换 保护目录 secret 扫描 按钮审批(fail-closed)系统调用门 ToolGuard 硬拦截 SHACL 契约多 AgentSubagent 隔离.claude/agents/ YAMLSubagent 隔离线程沙箱max_threads6Skills 间接派 SOUL.md 人格delegate_tool 委托 batch_runner 并行 cronSA 动态编排 L2 共享黑板 态势感知知识管理CLAUDE.md MEMORY.md skills被动AGENTS.md codex.mdSkills 插件73 官方52 内置自进化 Skill 闭环agentskills.io~/.hermes/skills/技能图谱 知识图谱 自进化 Batch Agent质量保障人工审查人工审查无无阶段门禁 自工程完结 根因引擎简单说Claude Code、Codex CLI 是“AI 编码工具”Gliding Horse 是“运行这些 AI 编码工具的操作系统”。前者负责聪明后者负责让聪明变得可靠。二、Gliding Horse 的核心架构Gliding Horse 的核心理念非常简单把 LLM 当成 CPU给它配上缓存、内存、文件系统、权限管理和进程调度。双核心引擎调度指令 / 上下文需求基础设施工具系统ToolExecutor / MCP 集成结果路由 / 微工具生成质量门禁SyscallGate 三层校验ToolGuard 拦截StageGate SHACL事件总线TypeMask 位图路由Agent 间通信知识沉淀技能图谱JSON‑LD 技能网络MOC 导航 / 渐进披露知识图谱实体 / 关系 / 代码AST知识-技能桥接实体 ↔ 技能关联后台整理 Agent (8个)技能合并 / 实体解析失败挖掘 / 记忆压缩记忆系统L2 黑板Oxigraph 内存图多 Agent 共享Agent 态势 资源锁L3 投影引擎SPARQL CONSTRUCT按需加载子图L0 持久化Oxigraph sled全量记忆 JSON‑LDMESI 缓存一致性协议感知系统5W2H 解析器态势感知健康监控模式识别冲突检测工作区文件监控接口层用户 / 工作流引擎MCP 适配器外部工具接入Agent 编排引擎SA 调度器 动态PDCA角色工厂 PA/DA/CA/AA上下文管理引擎L1窗口组装摘要/IRI注入Token预算控制架构的核心思想是编排器决定“谁在什么时候干什么”上下文引擎决定“LLM 看到什么”而其他所有模块——感知、记忆、知识、工具、质量——都是为这两个核心供血的循环系统。三、七大“人无我有”的亮点设计亮点一CPU 缓存式四层记忆传统 Agent 的记忆是“全量塞进上下文超出就截断”。Gliding Horse 则直接抄袭了 CPU 的多级缓存架构L1上下文窗口仅保留摘要 IRI 指针Token 恒定。L2共享黑板多 Agent 共享的 Oxigraph 内存图MESI 协议保证并发一致性。L3投影引擎按需从 L0 抓取子图像 MMU 一样换页。L0持久化Oxigraph 持久化 sled Hyperspace 双空间向量引擎。效果聊了 50 轮上下文只有 50 条摘要但任意历史细节都可以通过 IRI 秒级调取。Token 消耗从 O(n) 降为 O(1)。亮点二JSON‑LD 统一语义总线Gliding Horse 中没有任何“字符串数据”——所有任务、技能、记忆、设计文档、审计日志全是带id的 JSON‑LD 节点。鸭子类型一个 Skill 的参数叫input_file另一个叫source_url通过context自动映射到同一个语义 IRI零成本对接。自动去重两个 Agent 写入同一 IRI 的数据在图数据库中自动合并。Token 捏合同一份图数据可按需全展开或仅返回 IRI 引用精细控制上下文大小。亮点三硬约束质量门禁Gliding Horse 不相信 Prompt 里的“你必须”“你应该”。它用**系统调用门Syscall Gate**做三层硬拦截JSON Schema 校验参数格式不合规直接驳回。Ed25519 签名验证被篡改过的 Skill 直接拒绝加载。角色白名单PA 只能读DA 可读写CA 可审计。工具调用时还有ToolGuard做前置注入和后置校验发现敏感文件读取直接 Abort 并发送纠正消息。阶段流转时SHACL 契约校验产出物不合格直接打回。这套机制借鉴了丰田的“自工程完结”——不接收缺陷、不制造缺陷、不流出缺陷。亮点四动态 PDCA 编排Gliding Horse 的 SA 调度器不是一个静态 DAG 引擎。它会分析任务 5W2H动态决定执行拓扑简单查询 → 只派一个 DA标准分析 → PA → DA → CA复杂项目 → PA → 三个 DA 并行 → CA → AA探索研究 → DA ↔ CA 循环直到收敛这不是人编的 YAML是 SA 实时推理的结果。每个 Agent 的提示词动态生成Skill 按需从知识图谱加载。亮点五技能图谱 知识图谱桥接Skill 不再是 Markdown 文件而是 JSON‑LD 节点组成的可遍历网络包含 6 种语义链接类型前置依赖、组合、关联、替代、扩展、泛化。MOC内容地图节点提供导航入口。知识图谱存实体和关系桥接层连接“知识实体”和“技能”。Agent 调用一个技能时可以顺藤摸瓜获取该技能相关的历史经验、已知失败模式、适用场景。亮点六上下文 Token 经济学Gliding Horse 的上下文管理是一套纵深防御体系工具结果 IRI 化大工具结果自动存档到 L0上下文只保留摘要 IRI 微工具缩减 98%。跨轮摘要引用化截断时不是一句“之前已执行 5 轮”而是结构化列出每轮的关键动作和 IRI 引用。语义淘汰淘汰低相关度条目时基于向量相似度计算不误删关键信息。亮点七后台自进化与 Batch AgentGliding Horse 内置 8 个“保洁阿姨”——Batch Agent定时做技能合并、实体解析、失败模式挖掘、记忆压缩、模板效果分析。系统越用越聪明不是因为 LLM 变强了而是因为知识图谱在持续自我优化。四、一个真实的开发场景在开发 Gliding Horse 的“行为工程系统”时我只给了 SA 一句话“实现一个 RootCauseEngine当 Agent 执行出错时自动进行 5 级回溯追踪。”SA 自己分析了 5W2H决定走 PA → DA → CA。PA 去技能图谱里找到相关的 Skill生成了执行计划。DA 写代码时工作区监控系统显示依赖文件都是read_fresh。CA 发现trace_backward()缺少置信度阈值检查打回。DA 修正后重新提交CA 通过。AA 把“几何平均比算术平均更能防止单项高分掩盖薄弱环节”作为经验碎片写入知识图谱。整个过程中我只给了起始指令。规划、执行、检查、修正、归档全是系统自己完成的。五、Gliding Horse 不是谁的替代品它不是要替代 Claude Code 或 Codex CLI。相反它可以成为运行这些工具的底层平台——把它们的聪明才智装进一套有记忆、有约束、有质量保障的工程体系里。Claude Code 的 Workflow 是一个可复用的命令模板。Gliding Horse 的 PDCA 是实时推理的认知调度器。Codex CLI 的 Subagent 隔离执行。Gliding Horse 的 Subagent 通过 L2 黑板实时同步状态边执行边协调。OpenClaw 的 Skills 是插件配置。Gliding Horse 的 Skill 是语义网络节点可遍历、可发现、可进化。Hermes 的模块化是代码级组合。Gliding Horse 的模块化是操作系统的分层架构。这就是“工具”和“平台”的区别。前者帮你干活后者帮你管干活的人。六、结语AI Agent 的下一阶段不是让 LLM 更聪明而是让整个系统更可靠。Gliding Horse 走的就是这条路用操作系统的思想给 LLM 配上内存管理、进程调度、权限控制和质量保障。它不是最强的 AI但它是我能信任的 AI。如果你也在探索如何让 AI Agent 从“玩具”走向“生产力”欢迎来 GitHub 交流https://github.com/doiito/gliding_horse。