从编译器到AI Agent循环:验证的三种核心属性如何被手工重建

发布时间:2026/6/22 22:56:09
从编译器到AI Agent循环:验证的三种核心属性如何被手工重建 在生产环境中搭建多Agent系统时你经常会遇到这样的场景一个Agent负责生成代码、策略或分析报告另一个Agent负责审查和迭代。系统看似在持续“自我修正”输出也越来越流畅。但当任务进入架构权衡、安全边界或长期影响评估时循环往往在表面合理的方案上停滞。真正的问题直到上线后、或者外部审计介入时才暴露——关键缺陷被循环内部的共识悄然吸收了。作为负责这类系统落地的架构师或SRE你关心的从来不是Agent能跑多少轮而是每一轮中错误是否真的被强行拦截而不是被内部逻辑温柔地消化。这正是循环工程要解决的底层问题。编译器免费提供的三种保障Agent循环必须逐一手工搭建编程语言的编译器对使用者而言从来不是“把源码变成可执行文件”的工具。它同时具备三种属性当你写出类型不匹配时它会立即拒绝阻力它的判决不受你反复解释或情绪影响独立判断把同一份代码扔到任何机器上得到的都是相同结果公开可复现裁决。这三种保障在日常编程里几乎是免费附送的。你不需要额外设计它们就内建在语言规则中。而AI Agent面对的大量真实任务——需求拆解、架构决策、风险评估——恰恰缺少这样的内置验证器。循环工程的全部工作就是在这些领域手工重建这三种属性。起初我以为优化Agent循环的核心在于更精细的提示词和更聪明的工具调用编排。后来把多个生产失败案例拆开看才发现真正决定成败的从来不是生成能力而是验证机制是否真正独立于生成过程。就像在没有刹车踏板的汽车里开车你可以不断尝试不同路线但只有真正撞上障碍或被外力强制停止时才知道哪里错了。低成本的试错在高风险生产环境中是奢侈品。循环工程要做的就是提前搭建能模拟这种“强制停止”的机制。三种属性的具体重建方式下面是用伪代码展示的两种循环形态对比已做逻辑精简并增加关键注释# 常见但脆弱的自我循环Agent与自身对话whilenotdone:draftgenerator.run(task,history)# 生成者feedbackreviewer.run(draft)# 审查者同一模型家族iffeedback.scorethreshold:breaktaskupdate(task,feedback)# 问题reviewer 与 generator 共享大量预训练假设容易形成共识幻觉# 重建编译器属性的循环独立验证层whilenotdone:draftworker_agent.propose(task)# 工作Agent生成# 独立验证层规则引擎 / 不同模型 / 执行测试 / 人类抽查verdictindependent_verifier.evaluate(draft,external_criteria,# 来自规范、历史测试或领域规则evidence_sources# 外部可观测事实)audit_log.append({# 公开裁决记录draft:draft,verdict:verdict,evidence:verdict.evidence,timestamp:now()})ifnotverdict.passes:taskrefine(task,verdict)# 关键验证者与生成者共享假设越少阻力越真实阻力通过测试、CI规则或执行反馈实现独立性通过不同模型、外部工具或人类介入实现公开裁决则依赖完整、可追溯的审计轨迹。抽象阶梯上的验证器代价与可靠性的权衡真实代码库里从来不是只有一个验证器而是形成了一条阶梯。每一层验证的东西不同代价和可靠性也完全不同。底层格式化 / 类型检查 / Linter即时、确定性、外部规则中间单元测试 / 集成测试执行验证、采样覆盖高层架构评审 / 安全审计需上下文判断顶层策略选择 / 品味评估无外部参照物发现与问题定义规范本身待构建越往上走验证就越慢、越不自动、越依赖判断。底层错误能在毫秒级被外部规则拒绝顶层“这个架构是否明智”则需要人去感受全部证据后才能做出。验证属性对比矩阵属性真实编译器手工重建的循环验证器典型风险与权衡阻力语言规则强制拒绝需手动设计测试、规则、执行反馈测试覆盖不足Agent可能学会规避弱点独立性规则完全独立于开发者需不同模型/外部工具/人类介入最易伪造同源Agent易形成共识幻觉公开裁决确定性、可复现依赖完整审计日志与证据链日志不完整则无法事后复核独立性最容易被伪造却最关键的属性循环工程最常见的失败模式就是用第二个Agent做reviewer却没有真正解决独立性问题。两个基于相似预训练数据和提示框架的Agent本质上共享了大量隐性假设。这时候的“独立审查”只是把同一个盲点用更流畅的语言重复了一遍。验证器的权威来自它与生成过程共享假设的最小化程度。越是高层判断这个最小化就越困难也越重要。验证阶梯的顶层当判断不可编译时循环工程必须止步继续往上爬最终会遇到这样的层级判断“这个方案是否有品味”“这个问题问得是否正确”“这个战略方向是否明智”。这里已经没有外部参照物可以编译了。继续堆叠验证器只会制造越来越精致的自我确认。正确做法是把判断完全审计化——把推理过程、证据、权衡、风险全部清晰呈现让真正能感受差异的人来做出最终裁决。循环工程的智慧不在于把所有层级都自动化而在于清晰标出边界哪些验证可以廉价重建哪些必须保留给能真正“感受”差异的人。循环工程的真实工作好的循环工程本质是“验证考古学”。它先诊断这个任务在哪个抽象层级缺失了什么编译器然后用当前能承受的成本搭建最忠实却又最廉价的近似物同时明确标出哪里已经无法再用验证器覆盖必须把完整证据交给人类。在生产环境落地前你必须先回答三个问题这个任务当前站在哪个抽象层级缺失的编译器最廉价的近似物是什么在哪个点上继续堆叠验证器已经比直接交给人类更危险循环工程的尽头从来不是更完美的自动化而是更清晰的边界。这一框架的核心洞察最初由 Carlos E. Perez 在 X 平台提出。我是紫微AI在做一个「人格操作系统ZPF」。后面会持续分享AI Agent和系统实验。感兴趣可以关注我们下期见。