
当你的AI助手开始“失忆”、Token账单飞涨、响应质量断崖式下跌——是时候深度理解 /compact 了。引言:大模型时代的“内存管理”危机2025年,大语言模型的上下文窗口已经从早期的4K token扩展到200K、1M甚至10M级别。Anthropic Claude Sonnet 4拥有200K token的上下文窗口(约15万单词),Google Gemini的窗口已突破1M。然而,窗口越大,问题越严重。想象一下:你和一个AI助手对话了整整一个下午,从需求分析到架构设计,从代码实现到测试部署。当对话达到第200轮时,AI开始“忘记”最初的技术选型决策,代码建议前后矛盾,甚至反复提出已经否决的方案。更糟糕的是,每次请求都在为这200轮对话的完整历史买单——Token消耗呈线性增长,账单数字触目惊心。这不是模型能力的问题,而是上下文管理的工程难题。根据中国信通院《智能体技术和应用研究报告(2025年)》,记忆系统已成为智能体五大核心组件之一,直接决定AI是否能够真正作为数字员工开展工作。而在所有上下文管理手段中,/compact命令正成为AI辅助编程和智能体开发中最核心的“内存管理”工具。本文将深入源码层面,逐行拆解/compact命令的三大核心机制:Token压缩算法、记忆淘汰策略和