AI 写小说长篇记忆技术深度研究报告

发布时间:2026/6/25 21:28:17
AI 写小说长篇记忆技术深度研究报告 研究日期2026-06-24研究范围AI 辅助长篇创作中的记忆管理技术——学术界进展、工业界实践、中国市场格局与未来趋势1. 研究概述1.1 研究背景到2025年底中国生成式AI用户已超过6亿。AI辅助写作的门槛降至几乎为零但写一段东西和写完一本书之间隔着本质性的技术鸿沟——记忆管理。当前AI写作工具普遍能生成流畅的单章内容但在50万字以上的长篇创作中人物崩坏、伏笔遗忘、世界观漂移等问题频发。这不是模型不会写的问题而是模型没有拿到合适的记忆资料的问题。1.2 研究方法本研究综合以下四个信息源学术论文检索arXiv、ACL、EMNLP、NAACL、ICLR等顶级会议论文重点关注2023-2026年间发布的LLM记忆系统、故事生成、叙事一致性相关研究工业界产品调研国内外12款主流AI写小说工具的技术方案与功能对比技术架构分析深入分析上下文工程、检索增强生成、知识图谱、分层记忆等关键技术路线中文市场数据结合国内网文创作生态分析中文长篇创作对记忆技术的特殊需求1.3 核心发现摘要发现要点长上下文≠记忆能力MemoryArena实证将主动记忆Agent替换为纯长上下文基线完成率从80%以上降至约45%记忆分层是共识从MemGPT到Letta从Mem0到AgeMem分层虚拟记忆已成为主流架构方向混合检索优于单一方案BM25关键词 向量语义 知识图谱关系三者结合是最优召回策略知识图谱对动感叙事有效对内省叙事有害KG提升动感叙事角色评分1.37(p0.016)但内省叙事综合评分-0.66中文市场有独特需求快节奏更新、高密度伏笔、角色关系复杂中文网文需要专门设计的记忆系统记忆自我进化是趋势从被动检索到主动学习——AgeMem等系统已开始用RL训练记忆管理策略2. 核心问题长篇创作中的记忆困境2.1 问题的本质长篇AI创作面临的核心矛盾在于LLM的上下文窗口有限且推理过程中参数无法实时更新而长篇小说的信息量随章节线性甚至超线性增长。当一本小说写到第100章时累积的角色经历、伏笔线索、世界观细节和关系网络已经远超任何单次推理的承载能力。2.2 典型失败模式根据对现有文献和用户反馈的分析AI长篇创作的主要失败模式包括失败类型具体表现导致原因人物崩坏角色在第50章回到第1章的性格和关系状态系统只读取初始角色卡未追踪角色成长伏笔遗忘第15章的伏笔到第40章仍未被回收或重复埋设无结构化伏笔追踪与自动提醒机制设定漂移世界观规则前后矛盾如魔法体系、势力格局设定未持续更新只读不写情节断裂新章内容未承接上一章结尾状态缺乏上一章衔接信息自动注入知识混乱角色知道不该知道的信息或忘记已经了解的秘密未管理角色知识边界摘要漂移多次压缩历史内容后低频细节静默消失滚动摘要的累积偏差效应2.3 信息增长曲线一部典型的长篇网文在不同阶段的信息管理需求阶段一1-20章基础设定期 - 角色数量5-15人 - 伏笔数量3-10条 - 世界观要素基本框架 → 人工管理勉强可行 阶段二21-50章关系展开期 - 角色数量15-40人 - 伏笔数量10-30条部分开始回收 - 世界扩展势力关系复杂化 → 人工管理开始吃力 阶段三51-100章深度交织期 - 角色数量30-80人 - 伏笔数量30-80条多线并行 - 角色经历差异显著信息不对称复杂 → 人工管理几乎不可能 阶段四100章长期维护期 - 全量历史信息远超人类记忆承载 - 查找旧线索的时间成本剧增 → 必须有系统性自动化方案3. 学术界记忆系统研究全景3.1 记忆技术发展时间线AI记忆系统研究在过去三年经历了快速演进年份阶段标志性工作核心贡献2023奠基期Generative Agents, Reflexion, MemGPT记忆流反思规划三层架构语言反思替代标量奖励OS式虚拟上下文管理2024系统化LongMemEval, LoCoMo, CHIRON, LongWriter标准化评估基准角色表征系统万词生成突破2025工程化Mem0, A-MEM, FACTTRACK, SCORE, Agents Room生产级图记忆Zettelkasten方法世界状态追踪多智能体叙事2026自主化AgeMem, MAGMA, MemoryArena, NarrativeWeaverRL训练记忆管理策略多图正交记忆记忆评估基准叙述中心RAG3.2 记忆分类学根据《From Human Memory to AI Memory》arXiv:2504.15965和《Agent Memory统一分类体系》LLM记忆系统可从三个维度理解维度一形式Forms——记忆以什么载体存在形式说明代表系统Token-level Memory显式文本单元存储。含1D扁平对话缓冲区、2D平面知识图谱三元组、3D层级社区摘要层级MemGPT, Mem0, A-MEMParametric Memory编码在模型参数中。含内部参数LoRA微调和外部参数Memory3MemLLM, Memory3Latent Memory模型内部隐状态。通过压缩TokenGist Token、复用KV Cache、隐空间映射构建MemGen, TokMem维度二功能Functions——Agent为什么需要记忆功能说明小说创作对应事实记忆Factual存储显式事实用户偏好、环境状态角色名、基本设定、已确定的世界规则经验记忆Experiential过程性知识成功/失败案例、策略规则、可复用技能已用过的好句式、成功的章节结构、写作套路工作记忆Working当前任务执行中的瞬态上下文当前章大纲、上一章结尾、需推进的伏笔维度三动力学Dynamics——记忆如何运作和演化阶段说明小说创作对应形成Formation从原始交互中提取记忆候选章节写完后自动分析提取新的人物变化、新信息、新关系演化Evolution持续维护巩固、更新、遗忘合并重复伏笔、更新角色状态、淘汰已回收伏笔检索Retrieval上下文感知的记忆访问写新章时自动找回相关人物状态、伏笔、前情3.3 关键里程碑论文深度解读MemGPTUC Berkeley, ICLR 2024核心思想LLM的上下文窗口犹如操作系统的物理内存——有限、易失需要虚拟化管理。架构模型 ┌─────────────────────────────┐ │ 主上下文 (RAM) │ ← 系统提示 最近消息 相关记录 ├─────────────────────────────┤ │ 回忆存储 (Disk) │ ← 所有过往消息的可搜索数据库 ├─────────────────────────────┤ │ 归档存储 (Cold Storage) │ ← 文档和长期知识的向量索引存储 └─────────────────────────────┘关键创新Agent自主触发记忆操作写入、检索、归档而非被动依赖预设规则。这种中断驱动的控制流使Agent能处理远超上下文窗口的超长对话。MemGPT后来发展为Letta框架成为最早的生产级Agent Memory开源项目。对小说创作的启示将上下文分为当前写作上下文当前章大纲上一章衔接相关人物状态和历史写作档案全书章节、角色演化史、伏笔全记录由系统自动管理两者的数据搬运。Generative AgentsStanford, UIST 2023核心思想记忆流反思规划的三层架构通过记忆机制涌现类人行为。检索评分公式兼顾三个维度Recency新近度指数时间衰减Importance重要性Agent自我评估的整数评分Relevance相关性嵌入向量相似度对小说创作的启示人物记忆检索需同时考虑最近发生的时间衰减、重要程度是否是关键剧情点、和语义相关和当前写的内容有多大关系。VoyagerNVIDIA, NeurIPS 2023核心思想将可复用代码作为长期记忆技能库。每完成一个子任务生成的代码被抽象为可复用技能函数存入向量数据库。关键指标发现物品多3.3倍技能获取快15.3倍。移除技能库后进度速度损失15.3倍——技能库本身就是性能所在。对小说创作的启示好的句式、成功的段落结构、有效的氛围营造手法都可以抽象为可复用的写作技能而不是每次都从头生成。Mem02025, 生产级图记忆核心思想将对话信息自动提取为实体-关系三元组构建持续演化的知识图谱。核心工程原则渐进式记忆形成增量更新不一次性处理全部历史双重存储向量图谱并行冲突感知更新新信息与已有记忆矛盾时的自动处理性能数据相比OpenAI记忆功能准确率高26%p95延迟降低91%token消耗减少90%以上。AgeMem2026, RL训练记忆管理核心思想将记忆操作store/retrieve/update/summarize/discard作为策略动作通过强化学习端到端优化。学习到的重要策略在上下文填满之前主动进行中间结果摘要选择性丢弃与现有记录语义相似但不增加新信息的记录3.4 故事生成领域的专门研究以下是与长篇AI写作记忆问题直接相关的关键论文论文会议核心主题与长篇记忆的关系CHIRON(2024)EMNLP Findings长叙事中丰富角色表征直接解决角色一致性——将角色状态向量化FACTTRACK(2024)NAACL时间感知的世界状态追踪追踪故事世界中什么在什么时候是真的RecurrentGPT(2023)arXiv循环记忆机制模拟短时→长时记忆的写作过程Dynamic Hierarchical Outlining with Memory-Enhancement(2024)NAACL动态层次大纲记忆增强将规划与记忆直接结合Knowledge Graphs for Storytelling(2025)IJHCIKG辅助故事生成KG对动感叙事角色评分1.37(p0.016)Agents Room(2025)ICLR多智能体协作叙事多角色分工解决复杂叙事一致性Narrative Knowledge Weaver(2026)arXiv叙述中心RAG将RAG特化到叙事领域SCORE(2025)arXiv检索增强故事连贯性通过检索提升故事连贯性的系统化方案4. 工业界产品方案对比4.1 国际市场产品记忆方案核心机制优势局限EPOS-AI持久化手稿数据库112.5K字全文常驻上下文3级AI编辑唯一提供全文记忆结构化编辑的产品不能选择模型最低$29/月SudowriteStory Bible手动维护Muse模型场景级散文生成英文文笔优秀Muse专为小说微调无跨会话持久记忆需手动重建上下文NovelCrafterCodex手动世界构建多模型(BYOK)场景节拍系统控制度最高可接入任何模型框架而非成品需自行管理token和APINovelAILorebook关键词触发Kayra模型最小内容限制创作自由度高最便宜$10/月Lorebook浅层无编辑分析无输出格式关键差异维度记忆持久性EPOS-AI(全文DB) NovelCrafter(Codex手动) NovelAI(Lorebook触发) Sudowrite(会话级) 记忆自动化EPOS-AI(自动) NovelAI(半自动触发) Sudowrite(手动Story Bible) NovelCrafter(手动Codex) 中文支持全部弱——主要面向英文市场。Sudowrite和NovelCrafter不支持中文NovelAI有限支持4.2 中国市场产品记忆方案核心机制优势局限AI写作图谱大纲7 Agent协作700本爆款拆解库节奏分析大纲图谱节奏多模型评分根据自我评估(89/100)独立验证不足蛙趣拼文本地向量库混合检索时序衰减角色/大纲/伏笔/世界观/章节摘要/素材库六大资料库自动分析沉淀最完整的记忆系统本地化存储伏笔自动管理模型需自行接入笔*AI基本角色卡一键生成上手体验好易用性强快速启动记忆系统薄弱长篇一致性差DeepSeek单模型无工作流上下文窗口128K-1M token极致性价比模型能力强纯聊天式无项目管理无结构化记忆ChatGPT/Claude会话级上下文通用对话文笔好知识广无项目记忆跨会话丢失上下文5. 关键技术路线深度剖析5.1 上下文工程Context Engineering核心思想不是给模型更多token而是给模型更精准的结构化输入。蛙趣拼文方案七类关键输入按优先级组合——当前章大纲方向约束→ 最高优先级上一章衔接承接约束→ 最高优先级人物状态一致性约束→ 高优先级世界观设定规则约束→ 中高优先级伏笔信息长线约束→ 中优先级章节摘要历史脉络→ 依相关性动态进入本地记忆检索语义关联→ 依相关性动态进入关键设计原则资料结构化不是把所有原文全塞进去而是拆成不同类别的约束优先级排序识别哪些信息必须带上、可以压成摘要、暂时不碰动态筛选写战斗场面时角色伤势和武器损耗比三个月前的对话重要得多学术界呼应MemGPT的虚拟上下文管理本质上就是上下文工程《Agent Memory》综述提出记忆操作编排的失败通常是静默的——不会报错只是回答稍差。这正是上下文工程需要精细化的原因5.2 混合检索Hybrid Retrieval核心思想BM25关键词检索 向量语义检索 知识图谱关系检索三者互补。双路召回融合排序架构查询 → 查询解析识别关键词/实体/意图/别名 ↓ ↓ BM25关键词检索 向量语义检索 精确匹配 语义关联 ↓ ↓ 结果融合RRF/加权合并 ↓ 轻量重排 - 实体匹配加分角色名、地点名 - 关键词覆盖加分 - 类型匹配加分查伏笔→伏笔优先 - 章节距离调节越近越重要 - 重复内容降权 ↓ 最终排序结果为什么三种检索缺一不可检索类型擅长弱点小说场景示例BM25关键词人名、地名、道具名、专有名词同义词、模糊表达搜索青铜钥匙——精确找到所有字面出现向量语义相似情绪、类似剧情走向、抽象概念精确实体匹配不稳定搜索主角第一次被同伴怀疑——能找回字面不同的相关场景知识图谱多跳关联、关系推理、冲突检测构建成本高、内省叙事中适得其反搜索和林远有关系的所有角色——图谱直接返回结构化的关系链5.3 动态人物记忆Dynamic Character Memory核心思想把角色信息拆成稳定信息和变化信息两部分。稳定信息角色卡姓名、别名、身份、外貌、基础性格、初始目标、背景经历变化信息动态追踪心理状态、关系强度、最近事件、掌握的信息、能力变化、伤势、立场、秘密、阶段目标自动更新流水线章节完成 → 章节分析识别出场角色 → 分析每个角色的本章变化 → 结构化写入角色记录状态前/触发事件/状态后/涉及章节 → 更新当前状态摘要 → 下一章生成时自动加载最新状态结构化记录示例角色林远 章节第27章 变化类型心理状态 状态前不信任周宁 触发事件周宁冒险救下林远 状态后开始信任周宁但仍保留部分秘密关键价值角色不只是一个标签而是随故事推进不断积累状态的实体结构化字段便于检索、比较和冲突检测支持细粒度状态既不是简单的完全信任也不是完全不信任5.4 伏笔管理系统核心思想伏笔不仅是一句话备注而是有完整生命周期的结构化对象。伏笔生命周期管理埋设 → 推进 → 暗示 → 回收 → 归档 │ │ │ │ │ └── 生效章节区间 ──┘ │ │ │ 轮换间隔控制避免连续三章都提同一伏笔 │ 失效伏笔自动从参考池撤除关键机制章节区间伏笔在哪些章节范围内有效推进记录每次被提及或推进的章节记录回收标记是否已被回收防止重复回收轮换间隔同一条伏笔不能连续N章都在提避免水字数感自动撤除失效/已回收伏笔自动从上下文参考池移除5.5 时序衰减与重要性加权核心思想不是所有历史信息同等重要检索排序需要考虑时间远近和剧情重要性。GenAI启发式公式来自Generative Agents检索评分 α × Recency × β × Importance × γ × Relevance 其中 - Recency指数时间衰减函数 e^(-λΔt)距离当前章节越远权重越低 - Importance关键剧情节点自动获得更高权重角色死亡、关系破裂、重大发现等 - Relevance与当前写作语义的余弦相似度蛙趣拼文增强版不仅考虑时间远近还考虑章节距离——同一卷内的旧内容可能比上上卷的最近内容更重要引入剧情阶段感知——第一卷埋的伏笔在第三卷进入回收期时权重应临时提升5.6 知识图谱在叙事中的应用核心发现来自IJHCI 2025知识图谱的效果高度依赖叙事类型。叙事类型KG效果统计显著性动感叙事动作、探险、科幻显著正面p0.039内省叙事心理恐怖、浪漫戏剧负面效果p0.07接近显著动感叙事中KG的具体提升角色评分2.38→3.751.37, p0.016显著节奏评分2.88→3.750.87结构评分3.38→3.750.37综合评分3.13→3.730.60内省叙事中KG为何失效KG的外部化逻辑不适用于需要心理深度、微妙情感线索和隐含动机的故事参与者描述故事为重复的和结构僵化KG强加了外部框架到本质上由内部、非结构化思维驱动的故事中对AI写小说的启示玄幻、仙侠、科幻、探险类——KG极其适合管理能力体系、势力格局、地理空间言情、文艺、心理类——KG可能对创作产生负面影响需谨慎使用最佳策略允许作者按类型选择性启用KG6. 中文市场的特殊挑战与方案6.1 中文网文创作的独特特征与英文小说创作相比中文网文在记忆管理方面面临额外挑战特征对记忆系统的挑战超快更新节奏日更3000-10000字记忆系统必须支持高频增量更新极高伏笔密度玄幻悬疑类可以同时铺排30-80条伏笔需要结构化追踪复杂称谓系统一个角色可能有名字、称号、绰号、化名、尊称等5种指代势力关系网络宗门/家族/组织层级交错关系变化频繁修炼体系境界/等级体系需严格一致突破后的能力变化需全局同步长连载周期一部作品可能连载2-4年总字数200-500万字6.2 中文NLP的技术难点分词与实体识别中文无空格分隔人名识别更困难角色名字可能与其他词语重合如林远中的远也是常见词古风/玄幻名更难识别如慕容雪落叶无道同义词与指代消解一个角色可能被不同角色以不同方式称呼掌门师父老头子可能指同一个人中文嵌入模型的适配通用嵌入模型在中文文学文本上表现不佳需要针对网络文学语料进行领域微调6.3 中文工具的技术方案差异蛙趣拼文本地化开放式的记忆工程路线技术栈推测前端VSCode插件 Electron桌面端 存储本地文件系统 SQLite/向量数据库 检索BM25关键词 中文优化嵌入模型向量 记忆角色/大纲/伏笔/世界观/章节摘要/素材库六大资料库 架构本地向量库 混合检索 时序衰减 自动分析沉淀 模型支持接入DeepSeek/Claude/GPT等用户自行配置API Key核心优势数据主权完全在本地——对在意草稿隐私的作者是重要加分开放模型选择——不被锁定到特定模型六大资料库各司其职——角色、大纲、伏笔、世界观、章节摘要、素材库独立管理待观察本地向量检索的计算开销跨项目记忆共享的可行性移动端支持7. 前沿趋势与未来方向7.1 记忆自我进化Self-Evolving Memory趋势从被动检索到主动学习——Agent通过RL学习如何管理自己的记忆。AgeMem的核心突破五种记忆操作作为可调用工具store → retrieve → update → summarize → discard三阶段RL训练监督预热 → 任务级奖励 → 步骤级GRPO逐操作信用分配学习到在上下文填满之前主动摘要等非显而易见策略对AI写小说的潜在影响系统可能自动学会第30章的伏笔在写第60章时应该主动提升优先级可能自动识别这个角色已经三个月没出场了写下一章时应该加载他的完整状态可能学会针对不同类型小说采用不同的记忆管理策略7.2 多维正交记忆Multi-Orthogonal Memory趋势MAGMA2026提出多图正交记忆架构——不同类型的信息用不同维度的记忆图表示互不干扰但可协同查询。可能的小说应用┌──────────────────────────────────────┐ │ 角色关系图谁认识谁、关系如何变化 │ ├──────────────────────────────────────┤ │ 时间线图事件发生的因果和时间顺序 │ ├──────────────────────────────────────┤ │ 世界观图世界规则、地理空间、势力格局 │ ├──────────────────────────────────────┤ │ 知识边界图每个角色知道什么/不知道什么 │ └──────────────────────────────────────┘7.3 叙述中心RAGNarrative-Centric RAG趋势Narrative Knowledge Weaver2026提出将RAG从通用领域特化到叙事领域。核心创新不是按文档组织信息而是按叙述单元场景、章节、情节线检索时考虑叙述结构起承转合、三幕结构支持按情节线而非仅按关键词检索7.4 多Agent写作协作趋势Agents RoomICLR 2025、IBSENACL 2024等验证多Agent协作叙事的可行性。分工模式大纲Agent管理故事结构和章节规划 写作Agent生成正文内容 一致性Agent校验人物、设定、伏笔是否一致 节奏Agent分析章节节奏和读者留存曲线 编辑Agent审稿和修改建议小说创作中的潜在应用一致性Agent可以在线校验——写完一章立即标记出这里和第三章的矛盾节奏Agent可以预警——连续三章没有高潮读者可能流失编辑Agent可以退稿——这段对话不符合当前角色状态请用最新状态重写7.5 长上下文模型的挑战与机遇现状Gemini 2.5支持100万token上下文DeepSeek支持128K-1M token。但是——长上下文≠记忆的实证MemoryArena中将主动记忆Agent替换为纯长上下文基线完成率从80%以上降至约45%StanfordLost in the Middle研究模型对长文档中间位置的信息准确率显著下降长上下文存在注意力稀释——更多记忆内容注入会降低对单一信息的聚焦能力结论长上下文窗口是必要的但不足够。真正有效的记忆系统需要选择性记忆主动管理而非记住一切靠注意力自己找。7.6 开源与标准化趋势通用Agent Memory框架LettaMemGPT的演进版最成熟的OS式记忆管理开源框架Mem0面向生产环境的图记忆框架LangChain/LlamaIndex提供了基础的记忆和RAG组件故事生成专用开源工具RecurrentGPT交互式长文本生成含代码SEED-Story腾讯多模态长故事生成FireRed-OpenStoryline开源故事线生成工具标准化评估基准LongMemEval长期记忆评估LoCoMo长对话记忆基准MemoryArena最全面的Agent记忆评估套件2026但Anatomy of Agentic Memory指出现有基准存在上下文饱和风险——许多测试集完全可放入128K窗口8. 结论与建议8.1 技术结论分层记忆是解决长篇AI创作记忆问题的唯一可行路径。单体上下文模式只在短篇20章中可用上下文检索增强模式是当前生产环境主流分层记忆学习控制是未来方向。混合检索BM25向量知识图谱是当前最优召回策略。三者各有所长——关键词保证精确匹配向量补充语义关联图谱支持关系推理。但图谱在言情/文艺类作品中需谨慎使用。动态人物记忆优于静态角色卡。将角色信息拆分为稳定信息和变化信息通过章节分析自动更新后者是将篇长度从50万字推到200万的核心技术。伏笔管理系统化是中文网文的刚需。伏笔不仅仅是备注而是有生命周期埋设→推进→暗示→回收→归档的结构化对象需要轮换间隔和自动撤除机制。记忆自我进化RL训练是下一个技术分水岭。从被动、基于规则的检索到主动、策略学习的记忆管理AgeMem等系统已展示可行性。长上下文窗口是必要不充分条件。即使窗口达到100万token在需要选择性检索和主动管理的任务上长上下文模型始终不如专用记忆系统。8.2 产品建议对于AI写小说工具开发者优先级建议理由P0实现基本的上下文工程管线大纲衔接人物状态世界观这是从能写一段到能写一本书的最小可行方案P0混合检索——BM25向量双路召回中文网文的精确匹配和语义关联缺一不可P1动态人物记忆——自动章节分析状态更新将长篇容量从50万字推到200万P1伏笔生命周期管理系统中文玄幻/悬疑类网文的核心需求P2引入轻量知识图谱适合管理势力关系和世界观规则但需允许按类型选择性启用P3多Agent协作一致性校验AgentICLR 2025已验证可行但工程复杂度高P3记忆策略学习RL训练尚在学术研究阶段成本高且迁移性未确认对于AI写小说用户作品类型推荐工具关键原因中文长篇网文玄幻/仙侠/悬疑蛙趣拼文最完整的记忆系统伏笔管理是刚需中文短篇/试写ChatGPT/Claude 手动管理短篇不需要复杂记忆系统英文长篇EPOS-AI 或 NovelCrafter前者全文记忆最优后者控制度最高英文短篇SudowriteMuse模型文笔最优秀实验性/高自由度创作NovelAI内容限制最少8.3 未来研究建议中文网文特化的评估基准现有记忆评估基准LongMemEval, LoCoMo, MemoryArena均为英文中文长篇创作需要专门评估标准角色一致性的定量度量目前主要靠人工判断缺乏自动化、可复现的一致性评估指标叙事类型自适应的记忆策略知识图谱研究表明不同叙事类型需要不同的记忆方式如何自动检测并适配记忆管理的成本优化百万字级长篇的全量向量检索和知识图谱维护的计算成本需要系统优化用户意图与记忆检索的对齐作者想写什么和系统应该检索什么之间的gap尚未被系统研究9. 参考资料学术论文Wu, Y. et al. (2025). From Human Memory to AI Memory: A Survey on Memory Mechanisms in the Era of LLMs. arXiv:2504.15965.Packer, C. et al. (2024). MemGPT: Towards LLMs as Operating Systems. ICLR 2024. arXiv:2310.08560.Park, J.S. et al. (2023). Generative Agents: Interactive Simulacra of Human Behavior. UIST 2023. arXiv:2304.03442.Shinn, N. et al. (2023). Reflexion: Language Agents with Verbal Reinforcement Learning. NeurIPS 2023. arXiv:2303.11366.Wang, G. et al. (2023). Voyager: An Open-Ended Embodied Agent with Large Language Models. NeurIPS 2023. arXiv:2305.16291.Chhikara, P. et al. (2025). Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory. arXiv:2504.19413.Yu, Y. et al. (2026). Agentic Memory: Unified Management of Short-term and Long-term Memory for LLM Agents. arXiv:2603.07670.Guiding Generative Storytelling with Knowledge Graphs (2025). IJHCI. arXiv:2505.24803.CHIRON: Rich Character Representations in Long-Form Narratives (2024). EMNLP Findings.FACTTRACK: Time-Aware World State Tracking in Story Outlines (2025). NAACL.Generating Long-form Story Using Dynamic Hierarchical Outlining with Memory-Enhancement (2025). NAACL.Agents Room: Narrative Generation through Multi-step Collaboration (2025). ICLR.Narrative Knowledge Weaver: Narrative-Centric RAG for Long-Form Text (2026). arXiv.SCORE: Story Coherence and Retrieval Enhancement (2025). arXiv.产品与工具蛙趣拼文 (waqupin.com) - 中文AI长篇创作工具EPOS-AI (epos-ai.ch) - 瑞士AI小说写作平台Sudowrite (sudowrite.com) - 英文AI创意写作NovelCrafter (novelcrafter.com) - 英文AI写作框架NovelAI (novelai.net) - 英文AI创意写作综述与评测Agent Memory 全景从 MemGPT 到 A-MEM - AI Insight (2026)Best AI Novel Writing Tools 2026: Tested Comparison - EPOS-AI EditorialAwesome-LLM-Story-Generation - GitHub/Picrew