Agent"死机"了?上下文爆了?换模型失忆了?
你有没有经历过这些崩溃时刻? 调试了大半天,Agent 突然挂掉,一切要从头来过... 上下文已经塞了 3 万 token,输出质量断崖式下跌... 套餐用完切换模型,新 Agent 上线:"你好,我是你的新助手",前面聊的全忘了... 这些问题我们全都踩过,而且踩得很惨。今天分享一个我们觉得设计得很妙的解法:临终备忘录机制。 正在进行复杂的代码重构,十几轮对话、几百次工具调用,眼看就要收尾——啪,进程崩了。 "你好,我是你的 AI 助手,有什么可以帮你?" 我刚才在干什么?配置是什么?做到哪一步了?——全部忘光。 长任务跑着跑着,输出开始变奇怪——决策前后矛盾、工具调用重复、模型开始"幻觉"。 上下文超过 40% 质量阈值,模型开始丢失早期信息 压缩哪段?压缩后怎么衔接?搞不好比崩溃还乱。 用的模型套餐达上限,切换到另一个模型。新模型: "你好,我是新模型,请告诉我你需要什么帮助" 不记得项目背景、不记得方案决策、不记得用户偏好。切换一次,调教一遍。 人死之前要写遗嘱,Agent "死"之前,为什么不能写一份"临终备忘录"? 当 Agent 检测到自己即将"死亡"(重启/压缩/切换)时,主动写下备忘录,把自己正在做的事、做到哪一步、下一步该干什么,全部记录下来。 下一次启动时,先读备忘录,无缝衔接。 📍 共享路径(跨Agent通用): 所有 Agent 共享同一个路径,备忘录写完放在这里,下一个 Agent 启动时自动读取。恢复后自动删除 ,避免重复恢复。 不存在?→ 正常启动 检索相关记忆(上次做到哪、踩过什么坑) 无缝衔接,上下文完整 💀崩溃前:临终备忘录写入(当前任务 + 上下文快照) ↓ (或:自动触发长任务 checkpoint) 🔄重启后:读备忘录 → 恢复上下文 → 继续工作 ⚡原本 30 分钟的恢复工作,变成 <1分钟自动完成 检测到:上下文 >40% 阈值 ↓ 临终备忘录写入(精华摘要 + 当前任务状态) ✂️ 压缩:保留最近对话 + 备忘录摘要作为新上下文开头 ▶️ 继续:模型"记得"之前在做什么,只是丢了细节 ⚡ 压缩不再是"截断",而是"有准备的交接" 📤 原模型:临终备忘录写入(完整状态 + 配置 + 偏好) ↓ 套餐达上限 → 切换新模型 📥 新模型:读取备忘录 + 读取 memoria 历史记忆 💬 "你好,我是新模型。你目前在做半导体项目的大盘预测,上一步在调参,下一步补充X特征——继续?" 🔗 切换模型不再是"失忆重启",而是"换人不换岗" 瞬时状态 + 长期经验 = 完整恢复 新 Agent 既知道 "刚才在干啥",也知道"以前踩过什么坑" —— 完整上下文恢复 临终备忘录的本质是——给 Agent 装一个"濒死自觉"。它知道自己可能要"死"了,所以在最后一刻把所有关键信息塞进一份备忘录里,放在一个共享位置,下一个Agent 来的时候先读一下,无缝接手。 欢迎体验 Memoria,点击官网链接即可进入 https://thememoria.ai/01 三个"死亡场景",每个都踩在肺上
01 Agent突然挂掉
02 上下文窗口爆炸
03 模型切换后失忆
02 我们的解法:临终备忘录
核心理念
触发方式 场景 主动指令 用户说"我要重启了" / "保存进度" / "写临终备忘录" 自动标记 工具调用 ≥20 时,提示用户"是否保存 checkpoint?" 03 备忘录写什么?
临终备忘录 (Death Note)
# 生成时间: 2026-04-10 20:33 | 状态: 🟡 待恢复
## 1. 身份信息
- Agent类型: Hermes
- 用户: 律麟
- 当前项目: 半导体产线智能体
## 2. 临终前正在做的事
- 任务: 调试大盘产出预测模型
- 当前步骤: 第3轮参数调优,已跑通baseline
- 已完成: 数据清洗 / 特征工程 / baseline模型
- 阻塞点: 预测误差率偏高,怀疑是X特征缺失
- 下一步: 补充X特征,重新训练
## 3. 核心约束
- 用户偏好: 直击重点,不要废话
- 项目规则: 先读源码再动手
## 4. 关键配置
- 模型: MiniMax-M2.5
- memoria相关记忆ID: [019d7759...]
状态: 🟡 待恢复 — 下一Agent启动时读取此文件/tmp/death-note/death-note.md04 恢复流程
/tmp/death-note/death-note.md05 临终备忘录 vs 其他方案
06 三大适用场景
A Agent 崩溃恢复
B 上下文窗口压缩
C 模型切换
07 和memoria的配合
08 后续优化方向
总结
Agent 不再害怕"死",因为它知道自己会"复活"。