Agent"死机"了？上下文爆了？换模型失忆了？

你有没有经历过这些崩溃时刻？

调试了大半天，Agent 突然挂掉，一切要从头来过...

上下文已经塞了 3 万 token，输出质量断崖式下跌...

套餐用完切换模型，新 Agent 上线："你好，我是你的新助手"，前面聊的全忘了...

这些问题我们全都踩过，而且踩得很惨。今天分享一个我们觉得设计得很妙的解法：临终备忘录机制。

01 三个"死亡场景"，每个都踩在肺上

01 Agent突然挂掉

正在进行复杂的代码重构，十几轮对话、几百次工具调用，眼看就要收尾——啪，进程崩了。

"你好，我是你的 AI 助手，有什么可以帮你？"

我刚才在干什么？配置是什么？做到哪一步了？——全部忘光。

02 上下文窗口爆炸

长任务跑着跑着，输出开始变奇怪——决策前后矛盾、工具调用重复、模型开始"幻觉"。

上下文超过 40% 质量阈值，模型开始丢失早期信息

压缩哪段？压缩后怎么衔接？搞不好比崩溃还乱。

03 模型切换后失忆

用的模型套餐达上限，切换到另一个模型。新模型：

"你好，我是新模型，请告诉我你需要什么帮助"

不记得项目背景、不记得方案决策、不记得用户偏好。切换一次，调教一遍。

02 我们的解法：临终备忘录

核心理念

人死之前要写遗嘱，Agent "死"之前，为什么不能写一份"临终备忘录"？

当 Agent 检测到自己即将"死亡"（重启/压缩/切换）时，主动写下备忘录，把自己正在做的事、做到哪一步、下一步该干什么，全部记录下来。

下一次启动时，先读备忘录，无缝衔接。

触发方式	场景
主动指令	用户说"我要重启了" / "保存进度" / "写临终备忘录"
自动标记	工具调用 ≥20 时，提示用户"是否保存 checkpoint？"

03 备忘录写什么？

临终备忘录 (Death Note)
# 生成时间: 2026-04-10 20:33 | 状态: 🟡 待恢复

## 1. 身份信息
- Agent类型: Hermes
- 用户: 律麟
- 当前项目: 半导体产线智能体

## 2. 临终前正在做的事
- 任务: 调试大盘产出预测模型
- 当前步骤: 第3轮参数调优，已跑通baseline
- 已完成: 数据清洗 / 特征工程 / baseline模型
- 阻塞点: 预测误差率偏高，怀疑是X特征缺失
- 下一步: 补充X特征，重新训练

## 3. 核心约束
- 用户偏好: 直击重点，不要废话
- 项目规则: 先读源码再动手

## 4. 关键配置
- 模型: MiniMax-M2.5
- memoria相关记忆ID: [019d7759...]

状态: 🟡 待恢复 — 下一Agent启动时读取此文件

📍 共享路径（跨Agent通用）：

/tmp/death-note/death-note.md

所有 Agent 共享同一个路径，备忘录写完放在这里，下一个 Agent 启动时自动读取。恢复后自动删除，避免重复恢复。

04 恢复流程

Agent 启动
检查临终备忘录是否存在

/tmp/death-note/death-note.md

存在？→ 读取 → 执行恢复 → 删除备忘录

不存在？→ 正常启动

连接 memoria 验证连通性

检索相关记忆（上次做到哪、踩过什么坑）

开始工作

无缝衔接，上下文完整

05 临终备忘录 vs 其他方案

06 三大适用场景

A Agent 崩溃恢复

💀崩溃前：临终备忘录写入（当前任务 + 上下文快照）

↓ （或：自动触发长任务 checkpoint）

🔄重启后：读备忘录 → 恢复上下文 → 继续工作

⚡原本 30 分钟的恢复工作，变成 <1分钟自动完成

B 上下文窗口压缩

检测到：上下文 >40% 阈值

↓ 临终备忘录写入（精华摘要 + 当前任务状态）

✂️ 压缩：保留最近对话 + 备忘录摘要作为新上下文开头

▶️ 继续：模型"记得"之前在做什么，只是丢了细节

⚡ 压缩不再是"截断"，而是"有准备的交接"

C 模型切换

📤 原模型：临终备忘录写入（完整状态 + 配置 + 偏好）

↓ 套餐达上限 → 切换新模型

📥 新模型：读取备忘录 + 读取 memoria 历史记忆

💬 "你好，我是新模型。你目前在做半导体项目的大盘预测，上一步在调参，下一步补充X特征——继续？"

🔗 切换模型不再是"失忆重启"，而是"换人不换岗"

07 和memoria的配合

瞬时状态 + 长期经验 = 完整恢复

💀 临终备忘录：解决瞬时状态保存——重启/压缩/切换前，把当前正在做的事、上下文快照全部写入备忘录
☁️ memoria：解决长期经验积累——教训/配置/记忆跨 session 持久化，语义检索随时召回

新 Agent 既知道 "刚才在干啥"，也知道"以前踩过什么坑" —— 完整上下文恢复

08 后续优化方向

自动化触发更智能：目前靠规则（≥20工具调用），未来让AI自己判断"这个时刻值得记录"
压缩和备忘录联动：上下文压缩时自动生成摘要备忘录，而不是等到"死亡"才写
多级 checkpoint：不只是"临终"，任务关键节点都可以打 checkpoint，形成版本链
跨 Agent 接力标准化：临终备忘录路径和格式开放成行业标准，任何 Agent 都能读写

总结

临终备忘录的本质是——给 Agent 装一个"濒死自觉"。它知道自己可能要"死"了，所以在最后一刻把所有关键信息塞进一份备忘录里，放在一个共享位置，下一个Agent 来的时候先读一下，无缝接手。
Agent 不再害怕"死"，因为它知道自己会"复活"。

欢迎体验 Memoria，点击官网链接即可进入 https://thememoria.ai/