分享一下目前的开源工作，针对 ACGN 领域的 CoT 翻译模型以及适配的推理前端，可以简单的在本地翻译字幕和电子书和任意文本原样输出。目前 ACGN 领域 Sota 的翻译效果。

时间: 2026-02-27

分类:

首先，简单介绍一下工作。这是一个针对轻小说,galgame 等 ACGN 领域文本翻译而训练的翻译模型。相比其他的翻译模型的主要优点是:

采用了任务针对性的 CoT 过程，针对任务的困难点（如人称，主被动，场景等进行了针对性设计）
采用平均长度 1500 字以上的长段落进行训练,以获得更好的上下文能力
在训练集的选择中尝试引入了前沿的核心集选择算法进行筛选。

模型具体情况: 目前训练了 8b 和 14b 两个参数的模型，共使用 8xH100 全量微调约 2 天。底模是 Sakura-Qwen3-Base ，在此感谢 sakura 和 qwen 的贡献为本工作节省了大量 PT 和 CPT 的时间。

模型的具体效果， 可以参考我们在这里的测试，使用 COMET (wmt22-comet-da) 指标测试了共 200 个段落级别的数据，效果优于 Gemini3.0pro 以及 claude4.5opus 等 sota 闭源商业模型。用户的反馈结果和实际检查下来也很不错，在 ACGN 领域有着很强的翻译效果，并且还有一点，没有审查，可以翻译某些不可言说的东西（）