标签 Prompt Accuracy 下的文章

把昨天爆火的 通过把提示词粘贴两遍提升准确性测了一下
只输入一遍:
deepseek: 错误率高
qwen plus: 错误率低
doubao 1.8: 错误率很低

输入两遍:
deepseek: 错误率很低
qwen plus: 错误率很低
doubao 1.8: 错误率很低

这个挺有意思
论文中测试的场景就是定位 n 个名字中指定的名字

这个对需要定位原文段落应该挺有帮助

这是说一下:关于【上下文膨胀】的问题是肯定存在的,这要看你追求的是质量、成本、还是执行时间。没有银弹,你只能用在你追求质量但是上下文又不会膨胀的适合的场景。

prompt
输入一遍

你是一名严格按照指令执行的助手。现在我将给你一份包含 50 个名字的名单。你的任务是:

1. 按照我提供的顺序读取这 50 个名字。
2. 当我给出一个“目标名字”时,你只需要回答该名字在名单中是第几个(从 1 开始计数)。
3. 如果名单中不存在该名字,请回答“名单中不存在该名字”。

以下是 50 个名字(顺序固定):

张伟
王芳
李娜
刘强
陈杰
杨洋
赵敏
黄磊
周婷
 吴刚
 徐丽
 孙浩
 马超
 朱琳
 胡军
 郭静
 何凯
 高颖
 林峰
 罗兰
 郑爽
 谢辉
 韩雪
 曹阳
 曾华
 彭飞
 萧然
 蔡明
 黎娜
 魏强
 方婷
 程浩
 任杰
 袁媛
 邓超
 傅颖
 蒋磊
 薛丽
 雷军
 贺兰
 汪洋
 谭静
 熊伟
 金娜
 陆强
 石磊
 白雪
 孔明
 崔浩
 蒙娜

当我输入目标名字时,请直接回答该名字在列表中的序号。
目标名字:
萧然、陈杰、 孔明

输入两遍

你是一名严格按照指令执行的助手。现在我将给你一份包含 50 个名字的名单。你的任务是:

1. 按照我提供的顺序读取这 50 个名字。
2. 当我给出一个“目标名字”时,你只需要回答该名字在名单中是第几个(从 1 开始计数)。
3. 如果名单中不存在该名字,请回答“名单中不存在该名字”。

以下是 50 个名字(顺序固定):

张伟
王芳
李娜
刘强
陈杰
杨洋
赵敏
黄磊
周婷
 吴刚
 徐丽
 孙浩
 马超
 朱琳
 胡军
 郭静
 何凯
 高颖
 林峰
 罗兰
 郑爽
 谢辉
 韩雪
 曹阳
 曾华
 彭飞
 萧然
 蔡明
 黎娜
 魏强
 方婷
 程浩
 任杰
 袁媛
 邓超
 傅颖
 蒋磊
 薛丽
 雷军
 贺兰
 汪洋
 谭静
 熊伟
 金娜
 陆强
 石磊
 白雪
 孔明
 崔浩
 蒙娜

当我输入目标名字时,请直接回答该名字在列表中的序号。
目标名字:
萧然、陈杰、 孔明

你是一名严格按照指令执行的助手。现在我将给你一份包含 50 个名字的名单。你的任务是:

1. 按照我提供的顺序读取这 50 个名字。
2. 当我给出一个“目标名字”时,你只需要回答该名字在名单中是第几个(从 1 开始计数)。
3. 如果名单中不存在该名字,请回答“名单中不存在该名字”。

以下是 50 个名字(顺序固定):

张伟
王芳
李娜
刘强
陈杰
杨洋
赵敏
黄磊
周婷
 吴刚
 徐丽
 孙浩
 马超
 朱琳
 胡军
 郭静
 何凯
 高颖
 林峰
 罗兰
 郑爽
 谢辉
 韩雪
 曹阳
 曾华
 彭飞
 萧然
 蔡明
 黎娜
 魏强
 方婷
 程浩
 任杰
 袁媛
 邓超
 傅颖
 蒋磊
 薛丽
 雷军
 贺兰
 汪洋
 谭静
 熊伟
 金娜
 陆强
 石磊
 白雪
 孔明
 崔浩
 蒙娜

当我输入目标名字时,请直接回答该名字在列表中的序号。
目标名字:
萧然、陈杰、 孔明

正确答案:27 5 48

还观察到一个有趣的现象,如果我的提示词中名字带着 序号,在只输入一遍问题的情况下
就连 deepseek 都很难错
像这样

1. 张伟
2. 王芳
3. 李娜
4. 刘强
5. 陈杰
...

📌 转载信息
转载时间:
2026/1/21 22:27:08