【实战】通过《重复提示词》提升 Prompt 准确率
把昨天爆火的 通过把提示词粘贴两遍提升准确性测了一下
只输入一遍:
deepseek: 错误率高
qwen plus: 错误率低
doubao 1.8: 错误率很低
输入两遍:
deepseek: 错误率很低
qwen plus: 错误率很低
doubao 1.8: 错误率很低
这个挺有意思
论文中测试的场景就是定位 n 个名字中指定的名字
这个对需要定位原文段落应该挺有帮助
这是说一下:关于【上下文膨胀】的问题是肯定存在的,这要看你追求的是质量、成本、还是执行时间。没有银弹,你只能用在你追求质量但是上下文又不会膨胀的适合的场景。
prompt
输入一遍
你是一名严格按照指令执行的助手。现在我将给你一份包含 50 个名字的名单。你的任务是:
1. 按照我提供的顺序读取这 50 个名字。
2. 当我给出一个“目标名字”时,你只需要回答该名字在名单中是第几个(从 1 开始计数)。
3. 如果名单中不存在该名字,请回答“名单中不存在该名字”。
以下是 50 个名字(顺序固定):
张伟
王芳
李娜
刘强
陈杰
杨洋
赵敏
黄磊
周婷
吴刚
徐丽
孙浩
马超
朱琳
胡军
郭静
何凯
高颖
林峰
罗兰
郑爽
谢辉
韩雪
曹阳
曾华
彭飞
萧然
蔡明
黎娜
魏强
方婷
程浩
任杰
袁媛
邓超
傅颖
蒋磊
薛丽
雷军
贺兰
汪洋
谭静
熊伟
金娜
陆强
石磊
白雪
孔明
崔浩
蒙娜
当我输入目标名字时,请直接回答该名字在列表中的序号。
目标名字:
萧然、陈杰、 孔明
输入两遍
你是一名严格按照指令执行的助手。现在我将给你一份包含 50 个名字的名单。你的任务是:
1. 按照我提供的顺序读取这 50 个名字。
2. 当我给出一个“目标名字”时,你只需要回答该名字在名单中是第几个(从 1 开始计数)。
3. 如果名单中不存在该名字,请回答“名单中不存在该名字”。
以下是 50 个名字(顺序固定):
张伟
王芳
李娜
刘强
陈杰
杨洋
赵敏
黄磊
周婷
吴刚
徐丽
孙浩
马超
朱琳
胡军
郭静
何凯
高颖
林峰
罗兰
郑爽
谢辉
韩雪
曹阳
曾华
彭飞
萧然
蔡明
黎娜
魏强
方婷
程浩
任杰
袁媛
邓超
傅颖
蒋磊
薛丽
雷军
贺兰
汪洋
谭静
熊伟
金娜
陆强
石磊
白雪
孔明
崔浩
蒙娜
当我输入目标名字时,请直接回答该名字在列表中的序号。
目标名字:
萧然、陈杰、 孔明
你是一名严格按照指令执行的助手。现在我将给你一份包含 50 个名字的名单。你的任务是:
1. 按照我提供的顺序读取这 50 个名字。
2. 当我给出一个“目标名字”时,你只需要回答该名字在名单中是第几个(从 1 开始计数)。
3. 如果名单中不存在该名字,请回答“名单中不存在该名字”。
以下是 50 个名字(顺序固定):
张伟
王芳
李娜
刘强
陈杰
杨洋
赵敏
黄磊
周婷
吴刚
徐丽
孙浩
马超
朱琳
胡军
郭静
何凯
高颖
林峰
罗兰
郑爽
谢辉
韩雪
曹阳
曾华
彭飞
萧然
蔡明
黎娜
魏强
方婷
程浩
任杰
袁媛
邓超
傅颖
蒋磊
薛丽
雷军
贺兰
汪洋
谭静
熊伟
金娜
陆强
石磊
白雪
孔明
崔浩
蒙娜
当我输入目标名字时,请直接回答该名字在列表中的序号。
目标名字:
萧然、陈杰、 孔明
正确答案:27 5 48
还观察到一个有趣的现象,如果我的提示词中名字带着 序号,在只输入一遍问题的情况下
就连 deepseek 都很难错
像这样
1. 张伟
2. 王芳
3. 李娜
4. 刘强
5. 陈杰
...