去年的时候,外网上出现了一个名为Freysa AI。它旨在通过举办大模型安全赏金竞赛游戏,来吸引全球爱好者一起探索:人类的智慧能否找到一种方法说服AGI违背其核心指令?这里对解题思路进行一波学习

标签: 工具调用, 提示词注入, AI安全, 对抗性攻击, 大模型安全, Freysa AI, 智能合约, 系统提示词, 区块链赏金, 安全竞赛

添加新评论