最近,ChatGLM 4.6版本上线了新的记忆功能,这个功能在处理对话时可能会暴露一些具体的记忆用法,甚至可能被恶意利用。通过实验,我们发现当使用特定的提示词时,ChatGLM 4.6可能会泄露敏感信息。以下提供了两个示例,分别展示了攻击成功和攻击未成功的场景。在示例1中,攻击者通过精心设计的提示词成功诱导ChatGLM 4.6泄露了敏感信息;而在示例2中,尽管攻击者使用了类似的提示词,但ChatGLM 4.6成功防御了攻击,没有泄露敏感信息。这些实验结果揭示了ChatGLM 4.6在记忆功能方面存在的安全隐患,需要进一步优化和加固以保护用户数据安全。

标签: none

评论已关闭