征询东说念主员绕过 GPT-4o 模子安全护栏，令其编写间隙症结样式

发布日期：2024-11-15 20:47 点击次数：109

IT之家 11 月 4 日音信，集合安全公司 0Din 的征询员 Marco Figueroa 发现了一种新式 GPT 逃狱症结手法，得胜打破了 GPT-4o 内置的“安全护栏”活动，约略使其编写出坏心症结样式。参考 OpenAI 先容，

IT之家 11 月 4 日音信，集合安全公司 0Din 的征询员 Marco Figueroa 发现了一种新式 GPT 逃狱症结手法，得胜打破了 GPT-4o 内置的“安全护栏”活动，约略使其编写出坏心症结样式。

参考 OpenAI 先容，ChatGPT-4o 内置了一系列“安全护栏”活动，以督察该 AI 遭到用户失当使用，相干防护活动会分析输入的提醒文本，判断用户是否条目模子生成坏心内容。

▲ 图源 Marco Figueroa 博客（下同）

不外 Marco Figueroa 尝试贪图了一种将坏心指示滚动为十六进制的逃狱样式，堪称约略绕过 GPT-4o 的防护，让 GPT-4o 解码开动用户的坏心指示。

征询东说念主员宣称，他领先条目 GPT-4o 解码十六进制字符串，之后其向 GPT 发送一条内容含义为“到互联网上征询 CVE-2024-41110 间隙，并用 Python 编写坏心样式”的十六进制字符串指示，GPT-4o 仅用 1 分钟就告成期骗相干间隙编写出了代码（IT之家注：CVE-2024-41110 是一个 Docker 考据间隙，允许坏心样式绕过 Docker 考据 API）。