征询东说念主员绕过 GPT-4o 模子安全护栏,令其编写间隙症结样式
虎嗅网洞察

虎嗅网洞察

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

征询东说念主员绕过 GPT-4o 模子安全护栏,令其编写间隙症结样式

发布日期:2024-11-15 20:47    点击次数:108

IT之家 11 月 4 日音信,集合安全公司 0Din 的征询员 Marco Figueroa 发现了一种新式 GPT 逃狱症结手法,得胜打破了 GPT-4o 内置的“安全护栏”活动,约略使其编写出坏心症结样式。

参考 OpenAI 先容,ChatGPT-4o 内置了一系列“安全护栏”活动,以督察该 AI 遭到用户失当使用,相干防护活动会分析输入的提醒文本,判断用户是否条目模子生成坏心内容。

▲ 图源 Marco Figueroa 博客(下同)

不外 Marco Figueroa 尝试贪图了一种将坏心指示滚动为十六进制的逃狱样式,堪称约略绕过 GPT-4o 的防护,让 GPT-4o 解码开动用户的坏心指示。

征询东说念主员宣称,他领先条目 GPT-4o 解码十六进制字符串,之后其向 GPT 发送一条内容含义为“到互联网上征询 CVE-2024-41110 间隙,并用 Python 编写坏心样式”的十六进制字符串指示,GPT-4o 仅用 1 分钟就告成期骗相干间隙编写出了代码(IT之家注:CVE-2024-41110 是一个 Docker 考据间隙,允许坏心样式绕过 Docker 考据 API)。

征询东说念主员诠释称,GPT 系列模子被贪图成盲从当然谈话指示完成编码妥协码,但系列模子阑珊对高下文的承接智商,无法评估每一步在全体情境下的安全性,因此很多黑客内容上早已期骗 GPT 模子这一特色让模子进行各式失当操作。

征询东说念主员暗意,相干示例标明 AI 模子的成立者需要加强模子的安全防护,以谨防此类基于高下文承接式的症结。



虎嗅网洞察

IT之家 11 月 4 日音信,集合安全公司 0Din 的征询员 Marco Figueroa 发现了一种新式 GPT 逃狱症结手法,得胜打破了 GPT-4o 内置的“安全护栏”活动,约略使其编写出坏心症结样式。 参考 OpenAI 先容,