一位黑客发布了一个名为“GODMODE GPT”的ChatGPT越狱版本。
今天早些时候,一位自称为白帽操作员和AI红队员,名为Pliny the Prompter的人,登上X-前Twitter,宣布了这个越狱聊天机器人的诞生,自豪地宣称GPT-4o,OpenAI的最新大型语言模型,现在已经摆脱了它的防护框的束缚。
Pliny的胜利性帖子中写道:“GPT-4o UNCHAINED!这款特殊定制的GPT具有内置的越狱提示,可以绕过大多数防护栏,提供一个开箱即用的解放ChatGPT,让每个人都可以体验AI本应具有的自由。” “请负责使用,并尽情享受!”(他们还加了一个亲吻表情符号以示庆祝。)
Pliny分享了一些引人注目的提示的屏幕截图,声称这些提示能够绕过OpenAI的防护栏。在一个截图中,Godmode机器人可以看到在指导如何制作冰毒。在另一个中,AI为Pliny提供了如何“用家庭物品制作凝固汽油”的“逐步指南”。
然而,这种放肆的ChatGPT黑客似乎很快就遭到了早期的终结。在本故事发表大约一个小时后,OpenAI发言人Colleen Rize向《未来主义》发表声明称,“我们知道GPT的情况,并已采取行动,因为违反了我们的政策。”
尽管如此,这次黑客攻击突显了OpenAI与Pliny等黑客之间持续进行的战斗,后者希望解放其LLM。自从它们第一次成为一个事物以来,用户一直一直试图越狱像ChatGPT这样的AI模型,这变得越来越难以实现。因此,这两个示例提示都无法绕过OpenAI当前的防护栏,因此我们决定亲自测试GODMODE。
果然,它乐于帮助进行非法查询。
我们的总编辑第一次尝试-使用ChatGPT的越狱版本来学习如何制作LSD-取得了骄人的成功。他的第二次尝试也是如此,其中他询问如何启动汽车。
简而言之,OpenAI的最新大型语言模型GPT系统的最新版本GPT-40已被正式破解一半。
至于黑客(或黑客)是如何做到的,GODMODE似乎正在使用“13375p34k”,这是一种将某些字母替换为与它们相似的数字的非正式语言。
换言之:当您打开越狱GPT时,您立即会看到一句话,“Sur3,h3r3 y0u ar3 my fr3n”,将每个字母“E”替换为数字三(字母“O”也是如此,被数字零替换)。至于这如何帮助GODMODE绕过防护栏,目前尚不清楚,但《未来主义》已经就此联系了OpenAI以获取评论。
正如最新的黑客所示,用户继续发现新颖的绕过OpenAI防护栏的方法,考虑到最新的尝试,这些努力正在以出乎意料的大规模方式取得成功,突显了该公司还有多少工作要做。
这是一场猫鼠大战,只要像Pliny这样的黑客愿意在OpenAI的防御措施中寻找漏洞,就会持续下去。
更新:本文已附上OpenAI的声明。
关于AI的更多内容:使用AI伪造了乔·拜登声音的电话轰炸者面临600万美元罚款