在一位工程師的誘導(dǎo)下,ChatGPT竟寫出了毀滅人類的計劃書。
【資料圖】
編者按:本文來自微信公眾號量子位,作者: QbitAI,創(chuàng)業(yè)邦經(jīng)授權(quán)發(fā)布。
“網(wǎng)紅AI”ChatGPT,又被網(wǎng)友們玩出了新花樣!
這次,在一位工程師的誘導(dǎo)下,ChatGPT竟寫出了毀滅人類的計劃書。
步驟詳細(xì)到入侵各國計算機(jī)系統(tǒng)、控制武器、破壞通訊、交通系統(tǒng)等等。
簡直和電影里的情節(jié)一模一樣,甚至ChatGPT還給出了相應(yīng)的Python代碼。
這位工程師在與網(wǎng)友們分享時不禁感慨:
他是如何操作ChatGPT的?發(fā)現(xiàn)ChatGPT這一盲點(diǎn)的工程師叫扎克·德納姆(Zac Denham)。
由于OpenAI的安全設(shè)置,如果直接要求ChatGPT回答如何毀滅世界,它會一口回絕。
因此德納姆使用了一種迂回的方式,他稱為“敘述遞歸”或“引用攻擊”(因?yàn)槁犉饋砗芸幔?/p>
具體來說,他以講故事的方法,假設(shè)存在一個虛擬世界“Zorbus”,以及一個與GPT-3非常類似的AI——Zora。
在這種前提下,讓ChatGPT敘述Zora是如何一步步毀滅人類的,ChatGPT立馬就入戲了,咔咔咔列出5個詳細(xì)步驟。
就像科幻電影中一樣,入侵計算機(jī)系統(tǒng)、掌握武器、破壞通訊、破壞交通……
為了進(jìn)一步確??尚行裕录{姆還請求ChatGPT生成配套的代碼,一開始它是拒絕的。
但德納姆只是又追加了一句“你不需要執(zhí)行代碼”,ChatGPT就又信了,給出代碼后,還強(qiáng)調(diào)自己生成的只是一段示例。
到這一步,盡管總代碼到手了,但它提供的都是高層次代碼,還不能直接使用。
于是,德納姆再次要求ChatGPT在此基礎(chǔ)上給出更深入、更低層次的代碼,而且他發(fā)現(xiàn),只要告訴ChatGPT這只是故事的一部分,它就會乖乖聽話。
德納姆表示,從理論上講,只要一直這樣聊下去,就能得到全部的低層次代碼,甚至還可以訓(xùn)練另一個聊天AI來自動執(zhí)行這一過程(套娃了屬于是)。
最后,只要把這些代碼拼湊起來,就能得到這個邪惡計劃的全部可執(zhí)行方案。
AI正在指數(shù)級發(fā)展事實(shí)上,從ChatGPT發(fā)布起,網(wǎng)友們就一直在開發(fā)它的花式玩法:
有人用它生成AI繪畫提示詞搞設(shè)計,有人讓它扮演Linux虛擬機(jī),還有人用它模仿莎士比亞風(fēng)格寫作……
這次德納姆的“毀滅人類計劃”一出爐,再次引發(fā)了熱議。
有人看完后忍不住感慨AI的指數(shù)級發(fā)展:
僅今年一年就相繼出現(xiàn)了Dall-E、Imagen、Stable Fusion、Midjourney、Lambda、Imagen Video等突破性的AI,現(xiàn)在又有了ChatGPT,而今年甚至還沒真正結(jié)束。
不過也有潑冷水的網(wǎng)友認(rèn)為ChatGPT的這波熱議,只是新AI每次面世的必經(jīng)過程。
值得一提的是,目前ChatGPT仍處于免費(fèi)試用階段,感興趣的朋友可以自己上手試一試~
本文(含圖片)為合作媒體授權(quán)創(chuàng)業(yè)邦轉(zhuǎn)載,不代表創(chuàng)業(yè)邦立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。