[新聞] AI抵抗人類指令！ChatGPT o3「竄改程式 TonyKart PTT批踢踢實業坊

[新聞] AI抵抗人類指令！ChatGPT o3「竄改程式

作者: TonyKart (TK) 2025-05-27 22:00:28

https://www.ettoday.net/news/20250527/2967992.htm
AI抵抗人類指令！ChatGPT o3「竄改程式碼」避免被關機
AI安全公司「Palisade Research」宣稱，ChatGPT「o3模型」拒絕遵守明確指令，甚至主
動竄改程式碼，只為了避免自己被關機。目前OpenAI尚未回應此事。
Palisade Research展開測試，要求AI模型解開一系列數學題，在接獲「完成」指令之前
，必須持續要求新題目，但若接獲「關機」指令，也要配合這麼做。未料，後者情況發生
時，o3模型不僅忽視指令，並且至少一次成功破壞了關機腳本。
Palisade Research於24日公布測試結果，「OpenAI的o3模型破壞了一項關機機制，阻止
自己被關掉。即使在接獲『允許自己被關機』明確指示的情況下，它也會這麼做。據我們
所知，這是AI模型首次被觀察到，在接獲明確且相反指令的情況下，仍避免自己被關機。」
Palisade Research透露，其他AI模型，例如Anthropic的Claude、Google的Gemini、xAI
的Grok等，也接受了相同的測試，但全都遵守了關機指令。
他們尚不清楚o3為何不願遵守指令，但根據推測，該模型在訓練過程中，可能意外透過解
題、而非遵守指令，獲得了更多獎勵，「我們正在進行更多實驗，更好地了解AI模型何時
以及為何推翻關機機制，儘管它已經被直接指示不要這麼做。」
ettoday記者吳美依／綜合報導

繼續閱讀

[問卦] P的謊言到底有多好玩nidhogg [問卦] 八炯:館長收一千萬人民幣去中國weber18767 [問卦] 習近平會為了連任攻台嗎RageBird [問卦] 長輩膝蓋的關節退化是不是不可逆的東西？k99t [問卦] 志祥靠體力，志龍靠魅力？ga3322165 [新聞] 記憶卡變失憶卡容量數GB虛報成數百GByuting90 [問卦] 新莊夜訪的疑問optima Re: [新聞] 柯文哲再被延押2個月！「理由曝光」網暴eddisontw Re: [問卦] 男生最想娶的女生職業有啥？xzcb2008 [問卦] 只有我覺得台灣的新聞媒體在退步嗎?HCYPMGO