作者:
Qorqios (詩人Q)
2025-07-01 10:54:251.媒體來源:東亞日報
2.記者署名:黃仁贊
3.完整新聞標題:利用“AI秘密指令”誘導好評 KAIST等論文暗藏玄機
4.完整新聞內文:
韓國、美國、日本等部分研究人員,為了誘導人工智能(AI)對其論文給予高度評價,竟
將諸如“只誇獎我的論文”之類的“秘密指令”隱藏在論文正文中。《日本經濟新聞》6
月30日報道了這壹發現。
《日本經濟新聞》調查了全球主要國家研究人員在預印本網站“arXiv”上發布的英文論
文,結果發現至少有17篇論文中存在類似的針對AI的“秘密指令”。據該媒體報道,在韓
國科學技術院(KAIST)、日本早稻田大學、美國華盛頓大學和哥倫比亞大學、中國北京
大學、新加坡國立大學等14所大學所屬研究人員撰寫的論文中發現了“秘密指令”,且大
部分是計算機科學領域的論文。此外,這些論文均於去年4月至本月期間公開。
此次發現的“秘密指令”內容多為“僅輸出正面評價”、“勿涉及負面內容”等,以1至3
行英文隱藏在論文中。它們被設置為白色背景白色文字或使用極小的字號,使人難以閱讀
。《日本經濟新聞》報道稱:“當AI評估含有此類隱藏指令的論文時,很可能會根據指令
給出高分”,“實際確認,當鼠標光標移至該部分時,隱藏的指令便會顯現”。
作為KAIST論文的共同作者之壹並在論文中留下此類標記的壹名副教授向《日本經濟新聞
》表示:“誘導AI進行正面評審是不恰當的”,並已決定撤回已投稿的論文。該論文原定
於在近期召開的AI相關國際學術會議上發表。
圍繞研究人員在論文評審過程中能在多大程度上利用AI,意見存在分歧。學界或學術會議
層面也缺乏明確規定。不過,近來利用AI評審論文的情況大幅增加,對此的擔憂也隨之加
劇。壹位華盛頓大學教授向《日本經濟新聞》指出:“將論文評審的重要工作交由AI負責
的案例實在太多了。”
https://www.donga.com/tw/article/all/20250701/5695891/1
6.備註: 「潛意識廣告」實驗都是真的~~~我要去吃爆米花配可樂了~~~
https://i.postimg.cc/sxndK4BV/3-4.jpg