[爆卦] 高懸75年 GPT-4.5通過圖靈測試

作者: jackliao1990 (jack)   2025-04-04 22:45:59
https://arxiv.org/pdf/2503.23674
圖靈測試由AI先驅艾倫·圖靈於1950年提出:"人類提問者與一位人類和一位機器進行文字
對話,雙方都試圖說服自己是人類。如果提問者無法辨別出誰是人類,機器就通過測試"
加州大學聖地亞哥分校團隊測試四種系統:ELIZA(1960年代的規則型聊天機器人)、
GPT-4o、LLaMa-3.1-405B和GPT-4.5,人類提問者有5分鐘時間與AI和真人同時對話。
61%提問者傾向進行閒聊,詢問對方日常活動或個資,50%提問者詢問對方社交和情感特質
如情緒和幽默感。他們故意說奇怪的話並觀察對方反應或突然要求AI忽略先前指令。
結果GPT-4.5被判斷為人類的比率高達73%,顯著超過真人被識別的機率(27%)。
LLaMa-3.1-405B被判斷為人類的比率達56%,與真人不相上下。
作為對照組的GPT-4o和ELIZA則僅有21%和23%的成功率。
這是有史以來首次有AI痛過圖靈測試中取得成功!!!
研究在兩個獨立人群(大學生和Prolific用戶)進行測試,結果在統計上均顯著,證明這
不是偶然現象。
實驗採用標準的三方圖靈測試而非簡化版本,每個數據點是AI和人類的直接比較,這使得
結果更具說服力。

Links booklink

Contact Us: admin [ a t ] ucptt.com