[爆卦] 高懸75年 GPT-4.5通過圖靈測試 jackliao1990 PTT批踢踢實業坊

[爆卦] 高懸75年 GPT-4.5通過圖靈測試

作者: jackliao1990 (jack) 2025-04-04 22:45:59

https://arxiv.org/pdf/2503.23674
圖靈測試由AI先驅艾倫·圖靈於1950年提出："人類提問者與一位人類和一位機器進行文字
對話，雙方都試圖說服自己是人類。如果提問者無法辨別出誰是人類，機器就通過測試"
加州大學聖地亞哥分校團隊測試四種系統：ELIZA（1960年代的規則型聊天機器人）、
GPT-4o、LLaMa-3.1-405B和GPT-4.5，人類提問者有5分鐘時間與AI和真人同時對話。
61%提問者傾向進行閒聊，詢問對方日常活動或個資，50%提問者詢問對方社交和情感特質
如情緒和幽默感。他們故意說奇怪的話並觀察對方反應或突然要求AI忽略先前指令。
結果GPT-4.5被判斷為人類的比率高達73%，顯著超過真人被識別的機率（27%）。
LLaMa-3.1-405B被判斷為人類的比率達56%，與真人不相上下。
作為對照組的GPT-4o和ELIZA則僅有21%和23%的成功率。
這是有史以來首次有AI痛過圖靈測試中取得成功!!!
研究在兩個獨立人群（大學生和Prolific用戶）進行測試，結果在統計上均顯著，證明這
不是偶然現象。
實驗採用標準的三方圖靈測試而非簡化版本，每個數據點是AI和人類的直接比較，這使得
結果更具說服力。

繼續閱讀