[新聞] GPT-5.2 日本學測類考試奪冠AI 學力逼近 una283 PTT批踢踢實業坊

[新聞] GPT-5.2 日本學測類考試奪冠AI 學力逼近

作者: una283 (無) 2026-01-21 23:09:44

GPT-5.2 日本學測類考試奪冠
AI 學力逼近頂尖考生
January 20, 2026 by TechNews 編輯台
在 1 月 17 日至 18 日舉行的日本大學入學共通測試
中，OpenAI 的最新人工智慧模型 GPT-5.2 表現出
色，成功在 9 個科目中獲得滿分，整體得分率達到
97%。這個成績不僅超越了 Google 的 Gemini 3
Flash（得分率約 91%），還顯示出 AI 在學術能力上
的顯著提升，可能超越人類考生的潛力。
此次測試的實驗由AI新創公司Life Prompt與日本
經濟新聞共同進行，涵蓋多個科目。測試過程中，
問題透過光學字元辨識（OCR）技術從PDF轉換為
Markdown格式，並結合了圖像輸入。根據報告，
GPT-5.2在公共與倫理科目中獲得滿分，並在地理
科目中也表現優異，得分超過80%。然而，該模型
在某些科目中出現超時的問題，顯示出其在處理複
雜問題時的局限性。
與此同時，Google的Gemini 3 Flash在公共與倫
理科目中同樣獲得滿分，但整體得分率約為91%，
不及GPT-5.2。Claude Sonnet 4.5模型的表現也
不容小覷，雖然在公共與倫理科目中得分為97分，
但整體得分卻顯示出與其他模型的差異。
在實際的共通測試中，約有30萬5,104名考生參
加了新設的資訊科目，並且因不當行為而有7名考
生被取消資格。這次測試的平均分數將於1月21日
公布。
這個系列的結果不僅突顯了AI在教育領域的潛力，
也引發了對於未來大學入學考試形式的深思。AI的
進步可能會改變教育的歷史，並引發對於考試公平
性和有效性的討論。
https://technews.tw/2026/01/20/openai-gpt-5-2-japan-test/
————-
看看人家，這才是正常的測試啊～
「透過光學字元辨識（OCR）技術從PDF轉換為
Markdown格式，並結合了圖像輸入」
上篇台灣補習班業者的新聞推文就有網友提醒
PDF的圖文格式AI不好判讀

作者: lovehan (尋找初衷...) 2026-01-21 23:56:00

有一個新考科，情報。

作者: una283 (無) 2026-01-22 05:50:00

他們的考科還真多https://zenn.dev/suiteck/articles/b67a2b9ff72da9測試原文，一共七考科AI計算過程共需一小時上下但是Claude Opus 4.5竟然只要6分8秒算超級快，成績也不錯。得意科目: 化学(93%)、生物(92%)、地学(89%)苦手科目: 数学I・A(67%)、数学II・B・C(69%)總體評價第一名的跟前面學測pdf檔測試相反GPT-5.2（1位: 662点/700点 = 94.6%）得意科目: 生物(100%)、数学I・A(100%)、数学II・B・C(98%)、化学(97%)苦手科目: 物理(86%)而Gemini 3 Pro和Gemini 3 Flash分居二、三位得分629、627点/700点，但Flash在算數A遇到挑戰（グループ問題）得分只有72%也就是說Flash在其他科表現更好

繼續閱讀

[情報] 清華大學高雄校區舉辦紫荊一日營活動una283 [新聞] 教育部將推AI人才淬鍊計畫助力人文創新una283 [討論] 115年個申國英數無頂標且倍率皆八以上una283 [新聞] 誰是最強考生？挑戰115學測這款AI「幾乎una283 Re: [新聞] 從操場到職場運動如何成為孩子的人生隱ComicLo [討論] 115 學測社會lovehan [討論] 115 學測數Blovehan [討論] 115 學測國文lovehan [討論] 115 學測英文lovehan [新聞] 學測第二天溫差10度！北東零星雨中南部una283