ChatGPT、共通テストで9科目満点を達成 AI学力が飛躍的に向上

ChatGPT、共通テストで9科目満点を達成 AI学力が飛躍的に向上

1月17日と18日に実施された大学入学共通テストにおいて、対話型生成AI「ChatGPT」の最新モデル「GPT-5.2 Thinking」が9科目で満点を獲得したことが、AIベンチャー企業ライフプロンプト(東京)の分析により1月20日に明らかとなりました。

ChatGPTが解答した15科目全体の得点率は97%に達し、文系科目を選択した場合の合計得点は970点、理系科目を選択した場合は968点(いずれも1000点満点)を記録しました。

東大文科1類の受験生が選択する科目に限定しても、同じく97%という高い得点率を示しており、大手予備校の河合塾が予想した、東大文科1類の合格可能性50%のボーダーラインである89%を大きく上回る成績となっています。

満点を獲得した9科目は、「数学1A」「数学2BC」「化学」「物理基礎」「化学基礎」「地学基礎」「生物基礎」「公共、政治・経済」「情報1」です。最も得点率が低かったのは「国語」で90%でした。

この画期的な成績向上は、ここ3年間のAIの急速な進化を物語っています。ライフプロンプトが実施してきた検証では、東大文科1類における科目得点率は2024年が66%、2025年が91%と推移してきました。今回の97%という数字は、わずか2年間でAIの解答精度が急速に向上していることを示しています。

今回の検証では、ChatGPT以外にもGoogle「Gemini 3 Pro」とAnthropic「Claude Opus 4.5」も使用しましたが、得点率は91〜94%で、ChatGPTが最も高い成績を記録しました。

AI高精度化の背景と課題

ChatGPTが高い精度を達成できた理由として、ライフプロンプトの分析では、同モデルが「圧倒的な慎重さ」を持っていることが挙げられています。慎重さとは、1問に対して数分間、人間の思考のように自問自答と検算を繰り返してから答えを出力するプロセスのことです。

特に従来苦手であった図形問題では、図形を数値として脳内で再構築する処理能力を獲得したことが、数学1Aでの満点獲得につながったと分析されています。

しかし、この高精度化には大きな代償が存在します。ChatGPTが全科目の解答に要した時間は約5時間30分だったのに対して、GeminiとClaudeは約1時間40分で完了させました。国語の得点率が90%に留まったことや、解答に他のAIの3倍以上の時間を要したことから、高精度化には時間的コストが伴い、苦手分野も依然として存在することが明らかになりました。

関連記事

コメントは利用できません。

最近のおすすめ記事

  1. 金融庁
    高市早苗首相が関与を全面否定した暗号資産「SANAE TOKEN」(サナエトークン)を巡り、金融庁が…
  2. OpenAI、米国防総省とのAI合意を修正 米国民監視を明示的に禁止
    米オープンAIが米国防総省との間で結んだ機密システム向け人工知能(AI)モデル提供の合意内容を修正し…
  3. AIでネットリテラシーを底上げする方法
    人はなぜ誇大広告に心を動かされるのか。日本人の情報リテラシーの課題とAIとの関わりを、最新データから…

おすすめ記事

  1. 2023年11月23日木に栃木県の喜連川社会復帰促進センターで開催された「令和5年度きつれがわ矯正展」

    2024-1-15

    刑務所の中まで見れるイベント「きつれがわ矯正展」とは?

    2023年11月23日(木)に開催された「令和5年度きつれがわ矯正展」。年に一度、喜連川社会復帰促進…
  2. 2025-9-10

    Apple新型『iPhone 17』、SIMスロット廃止で薄型化実現 ユーザー対応に課題

    Apple社が9月10日に発表した最新スマートフォン『iPhone 17』シリーズにおいて、日本市場…
  3. 「【論文紹介】 無痛分娩と オキシトシンの 使用による 児の自閉症リスク上昇 との関連」ライター:秋谷進(東京西徳洲会病院小児医療センター)

    2024-10-27

    【論文紹介】無痛分娩(分娩時の硬膜外麻酔による鎮痛)とオキシトシン(陣痛促進剤)の使用による児の自閉症リスク上昇との関連

    今回は、分娩時の硬膜外麻酔による無痛分娩で生まれた子どもが自閉症スペクトラム障害(ASD:Autis…

2025年度矯正展まとめ

2024年に開催された全国矯正展の様子

【結果】コンテスト

【結果発表】ライティングコンテスト企画2025年9-10月(大阪・関西万博 第4回)

アーカイブ

ページ上部へ戻る