ChatGPT、共通テストで9科目満点を達成 AI学力が飛躍的に向上

1月17日と18日に実施された大学入学共通テストにおいて、対話型生成AI「ChatGPT」の最新モデル「GPT-5.2 Thinking」が9科目で満点を獲得したことが、AIベンチャー企業ライフプロンプト（東京）の分析により1月20日に明らかとなりました。

ChatGPTが解答した15科目全体の得点率は97％に達し、文系科目を選択した場合の合計得点は970点、理系科目を選択した場合は968点（いずれも1000点満点）を記録しました。

東大文科1類の受験生が選択する科目に限定しても、同じく97％という高い得点率を示しており、大手予備校の河合塾が予想した、東大文科1類の合格可能性50％のボーダーラインである89％を大きく上回る成績となっています。

満点を獲得した9科目は、「数学1A」「数学2BC」「化学」「物理基礎」「化学基礎」「地学基礎」「生物基礎」「公共、政治・経済」「情報1」です。最も得点率が低かったのは「国語」で90％でした。

この画期的な成績向上は、ここ3年間のAIの急速な進化を物語っています。ライフプロンプトが実施してきた検証では、東大文科1類における科目得点率は2024年が66％、2025年が91％と推移してきました。今回の97％という数字は、わずか2年間でAIの解答精度が急速に向上していることを示しています。

今回の検証では、ChatGPT以外にもGoogle「Gemini 3 Pro」とAnthropic「Claude Opus 4.5」も使用しましたが、得点率は91〜94％で、ChatGPTが最も高い成績を記録しました。

AI高精度化の背景と課題

ChatGPTが高い精度を達成できた理由として、ライフプロンプトの分析では、同モデルが「圧倒的な慎重さ」を持っていることが挙げられています。慎重さとは、1問に対して数分間、人間の思考のように自問自答と検算を繰り返してから答えを出力するプロセスのことです。

特に従来苦手であった図形問題では、図形を数値として脳内で再構築する処理能力を獲得したことが、数学1Aでの満点獲得につながったと分析されています。

しかし、この高精度化には大きな代償が存在します。ChatGPTが全科目の解答に要した時間は約5時間30分だったのに対して、GeminiとClaudeは約1時間40分で完了させました。国語の得点率が90%に留まったことや、解答に他のAIの3倍以上の時間を要したことから、高精度化には時間的コストが伴い、苦手分野も依然として存在することが明らかになりました。