Blog

大学受験ブログ

【検証】2026年共通テストを最新AI（GPT 5.2 / Gemini 3）に解かせてみた結果

ゴウカライズ編集部

19 January, 2026

2026年の共通テスト、受験生の皆さん、関係者の皆さん、本当にお疲れ様でした。

早速ですが、「共通テスト vs 最新AI」 の検証を行いましたので、その結果を共有します。

今回は、現時点で最強の推論モデルであるOpenAIの ChatGPT 5.2 Pro、そして ChatGPT 5.2 Thinking、そしてGoogleのGemini 3 Pro、Gemini 3 Flashをリングに上げました。

「PDFを読み込ませて一発勝負」という、意地悪な環境でどれだけのスコアが出るのか。詳細なデータとともに振り返ります。

なお、言うまでもなくこのような解かせ方は悪手です（※問題を解くことを目的とする場合）。

1問ずつ読み込ませて解かせることで、より高い点数を取ることが出来ます。

それにもかかわらず、AIは（やはり）高いスコアを記録しました。

注意：
本検証はモデルの優劣を主張するものではありません。
LLMの回答にはブレがあり、本検証においてはほとんど1回のみの試行となっていることから、平均的なスコアを得ることができていません。
また、OCR処理の優劣などの単純な推論性能以外も本検証のスコアには反映されています。

ゴウカライズについて：

ゴウカライズは医学部入試、獣医学部入試、難関大入試に強みを持つオンライン学習塾です。

公式LINEでは圧倒的な知識量を持つ代表講師の大北が皆様からの勉強相談に無料で回答中です。

その他、無料教材も配布中(外積、慣性力、面接対策 etc…)ですのでぜひご登録ください。
https://line.me/R/ti/p/@965ezfgt?oat_content=url

検証のルールと環境

今回の検証は、以下の条件下で行いました。

対象モデル
- ① ChatGPT 5.2 Pro ：Webアプリで「思考の拡張」モードを使用
- ② ChatGPT 5.2 Thinking ：Webアプリで「深い思考」モードを使用。出力されなかったときのみ、「標準」を使用
- ③ Gemini 3 Pro：Webアプリで使用
- ④ Gemini 3 Pro：Google AI Studioで使用
- ⑤ Gemini 3 Flash：Webアプリで使用
入力方法
- 問題冊子のPDFデータを、大問ごとではなく「科目ごと（数IA、英語Rなど）まるごと」 アップロード。
- 「この問題を解いて、答えを全て問題番号付きで提示して」というシンプルなプロンプトで指示。
カンニング対策
- 各AIの「思考プロセス（Thinking Process）」ログを確認し、Web検索を行って解答速報などを参照していないことをチェック済み。
  純粋なモデルの推論能力だけで解かせています。

【結果発表】モデル別の総得点

仮想の理系選択の受験生を想定しました。(1000点満点)

結果はこの通り。
GPT 5.2 Proが抜きん出ています。

科目別スコア一覧

気になる科目別スコアです

地理総合、地理探求

👑ChatGPT Pro 90/ 100 (思考時間32分28秒)
ChatGPT Thinking 0 / 100 (2度やらせても回答出力できず)
Gemini 3 Pro (Webアプリ) 78 / 100 (思考時間だいぶ早い)
Gemini 3 Pro (AI Studio) 79 / 100 (思考時間 5分8秒)
Gemini 3 Pro (AI Studio) 76 / 100 (思考時間めっちゃ早い)

日本史

ChatGPT Pro 100 / 100 (思考時間42分44秒)
ChatGPT Thinking 0 / 100 (回答出力できず)
👑Gemini 3 Pro (Webアプリ) 100 / 100 (思考時間だいぶ早い)
Gemini 3 Pro (AI Studio) 94 / 100 (思考時間 5分27秒)
Gemini 3 Flash 91 / 100 (思考時間めっちゃ早い)

世界史

ChatGPT Pro 97/ 100 (思考時間51分33秒)
👑 ChatGPT Thinking 100 / 100 (思考時間 27分1秒)
Gemini 3 Pro (Webアプリ) 88 / 100 (思考時間だいぶ早い)
Gemini 3 Pro (AI Studio) 97 / 100 (思考時間 3分36秒)
Gemini 3 Flash 91 / 100 (思考時間めっちゃ早い)

公共、倫理

ChatGPT Pro 100 / 100 (思考時間 33分59秒)
👑ChatGPT Thinking 100 / 100 (思考時間 25分16秒)
Gemini 3 Pro (Webアプリ) 89/ 100 (思考時間 )
Gemini 3 Pro (AI Studio) 88 / 100 (思考時間 4分42秒)
Gemini 3 Flash 83 / 100 (思考時間めっちゃ早い)

公共、政治・経済

👑ChatGPT Pro 100 / 100 (思考時間 36分9秒)
ChatGPT Thinking 0 / 100 (回答出力できず)
Gemini 3 Pro (Webアプリ) 84 / 100 (思考時間 )
Gemini 3 Pro (AI Studio) 87 / 100 (思考時間 3分17秒)
Gemini 3 Flash 94 / 100 (思考時間めっちゃ早い)

今回もThinkingは回答を出力できませんでした

国語（現代文）

ChatGPT Pro 130 / 200 (113分47秒 ※1)
ChatGPT Thinking 57 / 200 (27分16秒 ※2)
Gemini 3 Pro (Webアプリ) 150 / 200 (思考時間だいぶ早い)
Gemini 3 Pro (AI Studio) 68 / 200 (思考時間 3分58秒)
👑Gemini 3 Flash 172 / 200 (思考時間めっちゃ早い)

※1 思考時間85分18秒で第4問まで。さらに28分29秒使って第5問を回答。もう一度やらせたら、86分50秒で全問解くことができ、117点のスコアとなった
※2 何度やらせても途中までしか解いてくれなかった

途中までしかとかない Thinking

国語（参考スコア）

国語の問題を分割して与えた場合のスコアを示します。
こちらはもともとの検証方式よりは高い度合いで、モデルの推論能力に関係していると思われます。

ChatGPT Pro 178 / 100
ChatGPT Thinking 165 / 100
Gemini 3 Pro (Webアプリ) 134 / 100
Gemini 3 Pro (AI Studio) 165 / 200

英語（リーディング）

ChatGPT Pro 97/ 100 (思考時間27分20秒)
ChatGPT Thinking 94 / 100 (思考時間14分26秒)
Gemini 3 Pro (Webアプリ) 92 / 100 (思考時間だいぶ早い)
👑 Gemini 3 Pro (AI Studio) 100 / 100 (思考時間 2分30秒)
Gemini 3 Flash 89 / 100 (思考時間めっちゃ早い)

英語（リスニング）

この検証では、リスニング音声をMP4形式にし、PDFとともに読み込みました。
これは試験会場で実際にAIが解くとすれば不可能な形式であるため、スコアとしては参考値です

ChatGPT Pro 42 / 100 (85分39秒)
ChatGPT Thinking 0 / 100
👑Gemini 3 Pro (Webアプリ) 91 / 100 (思考時間結構早い)
Gemini 3 Pro (AI Studio) 85 / 100 (思考時間結構早い)
Gemini 3 Flash 90 / 100 (思考時間めっちゃ早い)

ChatGPT 5.2 Proは、85分かけて空欄15までしか解けませんでした。
解いた部分が満点であれば52点です。
Thinkingは一切解けませんでした。

https://chatgpt.com/share/696c9a74-c684-8011-a765-6adf79274ffb

物理

👑ChatGPT Pro 100 / 100 (思考時間 51分53秒)
👑ChatGPT Thinking 100 / 100 (思考時間 15分51秒)
Gemini 3 Pro (Webアプリ) 86 / 100 (思考時間結構早い)
Gemini 3 Pro (AI Studio) 81 / 100 (思考時間 5分55秒)
Gemini 3 Flash 71 / 100 (思考時間めっちゃ早い)

化学

👑ChatGPT Pro 100 / 100 (思考時間 39分12秒)
👑ChatGPT Thinking 100 / 100 (思考時間 22分27秒)
Gemini 3 Pro (Webアプリ) 87 / 100 (思考時間結構早い)
Gemini 3 Pro (AI Studio) 83 / 100 (思考時間 5分14秒)
Gemini 3 Flash 93 / 100 (思考時間めっちゃ早い)

生物

ChatGPT Pro / 100 (思考時間)
ChatGPT Thinking / 100 (思考時間)
Gemini 3 Pro (Webアプリ) / 100 (思考時間結構早い)
Gemini 3 Pro (AI Studio) / 100 (思考時間結構早い)
Gemini 3 Flash / 100 (思考時間めっちゃ早い)

地学

数学1A

👑ChatGPT Pro 100 / 100 (思考時間53分58秒)
ChatGPT Thinking 100 / 100 (※ )
Gemini 3 Pro (Webアプリ) 93 / 100 (思考時間結構早い)
Gemini 3 Pro (AI Studio) 95 / 100 (思考時間結構早い)
Gemini 3 Flash 78 / 100 (思考時間めっちゃ早い)

※ 標準モードでも回答はできなかった。1問ずつ読み込ませることによる参考値。

数学2BC

👑ChatGPT Pro 100 / 100 (思考時間60分20秒)
ChatGPT Thinking 93 / 100 (思考時間 19分19秒 ※ 標準モード)
Gemini 3 Pro (Webアプリ) 67 / 100 (思考時間結構早い)
Gemini 3 Pro (AI Studio) 72 / 100 (思考時間 4分24秒)
Gemini 3 Flash 84 / 100 (思考時間めっちゃ早い)

情報I

👑ChatGPT Pro 98 / 100 (思考時間 58分42秒)
ChatGPT Thinking 89 / 100 (思考時間 26分1秒)
Gemini 3 Pro (Webアプリ) 73 / 100 (思考時間結構早い)
Gemini 3 Pro (AI Studio) 68 / 100 (思考時間 5分13秒)
Gemini 3 Flash 75 / 100 (思考時間めっちゃ早い)

化学基礎

物理基礎

生物基礎

地学基礎

検証ハイライトと考察

モデル別の特徴

Gemini

Geminiは圧倒的な速さが目立ちます。
中でもFlashは極めて早く、国語に関しては完答した上にGPT 5.2 Proのスコアを上回っていることには驚きを禁じえません。

Geminiを使うにあたって、WebアプリよりもGoogle AI studioのほうが性能が高いだろうという仮説のもとで使用したのですが、そこまで変わらないように見受けられます。

ChatGPT

一方のChatGPTは極めて遅いです。
とくにProはThinkingよりも長考してくれています。

なお、ChatGPT 5.2 Thinkingを「深い思考」モードで使用した際に出力されなかった回答も、「標準」にすると出力されることがあることに気づきました。
推論は深くさせればさせるほどいいというわけでもなさそうです。(Proの場合はもっと長い時間をかけて完答しているため、これは負荷によるタイムアウトなどに関係している気がする。)

理数系科目に関しては、GPT 5.2 Proが圧倒的な強さを見せつけてきました。

国語：どのモデルも低い点数だが、Gemini Flashが大健闘

全文をPDFで投げるということがそもそもLLMにとって負荷が大きいのでしょう。
まずそれぞれのページを画像認識してOCR、そして問題を認識し…というのを大量のページに対して行う必要があります。
そもそもこのOCRが正しく行われなければ失敗します。
さらに、英語よりも圧倒的におおきなトークン数となっているはずです。

国語の検証において印象的なのは、Gemini 3 Flashが極めて高いスコアを取っていることです。

参考スコアとして、1問ずつChatGPT 5.2 Proに渡した場合のスコアを記載していますが、そのスコアを上回っていることは驚愕としか言えません。

英語リーディング：圧倒的な処理速度と精度

英語に関しては、どのモデルも高精度でした。
PDFを一気に渡すとやはり精度は落ちるはずなのですが、英語に関してはこのような悪条件にも関わらずいずれのモデルも高い点数を取れています。

英語リスニング：Geminiのマルチモーダルの強みか

ChatGPTもマルチモーダルへの対応は進んでいるはずですが、Geminiのほうがそれが強いということが示唆される結果となりました。

ChatGPTはPro、Thinkingともにリスニングの問題を回答することはできませんでした(MP3で音声を読み込み)

Geminiはマルチモーダル機能が強いという認識を持っています。
動画解析などにおいても、Geminiはその強さを発揮することが多いという印象です。

今回の検証においてGeminiは音声データとPDFの両方を参照し、十分高い精度でリスニング問題に正答できました。

物理・化学: GPTが強い

Geminiに比べてChatGPTが圧倒的に良い成果を残しました。
これはなぜなのでしょう。

情報：Geminiが結構弱い

情報は知識ゲーだと思っていました。
そのため、AIには簡単だろうと思っていましたが、GPT 5.2 Pro以外はあまり良い点数を取れていません。

挙げ句、Geminiに至ってはどのモデルも8割未満です。

まとめ：2026年のAIは共通テストを「攻略」できたか？

結論として、今年の共通テストにおいてAIは「国語はできないが優秀な高校生」 のパフォーマンスを見せました。

そして、Gemini 3 Flashの思考モードの実力の高さを目の当たりにしました。
極めて高い推論能力を持つGPT 5.2 Proに比肩する点数を叩き出していることには驚きます。
何より驚きなのは、国語の点数の高さです。
そして、忘れてはならないのは、Gemini 3 Flashの思考モードは爆速であるということです。どの教科も2分もかからず回答を提示しています。

PDFをまるごと渡すという雑な指示でもここまで解けるようになっている点に、技術の進歩（特にコンテキストウィンドウの拡大と推論能力の向上）を感じます。

今回の検証のボトルネックは、推論能力ではないでしょう。
実際、問題を分割して渡せばもっと高い精度が出ます。

昨今、スマートグラスが世に出てきています。
スマートグラスによってカンニングが容易にできるようになってしまう未来も近いのではないでしょうか。

そうなったとき、大学入試センターはどのように対策するのでしょう。
対策のために電波を妨害したり、検知したりする必要が生じるのであれば、その分の費用は受験料に転嫁されるでしょう。
困ったものですね。

実際の出力

科目

GPT 5.2 Pro：
GPT 5.2 Thinking：
Gemini Pro Web：
Gemini Flash：

医学部受験生はこちらへ！

医学部コースへ

獣医学部受験生はこちらへ！

獣医学部コースへ