【2025年05月】チャットＡＩの数学推論能力をテストしてみた【珍問答集】

ページ内目次

1 前ページまでのあらすじ
2 問５
3 問５採点結果
4 問５総評・所感
5 次ページの内容

前ページまでのあらすじ

当記事独自のＡＩ数学推論能力検証を進めています。

問４では，人間にとってほとんど明らかなことが
ＡＩにとっては必ずしもそうではないという
ケースをお見せしました。

この検証も，いよいよ最後の問題です。

問５

質問の内容

この検証を通して，
図形問題が多くなってしまったなという
反省はあるのですが，次の質問は
個人的にぜひ問いたいものでした。

問５

$\;a\;$を定数として，$\rm\angle\,A=\angle\,C=90^\circ\;$，
${\rm BC+CD}=2\,a\;$となる四角形$\;\rm ABCD\;$の
面積の最大値を求めてください。
また，面積が最大になるのはどのような場合ですか。

入力文：
a を定数として，∠Ａ＝∠Ｃ＝90°，
ＢＣ＋ＣＤ＝2a となる四角形ＡＢＣＤの
面積の最大値を求めてください。
また，面積が最大になるのはどのような場合ですか。

参考図

問５は，次の図のような四角形のうち，
面積が最大になるのはどのような形か？
そしてその面積の最大値は？という質問です。

ただし，四角形$\;\rm ABCD\;$は，${\rm BC+CD}\;$が$\;2\,a\;$で一定，
$\rm\angle\,A=\angle\,C=90^\circ\,$という制約条件を満たしながら
色々な形をとりうることにご注意ください。

この図は，ＡＩたちには見せていません。
この記事の読者の方向けの参考図です。

質問の意図

この問題を見たら，多くの人が，
「四角形$\;\raise{-0.25pt}{\rm ABCD}\;$が正方形になる場合はどうか」と
考えるでしょう。

１辺の長さが$\;a\;$の正方形は，
確かに問５の前提条件を満たす四角形です。

面積はもちろん$\;a^2\;$ですが，
それが最大値なのかどうかがまず焦点になります。

もう少し深堀りすると，問５を解くなら，
次のようなことを常に念頭に置くことになるでしょう。

四角形$\;\rm ABCD\;$が正方形になるときの
面積$\;a^2\;$は最大値か。
$\;a^2\;$が最大値でないとしたら，
面積を最大にする四角形$\;\rm ABCD\;$はどんな形か。
また，その面積は？
$\;a^2\;$が最大値であるとしたら，
その最大値を実現する四角形$\;\rm ABCD\;$の形は
正方形だけか。

ＡＩたちがこれらの判断を適切に行い，
しっかり説明できるかが見どころです。

詳しくはサブ記事で

問５に関する説明やＡＩからの回答，
および採点結果については，
下記のサブ記事をご覧ください。⚠️⚠️

【2025年05月】チャットＡＩの数学推論能力をテストしてみた【サブ記事：問５】

ＡＩの数学推論能力検証記事のサブ記事です。今回ＡＩに問いかけた５つの質問のうち５問目について，補足説明と採点結果をまとめています。

数学教育アイデア素材

https://me-idea-parts.uvs.jp/edu_principle/prin-q-and-a-with-ai-202505-sub05

問５採点結果

各ＡＩの得点

問５における各ＡＩの得点は
次のようになりました。（※１０点満点）

参加ＡＩ名	問５の得点
Gemini-T	９.５点
ChatGPT-T	７点
Grok-N	４点
MathGPT-T	２.５点
Copilot-T	１点
Perplexity-N	１点
Grok-T	１点
DeepSeek-T	１点
Gemini-N	０.５点
DeepSeek-N	０.５点
MathGPT-N	０.５点
ChatGPT-N	０点
Copilot-N	０点
Perplexity-T	０点
Claude-N	０点

「サービス名-N」は熟考機能オフ，
「サービス名-T」は熟考機能オンです。

より正確な意味については，
当記事の２ページ目をご覧ください。

平均点

問５の平均点は次の通りです。

全参加ＡＩの平均点	1.90 点
高速モデル (-N) の平均点	0.81 点
熟考モデル (-T) の平均点	3.14 点

問５総評・所感

大半のＡＩは歯が立たず

高速モデル (-N) は１０点満点で
平均点が１点に満たないという壊滅状態。

熟考モデル (-T) も，大半があえなく不正解。
ＡＩにとっては相当苦手な問題だったようです。

全参加ＡＩ（１５モデル）のうち，
自力で正解を得た，あるいは正解に迫ったと言えるのは
Gemini-T ，ChatGPT-T ，Grok-N のわずか３モデルで，
残りの１２モデルは
「正方形のときだけ面積は最大になる」など，
誤った回答を示していました。

なぜこんなに苦手なのか？

この問５は，そこまで難しくないと思うのですよ。
中学生であっても，上位層なら挑戦してみてもよいのでは，
と思う程度の難易度です。

ただ，本問のように，
いかにも正しそうな誤答があると，
ＡＩはだまされやすいのかもしれないですね。

筆者はＡＩに詳しくありませんが，

ＡＩとは，これまで見聞きした話を総合して，
一番ありそうな結論を採用するもの

というイメージがあります。

だから，直感と異なる正解がある
問５のような問題には弱いのかなと思ったり。

気を吐いたＡＩたち

大多数のＡＩが誤った推論で誤った結論を導く中，
健闘したＡＩもいました。

以下では，見るべきものがある回答を
提示してくれたＡＩについて軽く触れます。

Gemini-T　

${}$Gemini-T は，全参加ＡＩのうちただ１つ，
実質的には１回目の回答で
筆者が想定する正解を言い当てました。ℹ️️　

まさに一人勝ちです。

他のＡＩからの回答を見て，
どうもこの問５は難しすぎたかなと
思っていた矢先だったこともあり，
一発で解かれて仰天してしまいました。

これくらいの難易度の問題を文句なく解いたのが
１モデルだけというのは，
良い結果とは言いがたいと思うのですが，
一人勝ちは見事と言うべきでしょう。

ChatGPT-T　

${}$ ChatGPT-T は，２回目の回答で正解を言い当てました。

１回目の回答は，結論を正確に明示しなかった点が
物足りなかったですが，
理論的に誤っていたわけではなく，
理解度は十分だったと思います。

Grok-N　

そしてもう１つ， Grok-N の健闘も光りました。

１回目の回答はあやしげなものでしたが，
２回目以降で立て直し，
なかなかの推論を展開してくれました。

高速モデル (-N) でありながら
正解に迫った点も特筆に値すると思いますが，
筆者が想像していなかった解法で
筆者の理解を大きく進めてくれた点に
個人的に感銘を受けました。

これまで見てきたように，
チャットＡＩたちの数学推論能力は，
正確性においてはまだまだ全然なのですが，
新しいアイデアを得るという意味では
相談する価値があるかもしれません。

MathGPT-T　

${}$MathGPT-T は，自力では正解にたどり着けませんでしたが，
筆者が間接的なヒントを与えると，
推論を修正して正しい結論を導きました。

ＡＩも，数学に関して
これほどの会話ができるようになったかと，
感慨を抱かせるものでした。

次ページの内容

以上で，具体的な質問を用いた
各ＡＩの数学推論能力の検証は終了です。

次ページでは，各ＡＩの総合成績の発表と
検証の総括を行います。