ChatGPT o3, o4-miniで推論画像生成をさせてみたら、精度が圧倒的でした

o3はo1よりも高度な推論能力をもち、コーディングや数学、科学、視覚認識のタスクを得意としています。

o4-miniはo3に比べて推論能力は劣りますが、より迅速な応答をするよう設計されています。

そしてo4-mini-highはo4に比べてコーディングと視覚認識を得意としているようです。

以下のフリー素材を使って、単なる画像生成だけでなく推論能力も必要になってくるタスクを試してみたいとおもいます。具体的には、「この道を上からドローンで撮影した場合の画像を生成してください」とプロンプトを叩きます。

とても良い出力だと思います。

o3に比べて

と感じました。

評価はほぼo4-miniと変わりませんが、ドアが完全に締まりきってしまいました。

何度か試しましたが、思ったような画像は生成されませんでした。

正直このテストだけで必ずしも性能を図れるとは思っていませんが、ぱっと見た感じChatGPTの画像生成精度は圧倒的だと感じました。といっても推論して画像生成できるモデルがそもそも少ないですが。

また、やはりo3のほうがo4-mini系よりも推論能力に優れているのか、手前のドアの開き方なども反映されていて、より精度が高いと感じました。