o1と受験問題

ブログ

OpenAIが新たに公開した言語モデル「o1(オーワン)」が注目を集めています。
この「o1」は「推論トークン」という新しい仕組みを採用しており、従来のGPTシリーズとは一線を画す性能を持っています。特にコーディングや数学分野において、その精度は大きく向上し、複雑な問題にも高い解決能力を発揮します。

たとえば、国際数学オリンピックの予選問題(AIME 2024)では、GPT-4oの正答率が9.3%だったのに対し、「o1」は**74.4%**という高い正答率を達成しました。また、あるベンチマークテストでは「博士課程の学生を上回る成績を記録した」とも報告されています。

「o1」が優れていることは、日常的な論理問題にも表れています。
たとえば、「高さ10cmのわたあめの上に高さ10cmのブロックを置くと、全体の高さは何cm?」という問いに答えることができます。

ただし今回「重い」という言葉がないと、以下のような回答になりましたので油断は禁物です。

さらに、現時点ではウェブ検索ができないため、最新の情報には対応できないという弱点もあります。たとえば、最新ニュースやトレンドについてリアルタイムで知ることは苦手です。それでも、「o1」の性能向上は目覚ましいものがあります。近い将来、GPT-4oに代わり、「o1」がスタンダードモデルとして定着するのでしょう。

この問題には、o1は正解することができませんでした
岡山のホームページ作成