OpenAIが、新世代の推論モデルシリーズ「o1シリーズ」を発表。
これは、従来のAIモデルでは対応しきれなかった複雑な問題解決を可能にする高度な推論能力を持つモデル群。
「o1」シリーズには、「o1-preview」と「o1-mini」という2つのモデルが含まれ、これらのモデルは科学、コーディング、数学などの専門分野で優れたパフォーマンスを発揮。
「o1-preview」は、人間が問題を解決する際のプロセスを模倣するようにトレーニングされ、科学、数学、コーディングといった分野での高度な問題解決を可能にします。
例えば、国際数学オリンピック(IMO)の予選試験では、「o1-preview」は83%のスコアを獲得し、GPT-4oの13%を大きく上回りました。
競技プログラミング問題(Codeforces)では、89パーセンタイルというスコアを記録..。
このモデルは、医療研究者が細胞配列データに注釈を付けたり、物理学者が複雑な数式を生成したりするなど、専門的なタスクに特化したワークフローの構築と実行に利用できるとか..。
博士号を持つ専門家のように高度な推論を行うことができ、これまでのAIでは対応が難しかった複雑なタスクに革新的な解決策を提供できます。
ただ、現在の「o1-preview」は、ウェブブラウジングやファイルのアップロードといった一般的な機能を備えていない。これはかなり不便。
一般的な用途ではGPT-4oの方が適している場合もありますが、複雑な推論タスクにおいては「o1-preview」が優れた性能を発揮する。
「o1-mini」は、「o1-preview」の能力をコンパクトにしたモデルで、コスト効率とスピードに優れています。推論が必要であるものの、広範な世界知識を必要としないアプリケーション向けに最適化されており、「o1-preview」よりも約80%低コストで利用できます。これにより、開発者や企業は、コーディングタスクなど特定の用途において高性能のAIをコスト効率よく利用することが可能になります。

「o1-preview」と「o1-mini」は、ChatGPT PlusとTeamユーザーがすでに利用可能。
OpenAIは今後、「o1-mini」へのアクセスをChatGPTの無料ユーザーにも提供する予定で、さらなるモデルの機能強化や、ウェブブラウジングやファイルアップロード機能の追加も検討されているようで楽しみです。



